Kwartalnik Statystyczny, 1931, T. 8, z. 3

(1)

k w a r t a l n i k s t a t y s t y c z n y

ROK 19 31, TOM VIII, ZE SZ Y T 3

R E V U E T R 1 M E S T R I E L L E D E S T f l T I S T I Q U E

ANNEE 1931, TOME VIII, FASCICULE 3

K O M IT E T R E D A K C Y J N Y

G Ł Ó W N E G O U R Z Ę D U S T A T Y S T Y C Z N E G O

P r z ew o d n ic zą c y :

D yrekto r Gł U. S t . — EDW ARD SZTURM DE SZTRĘM C z ło n k o w ie :

STE FA N SZULC — R edaktor g łó w n y

IGNACY K R Ä U T L E R — Zastępca red a kto ra g łó w n e g o T A D E U S Z SZTURM DE SZTREM

S e k r e ta r z e :

JA D W IG A O R Ł O W S K A , MARJA G IEY SZTO R

C O M IT E D E R E D A C T IO N

D E L O F F IC E C E N T R A L D E S T A T I S T I Q U E

P r ä sid e n t:

D ir e c te n r d e I ' O ff. C e n tr .d e S t .— EDOUARD SZTURM DE S Z T R E M M em bres:

S T E P H A N E SZULC — R ed a rteu r en elief IGNACE K R Ä U T L E R — R ćdactenr su p p lea n t T H A D E E SZTURM D E SZTREM

S e c r ć t a ir e s :

H E D V IG E O R Ł O W S K A , MARIE G IE Y S Z T O R - KOMIJET REDAKCYJNY TELEFON 232-79

T R E Ś Ć

. s t r . -

S . F ogelson

0 wyrównaniu szereg ó w statystycznych ze s z c z e g ó l- nem uwzględnieniem rozkładu ludności według w i e k u ...6 9 3

I n ż . J u l j u s z M iller

Podstawy kalkulacji kosztów maszynowego opraco

wania dat s t a t y s t y c z n y c h ...7 4 1

D r. J a n P ie k a lk ie w ic z

Biura statystyczno-ekonom iczne w instytucjach rol

nego kredytu h ip o te c z n e g o ...7 7 1

M ie c z y sła w Z arem ba

Ubój zw ierząt gospodarskich w latach 1929 i 1930 . 801 M ichał D o sk o cz

Składy wolnocłowe na polskim obszarze celnym . . 823 S . S z y m k ie w ic z

0 sp isie ludności Warszawy w r. 1792 ... 833 H alin a D r z a ż d ż y ń s k a

Odpowiedź p. S. S z y m k ie w ic z o w i... 840

S O M M A I R E

A page

S. F o g e lĄ n

Sur l ’a ju stem en t d es s e r i e s s t a t is t iq u e s e t en par- tic u lier de la repartition de la popułation d'apres

l äge . . .

I

... 693 In g . Ju les M iller

Les b a se s da l’evaluation de f r a i s du depouillem ent mecanique de donnees s t a t i s t i q u e s ... 741

D r . Jean P iek a łk iew icz

Le s e r v ic e s* a tistiq u e d es banques de c r e d it hypo- th e c a ir e a g r i c o l e ...771

M ieczysla s Z arem ba

Abatage d e s animaux de fe r m e en 1929 e t 1930 , 801 M ichel D o sk o cz

Les e n tr e p ö ts f r a n c s sur le te r r ito ir e douanier p o l o n a i s ...823

S. S z y m k ie w ic z

Au su je t du r e c e n s e m e n t de la population de Var- sovie en 1792 ... 833

H . D r z a ż d ż y ń s k a

Replique ä M. S. S z y m k i e w i c z ... 840

(2)

r * : « # f ' *fc ł » . :> ’ $. f f

(3)

K W A R T A L N I K S T A T Y S T Y C Z N Y

ROK 1931, TOM VIII, Z E S Z Y T 3

R E V U E T R I M E S T R I E L L E D E S T A T I S T I Q U E

ANNEE 1931, TOME VIII, FASCICULE 3

S. F O G E L S O N

O wyrównaniu szeregów statystycznych ze szczególnem uwzględnieniem rozkładu ludności według

T R E Ś Ć J y

I. Ogólne zasady wyrównywania szeregów: i. Z ad an ia w y r ó w n a n ia 693. 2. Z a sa d y k ia sy fik a b g Q N ^ o d w y r ó w n an ia 694. 3. K ry terja g ła d k o śc i sz e r e g u 696. 4. O cen a sk u te cz n o śc i w y r ó w n a n ia 697. 5. O zn a cz en ia 697.

II. Metody analityczne: 6. M etoda n a jm n ie jsz y ch k w a d r a tó w 699. 7. M etoda m o m e n tó w 701. 8. Z a sto so w a n ie m eto d a n a lity cz n y c h do s z e r e g ó w d e m o g r a fic z n y c h 702. III. Metody mechaniczne: 9. W ła sn o śc i o g ó ln e 703.

10. Ś r e d n ia ru ch o m a i jej u o g ó ln ie n ia 704 1 1. Z n ie k s z ta łc e n ia s y s te m a ty c z n e 706. 12. M eto d y su m a cy jn e 707. 13- K o n stru k cja g e o m e tr y c z n a m e to d m ec h a n ic z n y c h 711. 1 4. M etod y m in im a ln e 716. 1 5. M etoda R h o d e s ’a 718. 1 6. U o g ó ln ie n ie m eto d m ec h a n icz n y c h 719. IV. Metody interpolacyjno-stycznościow e: 17. C ha

r a k t e r y s t y k a o g ó ln a 720. 18. M etoda K i n g a 723. 1 9. M etoda G l o v e r a 726. 2 0. W n io s k i 738.

Praca niniejsza powstała na gruncie pew

nego konkretnego zagadnienia. Prof. S t.

S z u l c w pracy Ludność Polski według imeku w latach ^{1 9 2}J, ^{1 9 2 8} i ^{1 9 2 .9} (Kwartalnik S ta  tystyczny ^{1 9 8 0}, zeszyt ⁴, str. ^{1 5 0 1}—^{1 5 0 6}) wskazał na wielką nieregularność szeregu wieku ludności Polski a zwłaszcza woje

wództw centralnych i wschodnich, na istnienie zaokrągleń na zerach i piątkach-, tak silnych, że wzór Woolhouse’a okazał się zupełnie niewystarczającym dla ich wygładzenia. Zja

wisko to jest zresztą dobrze znane w bardzo wielu krajach. Jednocześnie wspomniał prof. St. Szulc o zarządzonem w Głównym Urzędzie Statystycznym badaniu możliwości zastosowania innych, mocniejszych metod wyrównania. Artykuł niniejszy przedstawia właśnie wyniki tego badania, przyczem, z uwagi na zupełny niemal brak literatury w języku polskim w tej dziedzinie, wydawało się celowem połączenie przedstawienia tych wyników z zarysem ogólnej teorji wyrówna

nia szeregów statystycznych i próbą racjo

nalnej klasyfikacji najbardziej znanych m e

tod. Jako materjał liczbowy, ilustrujący po

równanie i zestawienie krytyczne rozmaitych metod, posłużyły zasadniczo dane spisu ^{1 9 2 1} r.

0 rozkładzie ludności według wieku w wo

jewództwach centralnych. Wszystkie tablice 1 wykresy, w których szereg poddany wy

równaniu nie jest wyraźnie wymieniony, dotyczą tego właśnie szeregu. Część I pracy zawiera omówienie ogólne zadań wyrówna

nia oraz podstawy klasyfikacji rozmaitych metod, część II omawia metody analityczne, część III—metody t. z w. mechaniczne proste, część IV — metody oparte na interpolacji stycznościowej i wnioski. Na końcu pracy podano wykaz literatury.

I . O g ó l n e z a s a d y w y r ó w n y w a n i a s z e r e g ó w s t a t y s t y c z n y c h

1. Zadania wyrównania. W najogólniejszem ujęciu wyrównaniem szeregu statystycznego nazywa się zastąpienie go przez szereg inny, o przebiegu bardziej regularnym, ewentualnie bardziej, według naszego mniemania, odpo

wiadającym istotnym cechom rozpatrywanego zjawiska. Konkretyzacja tego określenia może iść w rozmaitych kierunkach i, jak zobaczy

my, wiąże się w sposób naturalny z klasy

fikacją metod wyrównania. Z punktu widze

nia statystyki matematycznej, gdy mamy dany szereg, otrzymany z materjału statystycznego przez klasyfikację według pewnej cechy wymierzałnej x,

( I) / # 2* • • • • • / ^5, • • • • • K/V

(gdzie us oznacza liczbę osobników, dla któ

rych x ma wartość s)1, podstawowe zagad

nienie składa się z dwóch części. Przede-

I Dla dalszych rozważań je st rzeczą obojętną, czy x oznacza cech ę n ieciągłą, i rów ność x ~ s zachodzi dokładnie dla w szystkich o sob n ik ów klasy us czy też x je st cechą ciągłą, zaś u s oznacza liczbę osobników , dla których x je st zawarte w pew nym przedziale kla

sow ym , którego s jest środkiem albo początkiem . W razie potrzeby w tym ostatnim wypadku zakładać będziem y raczej S X <C S + I , obierając raz na zaw sze długość przedziału klasow ego za jed n o stk ę. Z ałożen ie rów ności przedziałów klasow ych je st isto tn e dla zacho

w ania formy w szystkich późniejszych w zorów .

Kwartalnik S tatystyczn y, 1931. 45

(4)

wszystkiem należy zbadać, czy i w jakim stopniu szereg ten można uważać za wyloso

wany, t. zn. za wynik M = u¹ + u² + .. . + un prób, dokonanych nad cechą % według pew

nego prawa prawdopodobieństwa p (x), ciąg

łego lub nieciągłego; następnie — trzeba wy

znaczyć owo prawo pi a wdopodobieństwap (x).

Pozornie odmiennie formułuje się zagadnienie dla szeregów t. zw. rozwojowych, gdzie us oznacza natężenie pewnego zjawiska w za

leżności od pewnej zmiennej niezależnej %, np. od czasu, wyrażone w liczbach bezwzględ

nych lub względnych. Mówi się wówczas o wy

kryciu „tendencji rozwojowej“ (trendu), uwol

nionej od wahań przypadkowych. Odpowiada to w istocie rzeczy sformułowaniu poprzed

niemu, z tą tylko różnicą, że liczba „prób“

wynosi N a nie M. Dotyczy to naprzykład badań konjunkturalnych, wyznaczania śmier

telności i jej wahań, stosunku liczebnego płci i t. d. Poszukiwanie funkcji p (x) stano

wić tu będzie jedną z odmian wyrównania szeregu (i).

Wyznaczenie funkcji p(x) i zastąpienie szeregu (u s ) przez szereg, utworzony z od

powiednich wartości tej funkcji, jednocześnie daje nowy szereg o przebiegu bardziej re

gularnym, niż szereg (i).

Nie porzucając gruntu statystyki matema

tycznej, t. zn. traktując wciąż szereg (i) jako

3/ereg losowy, można ten wynik wtórny uważać za cel zasadniczy. Jeżeli mianowicie przypuścimy, że zaobserwowane wyrazy us stanowią sumy wartości teoretycznych, od

powiadających pewnemu prawu prawdopodo

bieństwa o regularnym przebiegu i błędów przypadkowych, wywołujących nieregular- ności i załamania, wówczas, nie przesądzając sprawy ewentualnego poszukiwania owego prawa prawdopodobieństwa, można przy

puścić, że każde wygładzenie tych nieregu- larności, niekoniecznie oparte na określonej funkcji p(x), da nam szereg bardziej zbliżony do teoretycznego. W ten sposób wyrównanie szeregu traktuje się jako eliminację błędów przypadkowych.

Niekiedy odrzuca się powyższe względy teoretyczne, podporządkowując cele wyrów

nania wymogom praktycznym. W rachunkach ubezpieczeniowych naprzykład idzie przedewszystkiem o uzyskanie tablic zupełnie gład

kich, bez względu na to, czy w ten sposób otrzymujemy zbliżenie do jakiegoś prawa teoretycznego czy też nie.

Przy powyższem precyzowaniu zadań wy

równania zakładaliśmy implicite, że szereg (i) ściśle odpowiada zaobserwowanej rzeczy

wistości, czyli nie zawiera odchyleń syste

matycznych. Znacznie trudniejszą jest sprawa, gdy trzeba myśleć o zneutralizowaniu tych właśnie odchyleń, jak to ma miejsce w naj

bardziej nas interesującym przypadku kon

kretnym rozkładu ludności według wieku.

Tutaj zadaniem wyrównania jest dać szereg jednocześnie bardziej regularny i bardziej

zbliżony do rzeczywistości od szeregu (i).

Kwestja wyznaczenia rozkładu prawdopo

dobieństwa, odpowiadającego danemu szere

gowi (i), jest ściśle związana z matematyczną teorją prawdopodobieństw aposteriori i t. zw.

teorją wiarogodności hipotez b

Charakter niniejszego artykułu nie po

zwala na omówienie tutaj tego związku, jak również na wyłożenie interesującej teorji wy

bitnego austrjackiego matematyka ubezpie

czeniowego, E. B 1 a s c h k e’g o, który w dziele p. t. Die Methoden der Ausgleichung von Massenerscheinungen dał wyczerpujący wykład metod wyrównania, oparty na po

szukiwaniu najbardziej racjonalnego kompro

misu pomiędzy dążeniem do wygładzenia szeregu a dążeniem do uzyskania wyników najbardziej prawdopodobnych.

2. Zasady klasyfikacji metod wyrównania. Rozróż

nia się trzy zasadnicze grupy metod wyrów

nania. Jeżeli przyjmiemy pierwsze z opisa

nych wyżej sformułowań celu wyrównania, oparte na rachunku prawdopodobieństwa, wówczas będzie rzeczą naturalną poszukiwać pewnej funkcji f(x ), która dla x= s przybie

rałaby wartości takie, iż różnice f( s ) —ue miałyby charakter błędów przypadkowych.

Jeżeli poszukujemy f( x ) jako funkcji ciągłej, zadanie to wymaga dalszego sprecyzowania, ponieważ skończona liczba wartości nie wy

znacza funkcji bez bliższych założeń. Zwykle też zakłada się a priori formę analityczną funkcji, pozostawiając pewną liczbę para

metrów dowolnych; wybór odpowiednich wartości tych parametrów stanowi właściwy rachunek wyrównania. Otrzymujemy w ten sposób grupę metod t. zw. analitycznych.

Niektórzy autorowie (zwłaszcza angielscy) przeciwstawiają je wszystkim pozostałym nazywając je theory o f curve f i t t i n g , w prze

ciwieństwie do terminów graduation, adju- stement, smoothing obejmującym te ostatnie.

Podobnie B laschke² odróżnia metody, dą-

1 Por. np. J . S p ł a w a - N e y m a n , P r z y c z y n e k do te o r ji w iarogodności h ip o te z s ta ty s ty c z n y c h . K w a r ta ln ik S ta ty s ty c z n y 1929, zesz. 4. s tr . 1441—1469.

2 A u s g le ic h u n g von M assenerscheinungen, s t r . 2. Ob. w ykaz lit e r a tu r y na k c ó c u .

(5)

żące do eliminacji błędów przypadkowych (AusgleichsmetZioden)y a w tej liczbie również i analityczne, od metod, mających na celu wyłącz

nie formalne wyrównanie szeregu (Ebnungs- methoden). Oczywiście metody analityczne mają największe zastosowanie tam, gdzie istnieją podstawy do przypuszczenia pewnej prawidłowości badanego zjawiska. Tern też tłumaczy się ich wyłączne niemal stosowanie w naukach ścisłych w postaci t. z w. rachun

ku wyrównania obserwacyj. Cechą charakte

rystyczną metod analitycznych jest, że za

kładając istnienie pewnej zależności anali

tycznej wyrazów szeregu od cechy, grającej rolę zmiennej niezależnej, uzależniają one każdy wyraz szeregu wyrównanego od wszyst

kich wyrazów szeregu surowego. W niniej

szej pracy ograniczymy się do bardzo krót

kiego omówienia tych metod, z powodów, które zostaną wyłuszczone na końcu części II.

D rugą grupę metod wyrównania stanowią metody, ograniczające się do formalnego wygładzenia nieregularności szeregu surowe

go, odpowiadające więc drugiemu ujęciu zagadnienia. Metody te noszą nazwę mecha

nicznych i najszersze zastosowanie znalazły w statystyce demograficznej, zwłaszcza przy badaniu wymieralności. Ograniczają one wpływ wzajemny wyrazów szeregu w yrów nanego do kilku wyrazów sąsiednich i p r z e ważnie wyznaczają każdy wyraz z osobna, ale przy pomocy regularnie się powtarzają

cych działań i wzorów o stałych spółczyn- nikach.

Do trzeciej wreszcie grupy zaliczyć na

leży bardziej nowoczesne metody, zajmujące do pewnego stopnia miejsce pośrednie po

między analitycznemi i mechanicznemu Są Tó metody oparte na interpolacji1, narzuca

jące na szereg pewną formę analityczną tylko w obrębie grupy z kilku wyrazów, przyczem forma ta nie jest wynikiem żadnych założeń co do istoty szeregu, lecz zastosowaniem

praw matematycznych o aproksymacji do

wolnych funkcyj przez wyrażenia prostsze, w szczególności przez wielomiany.

Powyższe trzy grupy rachunkowych me

tod wyrównania można nazwać klasycznemu Wyczerpują one zasadniczo zapas środków rachunkowych, stosowanych dotychczas w praktyce dla wyrównania szeregów. W cza

sach nowszych obmyślono kilka nowych zupełnie metod, opartych na odmiennych zasadach. Do takich metod zaliczyć należy np. metodę W h i t t a k e r a 2, opartą na roz

ważaniach zbliżonych do teorji Blaschke’go.

W hittaker zakłada, że szereg surowy jest szeregiem losowym, że prawdopodobieństwo zaobserwowania szeregu, którego wyrazy za

warte są odpowiednio pomiędzy us i us + a, jest równe

h

j

h 2 . . . Ji N _ p N

(ł/O*

gdzie

F = h l2 (m1-m1)2 + /z2(«2-«2)2 + . . + htf(uN-uiv)2}

jeżeli przez us oznaczymy teoretyczne war

tości wyrazów szeregu, zaś przez hs — do

kładność każdej obserwacji (jest to prawo błędów Gauss’a); jednocześnie zakłada on, że prawdopodobieństwo szeregu maleje wraz z jego gładkością, mierzoną sumą kwadratów drugich różnic, według tego samego prawa.

Oznaczając tę ostatnią sumę przez S docho

dzi on do wniosku, że najbardziej prawdo

podobnym będzie szereg, dla którego w y rażenie

F + ^ S

ma wartość najmniejszą. E jest tu parametrem dowolnym, zaś h—wspólną wartością miar dokładności hs (wymaga to osobnego założe

nia /zŁ — h² = . . = /zw). Rachunek jest dość skomplikowany, polega zasadniczo na po

prowadzeniu paraboli II stopnia metodą naj-

I Podstaw owe zagadnienie m atem atycznej teorji inte rp o la c ji, ściśle związanej z r a c h u n k ie m ró żn ic skończonych, można s fo r m u ło w ać w sposób n a stę p u jąc y : znam y w a r to ś c i pe w ne j funkcji / ( x ) dla n ie k tó r y c h wartości zm iennej niezależnej x , n p .d l a x = x , , x 2, . . . x n \ n ależy obliczyć p rzy o d pow ie dnic h założeniach f ( x ) dla dow olnej w a rtośc i x , z a w a rte j pomiędzy ja k ą ś p arą w a r to ś c i f oraz oszaco

wać b łą d , t. zn. znaleźć m aksym alną w a r to ś ć ró żn ic y pom iędzy obliczoną a p ra w d z iw ą w a r to ś c ią funkcji (ta d ru g a część zadania stanow i n ie z b ę d n e u z u p e łn ien ie pierw szej; pom inięcie o sz ac o w an ia b łędu, często się z darzające w p rak ty c e, poz ba w ia w yniki w szelkiej w artości, gdyż uniem ożliwia zdanie sobie s p r a w y z ich do k ład n o śc i). N a js z e rz e j sto s o w an a j e s t inte rp o la c ja przy p om ocy w ie lo m ia n ó w posta c i

(I^q —{— Cli % —{—#2 -j— • • —1~ Clk .

Jeżeli w a rto ś c i Xj tw o rz ą p o s tę p a r y tm e ty c z n y o różnicy h , — h , w ów czas p ro w a d z i ona do klasycznego wzoru New ton a

(2) f ( x ) = f ( x O + * - = ? A + K f ( X i ) + ■ ■ ;

Szczegółowo i bardzo p r z y s tę p n ie op rac o w an ą t e o r j ę interpolacji znaleść m ożna u S t e f f e n s e n ' a ( Interpolation) o raz W h i t  t a k e r a (C a lc u lu s o f O bservalions, ro zd z ia ły 1—IV). B e z p o ś re d n ie z a sto s o w a n ie w s ta ty s ty c e z n a jd u je in te r p o la c ja w w ypad k a c h , gdy zachodzi p o trz e b a o szacow ania w y r a z ó w szeregu sta ty sty c z n eg o , odpow iadających p o ś re d n im , n iesta b u la ry z o w a n y m w a rto śc io m cechy (np. jeżeli mając grupy 5-letnie wieku chcem y prze jść do grup rocznych, albo mając n o to w a n ia ja k ie g o ś zja w iska co p ew ien o d s tę p czasu, c hc em y obliczyć je dla m om entów p o ś re d n ic h pom iędzy n o to w a n ia m i). Szczegółow y opis o d pow ie dnic h m eto d rachunkow ych znaleźć m ożna w ro z p r a w ie K. P e a r s o n * a Ott the C onstruetion v f Tablcs a n d on In te rp o la tio n .

p The C alculus o f O bservalions, s ir . 303—315. Ob. w ykaz lit e r a tu r y na końcu.

(6)

mniejszych kwadratów (ob. niżej) i obliczaniu odpowiednich „poprawek“ przy pomocy różnic pomiędzy wyrazami surowenń a wyrównane

mu Poprawki te zależą linjowo od dowolnego parametru e, powodując w ten sposób dużą elastyczność metody. Małe wartości e dają w wyniku szereg bardziej gładki, większe—

szereg bardziej zbliżony do surowego.

Zupełnie odmienną od metod klasycz

nych, bo opartą na teorji korelacji, metodę wyrównania opracował j. F u h r i c h (Unter

suchung Statistischer Reihen m it H ilfe der K or

relat io ns theorie, Versicherungs wissenschaft

liche Mitteilungen des Deutschen Vereins für Versicherungswesen in der Tchechoslovaki- schen Republik, 1 9 2 7, 5. Heft, str. 5 1 — 8 0).

Przy pomocy szeregu spółczynników kore

lacji odgranicza on niejako zakres wpływu każdego wyrazu na wyrazy sąsiednie, obli

cza wartości, jakie powinien by mieć każdy wyraz na zasadzie odpowiednich prostych regresji i za wyraz wyrównany uważa śre

dnią z kilku podobnych wyznaczeń.

Obie metody powyższe, wymagające bar

dzo uciążliwych rachunków, nie zostały uwzględnione w niniejszej pracy.

Odmienną znów metodę wyrównania sta

nowi wyrównanie graficzne, polegające na odręcznem wygładzaniu wykresu, przedsta

wiającego dany szereg. Przy dostatecznej wprawie rysownika i zachowaniu pewnych ostrożności (parokrotne wykonanie przez różnych rysowników niezależnie od siebie, zachowanie sumy szeregu przy pomocy po

miarów planimetrycznych) daje ono często zupełnie dobre wyniki. W pracy niniejszej, poświęconej wyłącznie metodom rachunko

wym, nie będziemy szczegółowiej omawiać tej metody.

3. Kryterja gładkości szeregu. Przeważna część niniejszej pracy poświęcona jest metodom mechanicznym i interpolacyjnym, czyli me

todom, skierowanym w pierwszym rzędzie ku usunięciu nierówności i nieregularności szeregu, ku otrzymaniu szeregu „gładkiego“.

Należy więc przedewszystkiem postarać się sprecyzować intuicyjne pojęcie „gładkości“

lub regularności szeregu zarówno dla oceny potrzeby wyrównania jak i wyników jego.

O ile intuicyjna ocena danego szeregu jako

„gładkiego“ lub „niegładkiego“ jest rzeczą względnie łatwą, zwłaszcza przy przedsta

wieniu graficznem, o tyle znalezienie objek- tywnego i racjonalnego kryterjurn gładkości jest trudne. Analogiczne pojęcia, zapożyczone z teorji krzywych płaskich ‘ (ciągłość krzy

wizny, czyli zmian kierunku stycznej, brak

punktów kątowych, ciągłość zmian krzywizny, ograniczoność krzywizny), łatwo wyrażalne w terminach rachunku - różniczkowego, nie nadają się tu ze względu na nieciągłość, tkwiącą w samej naturze szeregu statystycz

nego i niemożliwość nieograniczonego zbli

żania do siebie punktów reprezentujących na wykresie jego wyrazy. Naturalnem wydaje się tu zastąpienie pochodnych przez różnice skończone (por. § 5 wzory (7) ) i szukanie kry te rj ów gładkości przy pomocy badania szeregów różnic kolejnych. Tak, np. W h i t - t a k e r przyjmuje za miarę „niegładkości“

(roughness) szeregu sumę kwadratów różnic III rzędu. Oczywiście lepiej jest badać sumę wartości bezwzględnych, gdyż suma kwadra

tów nadaje zbyt wielką wagę pojedyńczym dużym wartościom; wprowadzenie tej ostat

niej spowodowane jest, jak zwykle, większą łatwością operowania nią. Nasuwa się tu jednakże zarzut bardzo istotny: wielkości różnic nie stanowią jeszcze o gładkości sze

regu. Najlepiej wyjaśni to przykład szeregu a, a2, a³... «” , . . . .

dla którego szereg k-tych różnic jest (a—1)*, a (a—1)*, a² (a—1)*, . . . .;

jeżeli więc a >» 2, to szereg pierwszych róż

nic ma wyrazy większe od wyrazów szeregu danego, szereg drugich różnic—jeszcze więk

sze i t. d. Tymczasem szereg rozpatrywany jest oczywiście zupełnie gładki. Również i zachowanie stałego znaku przez kolejne różnice nie stanowi niezbędnego warunku gładkości, jak to widać na przykładzie sze

regu wartości funkcji s in x lub cosx. Wydaje się, iż dopiero łączne uwzględnienie wiel

kości różnic, ich znaków oraz regularności w rozkładzie tych ostatnich, może tu dopro

wadzić do celu. Będziemy w dalszym ciągu dla określania gładkości szeregów stosowali schemat następujący: szereg będziemy uwa

żali za gładki, jeżeli wyrazy kolejnych sze

regów pierwszych, drugich, trzecich i t. d.

różnic są coraz mniejsze, zaś znaki tych wy

razów mają rozkład regularny, t. zn. me ule

gają zmianom częstym i bezładnym. Jest to warunek dostateczny ale, jak wspomnieliśmy wyżej, bynajmniej nie konieczny gładkości szeregu. W praktyce kryte rj um to wystarcza w zupełności. W większości szeregów róż

nice dość wysokiego rzędu tworzą już szereg o znakach bezładnie rozmieszczonych; różni

ce następnego rzędu są wówczas już znacznie większe. Im dalej musimy się posunąć przy obliczaniu różnic, aby dojść do takiego bez

(7)

ładnego szeregu, tein gładszy jest szereg pierwotnie dany. Dopiero dla porównania gładkości dwóch szeregów, w których róż

nice tego samego rzędu tworzą jeszcze sze

reg o regularnych zmianach znaków, będzie

my porównywać sumy wartości bezwzględ

nych tych różnic. Oczywiście dla dwóch szeregów, znacznie się różniących co do liczby i wielkości wyrazów, trzeba wziąć przeciętną wartość różnicy w stosunku do sumy wyrazów lub średniej wartości jednego wyrazu.

4. Ocena skuteczności wyrównania. Ażeby wy

równanie było skutecznem, szereg wyrównany musi spełniać dwa warunki zasadnicze: musi on być dostatecznie gładki, oraz dostatecznie mało różnić się od szeregu surowego. Te dwa warunki są oczywiście sprzeczne ze sobą, i cała trudność wyboru odpowiedniej metody wyrównania polega na każdorazowem odna

lezieniu najbardziej racjonalnego kompromisu.

Gładkość szeregu wyrównanego oceniamy według wyżej omówionych zasad; naturalną miarą zgodności z szeregiem surowym jest suma wartości bezwzględnych różnic pomię

dzy wyrazami obu szeregów, względnie suma kwadratów tych różnic, bardziej nadająca się do rachunku, lecz bardziej wrażliwa na od

chylenia indywidualne. Obie sumy oczywiście trzeba porównywać z ogólną sumą wyrazów szeregu. Nie bez znaczenia jest też zwykła suma odchyleń, dająca zmianę ogólnej sumy szeregu, wywołaną przez wyrównanie.

Jeżeli wyrównanie wychodzi z założenia, że szereg jest losowy, wówczas ważniejszą jeszcze rolę odgrywa rozkład różnic według ich wielkości i znaków. Ponieważ różnice te mają w tym przypadku reprezentować błędy (odchylenia) przypadkowe, przeto najistot- niejszem staje się pytanie, czy stosują się one do prawa błędów. Teorję tę, która ma szcze

gólne zastosowanie do wyrównania anali

tycznego, rozwinął K. Pearson i jego szkoła1.

Gdy szereg dany zawiera znaczne błędy systematyczne, powyższe kryterjurn staje się bezwartościowem. Ale i kryterjum zgodności z szeregiem surowym traci wiele na swej wartości i skuteczność wyrównania ocenić można tylko indywidualnie w każdym kon

kretnym przypadku, wprowadzając do rozwa

żania naturę badanego zjawiska i korzystając z analogji z innemi szeregami o zbliżonej strukturze.

5. Oznaczenia. Zanim przejdziemy do wła

ściwego przeglądu metod wyrównania, usta

1 Obacz W P a l i a

limy szereg oznaczeń, symboli i skrótów, których używać będziemy w dalszym ciągu.

Pozwoli to uniknąć częstych powtórzeń i ułatwi usystematyzowanie wyników.

W yrazy szeregu danego, podlegającego wyrównaniu, oznaczać będziemy stale przez us, przyczem s przybierać będzie wartości

i, 2, __ , N . N oznacza więc liczbę wyra

zów szeregu pierwotnego. Odpowiednie wy

razy szeregu wyrównanego oznaczać będzie

my przez vs ; jeżeli wyrównanie odbywa się w kilku stadjach (por. np. § § i³ i ^{1 9}), wówczas vs oznaczać będzie zawsze wyrazy szeregu ostatecznie wyrównanego, wyrazy kolejno otrzymywanych szeregów pośrednich ozna

czać będziemy odpowiednio przez vs , vs , v "

i t. d. (wskaźnik u góry oznacza więc kolej

ność szeregu).

Przedstawiając dany szereg graficznie w prostokątnym układzie spółrzędnych za po

mocą punktów o spółrzędnych x = s, y —us względnie vs, będziemy punkty te nazywali krótko punktami Us lub Vs . x będzie więc zawsze oznaczać wartości cechy, według któ

rej szereg jest uporządkowany-, traktowanej jako cecha ciągła, s —wartości całkowite i do

datnie tej cechy?.

Będziemy mieli w dalszym ciągu bardzo często do czynienia z grupami wyrazów na

szego szeregu, najczęściej złożonemi z nie

parzystej liczby wyrazów.

Dla grupy takiej

Us—n •) Us—«-(-i , . . . , Us—1 , Us , , . . .

którą oznaczać będziemy? przez „Gs {n wska

zuje na to, że grupa składa się z ^{2 7 7 + 1} wyra

zów, 5—że środkowym wyrazem jest us ), wprowadzimy następujące symbole:

(3) - i

u M o . Us-j-i — Us —„ *+ Us —w-J-i 1 • • * ! 77v_! „ t— —n

z ) * '= + »

„ M r;> = JE i us+i

i—+ n

„ M i‘> = . S i* us+i.

1=—n

Są to kolejne momenty rozpatrywanej grupy wyrazów względem x = s. Jeżeli nie będzie obawy co do nieporozumień, będziemy opuszczać lewy wskaźnik u dołu, wskazujący' liczbę wyrazów grupy oraz prawy górny, oznaczający kolejny numer grupy.

Często będziemy wprowadzać dla grupy?

Gs pewne funkcje i odpowiadające im krzy

fI

E l d c r t o n, Frequettry C urves a nd C orrclaiiont ro zd z ia ł X I .

(8)

we; dla otrzymania równań tych krzywych przenosić będziemy początek układu spół- rzędnych do punktu ;c = s, y — o i nową od

ciętą oznaczać będziemy przez

Z s = X — s ,

opuszczając wskaźnik s, o ile to nie nastrę

czy powodu do nieporozumienia.

Kolejnym wyrazom grupy „Gs odpowia

dają wówczas wartości

Z = ^--- 77, ----1i~\~ I , . . . ) I , Oj d ~ I ^J . . . “I“ VI.

Często potrzebne nam będą również sumy potęg kolejnych liczb naturalnych

(4)

z ^(:>=

oraz

(5)

=

-S?'; : S{”; :

2W + i ;

S x — o X = — M

1 "

r=—wa:2

_ *=+» ^{, _ 2} jeżeli & jest parzyste

*=—« O „ £ jest nieparzyste Sumy — a więc i S*'y — dla małych wartości w i £ można obliczyć bezpośrednio;

dla dowolnych wartości można korzystać ze wzorów rachunku różnic skończonych¹ albo ze specjalnie obliczonych tablic2.

Będziemy również używali obok M („s) odmiennego nieco systemu znakowania dla zwykłych sum wyrazów, zawartych w gru

pie nGs , w wypadkach, gdy będziemy się posługiwali t. z w. sumami iterowanemi. Sumę M (o \ a więc

Ms—n -f- Ms—n+i -j- • • • d~ Mn d~ • • • ~f" Us+n

będziemy oznaczali symbolem + ; sumę nieparzystej liczby takich sum

3M+/ v²»+* ²,,+i v²«+/ , v»”+' , s .+ S x + • • + S + vs + 2s+, +

+ •• + 2_{S + W}^{2 M + I}

będziemy oznaczali symbolem Es +/’ ' ”,+/ ; podobnież sumę nieparzystej liczby, tip. 2^ + 1, tych sum podwójnych, taką, że + ' ’”+/

zajmuje miejsce środkowe, oznaczać będzie-

, i V J ” + Z' ,

my symbolem l s 1 t. d.

Tak więc,

yź * /» 7* S

oznacza wyrażenie otrzymane w sposób na

stępujący: tworzymy sumy zawierające po 3 kolejne wyrazy szeregu

ms—j d~ u$ T tis-j-/;

następnie kolejne sumy tych sum po 5, sumy sum podwójnych po 7, sumy tych ostatnich znów po 3; każda taka suma czterokrotna zawiera, jak łatwo sprawdzić, piętnaście ko lejnych wyrazów szeregu pierwotnego, grupę i j Gs ; wskaźnik dolny s odpowiada wyrazowi środkowemu tej grupy. Ogólnie biorąc, suma

V r 1 ) r 2 ) • • • ) Zj

s

gdzie rx, r2, . . . , rn są liczbami niepa- rzystemi, jest funkcją linjową kolejnych (r i + ^{r 2} + • • + r» + i — n) wyrazów szeregu, z których us jest środkowym, przyczem spół- czynniki wyrazów równoodległych są równe:

(6) »r t . • • • »>» — Us 4 - ü j ( M s+ / 4 - Ms_ z) 4 .

4 " • • • ~ł~ dk (lis—k ~ł~ Ms-\-k) >

1 . ⁷ t'i -f- T² T- • • d” V u — VI

gdzie k = — !———-—* ; warto zauwa

żyć, że ak są liczbami całkowi- temi i dodatniemi.

Podobne sumy oczywiście można tworzyć również i dla grup o parzystej liczbie wyra

zów. Ponieważ jednak wszystkie mechanicz

ne metody wyrównania operują wzorami sy- metrycznemi względem us , będziemy rozpa

trywać tylko takie sumy o parzystej liczbie wyrazów, które w ostatecznym wyniku speł

niają warunki, wyrażone wzorem (6); w tym celu należy przestrzegać, aby liczba sumo

wań parzystych była zawsze parzysta, np.

= (iis^{- 2} + «*_, + Us. + us+I) +

+

( l i s — 1

+

^{l i s .}

+

^{U s + I}

+

^{U s + 3) .}

Będziemy również niekiedy zwracali uwagę nie na środkowy, lecz na pierwszy wyraz

1 P o r . np. S t e f f e n s c n , 1. c., s tr . 87 > 124.

2 P e a r s o n , Tables f o r S fa lis tie ia n s a n d B io m e tric ia n s, tabi. X X V III, s tr . 40 i 41.

(9)

sumy, co będziemy odróżniali przy pomocy symbolu

Y (s)

-k l i s . -j~ U$-\-i • • ~j~ Ms-\-k—i.

Dla takich sum zachodzi oczywiście związek

A . = Ms+/fc

W wielu przypadkach będziemy spotykać t. z w. różnice skończone, określone przy pomocy wzorów

(7)

A Ug — Wj ,

A -- A A Mj — llgĄ-2 2Mj I Us—j^,

A

A kUs = A — A =

= J ) U s + k - I + ( J ) U g + k-2 --- + Ug ,

™ i 7 ; r / * \ k ( k — l ) ( k —2) . . . ( k — i + l ) ___ [k]i

gdzie t , ) — n _ 3. — .•/ • Czasami używać będziemy też symboli A\us dla oznaczenia różnic, dotyczących powięk

szonych przedziałów

vs

(«)

i t. d.

I I . M e t o d y a n a l i t y c z n e

Podstawowe założenie tych metod można sformułować jak następuje*, zakłada się, że szereg wyrównany jest szeregiem wartości pewnej funkcji, zależnej od n parametrów nieznanych

( 0 TJg f ( s , Cl o d / , • • • , —/ )

przyczem kształt funkcji f (s) jest a priori znany; zadanie polega na wyznaczeniu sta

łych a0y alt . . . , a„-t. Oczywiście n musi być mniejsze od iV, inaczej niema żadnego w y równania.

6. Metoda najmniejszych kwadratów. Jest to me

toda najbardziej klasyczna, której początki sięgają G a u s s a i L a p l a c e ’a i która ma szczególnie szerokie zastosowanie w naukach ścisłych zwłaszcza astronomji i geodezji, przy wyrównywaniu obserwacyj. Mniej lub więcej szczegółowy jej wykład znaleźć można w każdym podręczniku teorji prawdopodobień

stwa lub jednej z wyżej wspomnianych nauk.

Stosuje ona najbardziej naturalny sposób wyboru stałych a,, wyznacza je mianowicie tak, aby uzyskać możliwie najlepszą zgodność z szeregiem surowym. Jako kryterjurn tej

zgodności przyjmuje się sumę kwadratów odchyleń. Przemawiają tu za tern kryterjum nietylko względy rachunkowe (por. § 4), lecz również związek z t. zw. prawem błę

dów Gauss’a—Laplace’a. Można mianowicie udowodnić, że jeżeli szereg jest losowym i odchylenia rzeczywistej wartości każdego wyrazu od jego wartości teoretycznej (na

dziei matematycznej) podlegają prawu błę

dów, wówczas z pośród wszystkich możli

wych funkcyj postaci (1) z największem prawdopodobieństwem odtwarza teoretyczny przebieg szeregu właśnie funkcja, wyznaczo

na tą metodą. Ten właśnie wzgląd tłumaczy stosowanie metody najmniejszych kwadratów do wyrównywania obserwacyj, obarczonych błędami przypadkowemi, jak pomiary fizycz

ne i astronomiczne.

Stałe a0^, ax . . . , aM- T wyznacza się więc z warunku

(2)

N

S (us^—vs )2 = minimum.

S — l

Uwzględniając wzór (1) mamy jako wa

runki konieczne minimum równania N

s ~ i d f

d a n \ttg f^{( s ,}G0 , . . . , Uff^{—/ ) ]} o

N d j

(³) \ \us f (5, G⁰ , . . . , G,t—/) ] -- O

s = z 1

N d f

^ da f (^1G0 y . . . j Gm—j) ^j^— ^o

S _ r

Przy dość ogólnych założeniach, dotyczą

cych 'natury analitycznej funkcji f (s), rów

nania te dają się rozwiązać względem nie

wiadomych a0, aly . . . a,u Otrzymane wartości podstawiamy do wzoru (1), i pozostaje tylko obliczyć wartości tak otrzymanej funkcji dla

S I y • • • ) W*

Rachunek konkretny kształtuje się szcze

gólnie prosto, jeżeli f (s, <z0 , . . . , g„) jest funkcją linjową parametrów g,

n

Vs G{ fi (s) .

(4)

Równania (3) są wówczas również łinjowe względem ^<7, , mianowicie

a° s Ł f° (s) + az ^ / , ( s ) fj (s) +

( 5 ) N ' N

+ . . . + 0» J 7 /« (s)/y (s) — ^Ugfj (5)

( j —— 7» 2, . . . , it).

(10)

i dają się odrazu rozwiązać przy pomocy wzorów

D i

(6) ^Cli _D

gdzie D oznacza wyznacznik, utworzony ze spółczynników przy zaś Di — tenże wy

znacznik, w którym i —ta kolumna została zastąpiona przez wyrazy, znajdujące się po prawej stronie wzorów (5). W szczególności, jeżeli f (s) jest wielomianem stopnia n

f ⁽⁵⁾= aQ + at s + . . . + an s”

otrzymamy, zachowując oznaczenia § ⁵, N , ^ ’ , y(lf)

* •) y (N) (?a) D =

£->1 ,y Ł->2 ,y (N) y W

^•3 > • ♦ •) z S U 7 (N)

S-^n j Z ^ j Z < P • • > y(N)

^an

Mo, y m

1 ) ^ 2 y ⁰V)j • • • ł y (AV (7b) D⁰ = M , , y ^ y (N)

• • y z < $ M„, z (Z> Z (P • • » y<K) ( 7 (N)

i y M„, y m

'■^2 , • * • ¹ ⁷ (N) (7C) D , =

7 (N)

•^2 , M ,, y W _{'^ 3} > • * Z%>

y n t M„, Z^P^nĄ-a y • • • > ⁷ W i tak dalej. Zanotujemy tu, ze wz ględu

(8)

późniejsze zastosowania, ostateczną postać wzorów dla n = i (linja prosta),

/ W = &o + 5, Mamy, z uwagi na

7 ( N ) N ( N + \ ) 7 ( N ) N ( N + \ ) ( 2 N + \ )

— 2 » 2 6 ’

( 8 )

ar (2vV-f~l) Mq— 3 M x N { N - \ ) - (AM -l) M ,+ 2 Mi

Ar(iV2—1)

Jeżeli N j est liczbą nieparzystą, N —² N '+ ¹, wzory upraszczają się znacznie, jeżeli zastą

pimy s przez t = s — N ' ; t wówczas zmienia się od —N ' do + N ', we wzorach (7 ) trzeba zastąpić Z,• przez S,- , co znacznie je upraszcza,

gdyż Ą O.

(8a) a*

Mamy wówczas dla linji prostej

M '

2yv/⁰-f-l j e d n i a wartość wyrazu szeregu)

3 M /

M / _____________________________________

S 2.v' (2/V '-j-l) (2A ' - f 2) (4Av+ 3 ) .

(Mz, są to momenty względem t = o ). Po

dobnież dla paraboli drugiego stopnia f ( s ) — a⁰ + aA s + a² s²

otrzymujemy łatwe do rozwiązania równania (2vVz+ i ) a⁰ + S 2n> a² M '

(9) S 2a ' a⁰ + 5 4a ' a² = M'.

M x

Powyższe wzory znajdują szerokie zasto

sowanie przy wyznaczaniu trendów linjowych i parabolicznych, linij regresji i t. d,

Jeżeli f (s) nie jest funkcją linj ową para

metrów a,, wówczas rozwiązanie liczbowe równań (3) staje się o wiele trudniejsze.

Stosuje się wówczas skomplikowane i wy

magające długich rachunków metody przy

bliżeń kolejnych, albo specjalnie dostoso

wane metody. Takie specjalne metody opra

cowano np. dla wyznaczenia stałych we wzorze G o m p e r t z - M a k e h a m a .

f ( x ) — k s x g c x

używanego z powodzeniem przy wyrówny

waniu tablic wymieralności2.

Metoda najmniejszych kwadratów jest szczególnie odpowiednia w wypadkach, gdy znamy a priori kształt funkcji f (s) bądź to na mocy dedukcji teoretycznej, jak w obser

wacjach astronomicznych lub pomiarach ge- odetycznych, bądź też z poprzedniego do

świadczenia, jak dla wzoru G o m p e r t z - M a k e h a m a . Służy ona wtedy jednakże nie tyle do wyrównania szeregu, ile do ekspe

rymentalnego sprawdzenia teorji, na której dedukcja była opartą, lub do wyznaczenia stałych, mających jakieś znaczenie istotne.

Z teoretycznego punktu widzenia pozwala ona odtworzyć każdy szereg z dowolnie wielką dokładnością, za cenę powiększenia liczby parametrów a, ; jest jednak rzeczą jasną, że na tej drodze szybko utraci się wszelką możność zorjentowania się w naturze szeregu. W praktyce stosowalność metody do danego szeregu uzależniona jest od mo

żliwości znalezienia odpowiedniej funkcji f f s )

N

V s« lis

s— i

s Por. np. G. R o s m a ¹¹ i t h. M ath em a tisch e S ta tis tik ■ ilcr l'r r s o iie m c r siehe i tn ;g , sir. ⁸⁴—⁵⁶.

1 M i oznacza tu «-ty moment szeregu surowego względem .rrrro, ^{M i}

(11)

o względnie niewielkiej liczbie parametrów, któraby dała dostatecznie dobre przybliżenie.

Od dawna starano się ustalić pewien „uni

wersalny“ system funkcyj, któryby czynił zadość tym warunkom dla dowolnego szeregu.

Jednym z takich systemów jest wyżej omó

wiony system parabol (wielomianów). Jest on jednakże mało elastyczny i przy niewiel

kiej liczbie parametrów rzadko kiedy daje wyniki zadawalniaja.ee. O innych takich syste

mach, częściowo lub całkowicie związanych z metodą momentów, będzie mowa niżej.

Jeżeli idzie o szeregi silnie nieregularne, metoda najmniejszych kwadratów w jej po

staci klasycznej najczęściej zawodzi, gdyż albo daje zbyt słabą zgodność, albo, naod- wrót, zbyt wiernie otwarza wszystkie waha

nia, zaokrąglając je tylko. W szczególności do szeregów klasyfikowanych według wieku nie jest prawie nigdy stosowaną, zwłaszcza ze względu na brak teoretycznych form ta

kich szeregów l.

7. Metoda momentów. Teoretyczną podstawą jest tu twierdzenie matematyczne, orzekające, iż każda funkcja ciągła i posiadająca skoń

czone momenty wszystkich rzędów

+CN3 +CO

1¼ J~ f fö) dx > — J x f { x ) d x ,

—oo —co

-f-oo -j-co

{12 = J ^X2 / ( % ) ą „ = J x Hf ( x ) dx, .. .

—OO ——CO

jest, przy spełnieniu pewnych założeń do

datkowych, całkowicie i jednoznacznie przez układ tych momentów wyznaczona. Stąd nasuwa się myśl, że każdą funkcję, mającą n pierwszych momentów takich samych, jak funkcja f ( x ) , można do pewnego stopnia uważać za aproksymację tej ostatniej. Dalszem rozwinięciem tej myśli, w zastosowaniu do wyrównania analitycznego, będzie wyzna

czanie stałych a0, al , . . . , a„ we wzorze (i) przy pomocy warunku, aby w- f z pierwszych momentów funkcji f (x), będących oczywiście funkcjami parametrów ait były równe odpo

wiednim momentom szeregu surowego, czyli z równań

1¼ K ) »• • • i ) — M⁰

( l o ) P"1 (« 0 i * ł flrt )

\x„ (a0, a,,) — M„

Oczywiście momenty można równie dobrze obliczać nie względem x = o , lecz względem innej, rachunkowo bardziej dogodnej war

tości x. Jest rzeczą godną uwagi, że dla wielomianów metoda momentów prowadzi do tych samych wzorów, co i metoda naj

mniejszych kwadratów.

Metoda momentów została szeroko roz

budowana przez K. P e a r s o n a, który skon

struował układ funkcyj, odpowiadających najważniejszym typom szeregów statystycz

nych i szczegółowo opracował odpowiednie metody rachunkow e2. System Pearsona cie

szy się wielkiem uznaniem pośród statysty

ków angielskich, posiada jednakże szereg wad, utrudniających jego stosowalność. Prze- dewszystkiem jest on zbyt mało elastyczny.

Stosowane w praktyce krzywe Pearsona zawierają 4 albo 5 parametrów (momenty do '4 3 lub ^\±4 włącznie); dalej posunąć się jest niezmiernie trudno, gdyż z jednej strony wzory stałyby się niesłychanie skomplikowane, z drugiej zaś—wpływ skrajnych wyrazów szeregu, o niewielkich liczebnościach i naj

bardziej podlegających wahaniom przypad

kowym, na wartość momentów M,- rośnie bardzo szybko wraz z rzędem momentu, wobec czego wartości momentów surowych są coraz mniej pewne. Zarzut ten dotyczy zresztą już momentów trzeciego i czwartego rzędu, których wartości w szeregach o znacz

nej liczbie wyrazów są dość niepewne. P o woduje to często bardzo mierną zgodność szeregu wyrównanego z surowym. W związku z przymusowem ograniczeniem się do mo

mentów IV rzędu najwyżej, wszystkie krzywe Pearsona posiadają jedno maximum albo jedno minimum (nie licząc końców szeregu), wobec czego zasadniczo nadają się tylko do przedstawienia szeregów t. zw. unimodalnych.

Niekorzystną wreszcie cechą metody Pearsona jest duża uciążliwość wymaganych przez nią

rachunków.

Za dodatnią cechę metody momentów w ogóle uważać należy, źe operuje ona wiel

kościami, mającemi doniosłe znaczenie dla badania szeregu z punktu widzenia statystyki teoretycznej: moment zerowego rzędu jest sumą wyrazów szeregu, moment pierwszego rzędu daje średnią wartość cechy x, moment II rzędu—dyspersję, moment III rzędu—tak zwany „eksces" szeregu, moment IV rzędu—

1 Ciekaw ą próbą ustalenia teo re ty c z n e j postaci ro z k ła d u ludnośc i w e d łu g w ie k u są prace A. J . L o t k i (P h y sic a t B io lo g y i inne).

Rozpatrując ludność t. zw. stateczną, czyli taką, k tó r e j r o z k ła d w e d łu g w ie k u nie zależy od czasu, o trzym uje on dla niej w z ó r

c (a) — b e~ra p (a)

gdzie c (a ) da oznacza ilość osób w w ie k u (a , a + da ), p (a ) — ilość d o ż yw ających do w ie k u a (według tablicy w y m iera ln o śc i), r —p r z y  ro s t n a tu ra ln y na je d n o s tk ę ludności, b — ilość u rodzeń n a je d n o s tk ę , p (a) j e s t w tym w z orz e d o w o ln e . W s k a z a n y ro z k ła d ludnośc i w e d łu g wieku je s t ró w n ie ż s ta ły . t. zn., źe o ile w y o b ra z im y so b ie p o p u lac ję izolow aną, w k tó re j r o z k ła d ten z o s ta ł zak łó c o n y p rzez ja k iś kataklizm (w o jn a , cpidem ja), to p rzy założeniu niezmienności płodności i u m ie ra ln o ś c i z o sta n ie on po w zględnie któtkim czasie

spontanicznie przyw rócony.

2 P o r . W . P a l i ń E l d e r t o n , F requeney C urves a n d C orrelaiion.

(12)

jego „skośność“ i t. cl. Z tego względu na spe

cjalną uwagę zasługują układy funkcyj, dla których obydwie metody (momentów i naj

mniejszych kwadratów) prowadzą do tych samych wyników. Pierwszym przykładem takiego systemu funkcyj są omawiane wyżej wielomiany. Drugim przykładem jest t. z w.

szereg C h a r l i e r a, (nazywany również sze

regiem B r u n s a lub G r a m a ) .

Opiera się on na twierdzeniu, że każda funkcja ciągła, posiadająca ciągłe pochodne I i II rzędu, daje się przedstawić dla wszyst

kich wartości a w postaci szeregu zbieżnego

oo

S a cpi (x) t—o

I **

gdzie cp0 (x) oznacza funkcję 2 zw- prawo błędów G a u s s a - L a p l a c e’a), zaś (p,: (x) — kolejne pochodne tej funkcji. Wynika stąd naturalna myśl aproksymacji dowolnej funkcji f ( x ) przy pomocy sum skończonych postaci

n

% c, ?, W

l —O

Jeżeli spółczynniki c, wyznaczać metodą najmniejszych kwadratów, posiadają one na

stępujące ważne własności: i° wartości ich nie zależą od n, to znaczy, że o ile chcemy uwzględnić dalsze wyrazy rozwinięcia, nie zmienia to w niczem poprzednio obliczonych.

Okoliczność ta stanowi ogromne ułatwienie teoretyczne i praktyczne. Zupełnie przeciw

nie rzecz się ma dla wielomianów, w których wzory dla każdego spółczynnika zależą od wszystkich pozostałych. 2° — wartości spół- czynników są te same, co i według metody momentów, wyrażają się więc przy pomocy tych ostatnich. Obierając jako początek układu średnią wartość x, jako jednostkę—

średnie odchylenie kwadratowe, otrzymujemy mianowicie

f ( x ) = Af0 % (x) + M»~Ml ę3 (x) +

Szczegółowo opracowaną teorję wzoru

( i i ) i zastosowania jej do wyrównania sze

regów znaleźć można w dziełach A. F i s h e r ’a (Ob. wykaz literatury na końcu).

8. Zastosowanie metod analitycznych do szeregów demograficznych. Jak wynika z powyższych uwag, metody analityczne nie najlepiej się do tych szeregów dają zastosować, nawet jeżeli szereg surowy nie jest obarczony błę

dami systematycznemu W tym ostatnim przy

padku stosowanie metod analitycznych może

doprowadzić do poważnych błędów. W rzeczy samej, przy obliczaniu momentów wyższych rzędów dla szeregu ludnościowego, zaokrąg

lenia na zerach i piątkach, coraz silniejsze w miarę zwiększania się wieku, mogą zu

pełnie wypaczyć obraz. Jeżeli zaś obliczać będziemy momenty w sposób skrócony—

pięcio-lub dziesięcioletniemi grupami, toprzc- dewszystkiem trzeba wprowadzić poprawki grupowe (typu S h e p p a r d a naprzykład), bardzo wątpliwej wartości w tym przypadku, następnie zaś—odstępujemy od podstawowej zasady metod analitycznych uwzględnienia wszystkich wyrazów szeregu.

Lecz nawet dla szeregów względnie słabo zniekształconych, metody analityczne w po

staci klasycznej dają wyniki niedostateczne.

Jedyny wyjątek stanowi wzór M a k e h a m a . Dla innych szeregów próbowano rozszerzyć metody poprzednio omówione przez stoso

wanie kilku rozmaitych funkcyj, rozbijanie szeregu na części i t. d. K. P e a r s o n 1

przedstawił, naprzykład, szereg zgonów we

dług wieku (ale wzięty z tablicy wymieral- ności, czyli uprzednio wyrównany!), w po

staci sumy pięciu składników—funkcyj, na

leżących do wspomnianego w § 7 układu.

A. F i s h e r2 w podobny sposób zbudował tablicę wymięralności, opierając się na da

nych surowych i przedstawiając szereg zgo

nów jako sumę 8 składników postaci (1 1);

w odróżnienie od Pearsona użył on jednak

że nie formalnego sposobu rozbicia szeregu, lecz skorzystał z danych co do przyczyn zgonów, budując osobny szereg dla zgonów, spowodowanych chorobami dziecięcemi, osob

ny dla zgonów z przyczyn typowych dla wieku starczego i t. d. T ak skomplikowane metody dają oczywiście dość dobre wyniki, wymagają jednakże olbrzymiego nakładu pracy rachunkowej. Tak naprzykład, F i s h e r (/. r., str. 1 9 8) powiada, że obliczenie tablicy wymieralności jego metodą w ymagało pracy

2 rachmistrzów w ciągu ^{7 0 — 7 5} godzin.

To samo powiedzieć należy o metodzie, stosowanej do wyrównania austrjackich tablic wymieralności przez B 1 a s c h k e’g o 3. W y równanie to odbywało się w trzech stadjach (wyrównywano szereg prawdopodobieństw zgonu). Najpierw wyrównano zaokrąglenia na zerach i piątkach przy pomocy bardzo prostego wzoru

“- i + " o + “i . 2(«-i +"o + "i)

3 X Chances o f D eaih.

2 F rcquency C urves, part II: H u m a n D eaih C u rre s.

3 D ie A u s g le ic h u n g von A b s ie r b to r d n u n g tn a u s d e r B e v ö lk e r u n g s s ta tis tik .