k w a r t a l n i k s t a t y s t y c z n y
ROK 19 31, TOM VIII, ZE SZ Y T 3
R E V U E T R 1 M E S T R I E L L E D E S T f l T I S T I Q U E
ANNEE 1931, TOME VIII, FASCICULE 3
K O M IT E T R E D A K C Y J N Y
G Ł Ó W N E G O U R Z Ę D U S T A T Y S T Y C Z N E G O
P r z ew o d n ic zą c y :
D yrekto r Gł U. S t . — EDW ARD SZTURM DE SZTRĘM C z ło n k o w ie :
STE FA N SZULC — R edaktor g łó w n y
IGNACY K R Ä U T L E R — Zastępca red a kto ra g łó w n e g o T A D E U S Z SZTURM DE SZTREM
S e k r e ta r z e :
JA D W IG A O R Ł O W S K A , MARJA G IEY SZTO R
C O M IT E D E R E D A C T IO N
D E L O F F IC E C E N T R A L D E S T A T I S T I Q U E
P r ä sid e n t:
D ir e c te n r d e I ' O ff. C e n tr .d e S t .— EDOUARD SZTURM DE S Z T R E M M em bres:
S T E P H A N E SZULC — R ed a rteu r en elief IGNACE K R Ä U T L E R — R ćdactenr su p p lea n t T H A D E E SZTURM D E SZTREM
S e c r ć t a ir e s :
H E D V IG E O R Ł O W S K A , MARIE G IE Y S Z T O R - KOMIJET REDAKCYJNY TELEFON 232-79
T R E Ś Ć
. s t r . -
S . F ogelson
0 wyrównaniu szereg ó w statystycznych ze s z c z e g ó l- nem uwzględnieniem rozkładu ludności według w i e k u ...6 9 3
I n ż . J u l j u s z M iller
Podstawy kalkulacji kosztów maszynowego opraco
wania dat s t a t y s t y c z n y c h ...7 4 1
D r. J a n P ie k a lk ie w ic z
Biura statystyczno-ekonom iczne w instytucjach rol
nego kredytu h ip o te c z n e g o ...7 7 1
M ie c z y sła w Z arem ba
Ubój zw ierząt gospodarskich w latach 1929 i 1930 . 801 M ichał D o sk o cz
Składy wolnocłowe na polskim obszarze celnym . . 823 S . S z y m k ie w ic z
0 sp isie ludności Warszawy w r. 1792 ... 833 H alin a D r z a ż d ż y ń s k a
Odpowiedź p. S. S z y m k ie w ic z o w i... 840
S O M M A I R E
A page
S. F o g e lĄ n
Sur l ’a ju stem en t d es s e r i e s s t a t is t iq u e s e t en par- tic u lier de la repartition de la popułation d'apres
l äge . . .
I
... 693 In g . Ju les M illerLes b a se s da l’evaluation de f r a i s du depouillem ent mecanique de donnees s t a t i s t i q u e s ... 741
D r . Jean P iek a łk iew icz
Le s e r v ic e s* a tistiq u e d es banques de c r e d it hypo- th e c a ir e a g r i c o l e ...771
M ieczysla s Z arem ba
Abatage d e s animaux de fe r m e en 1929 e t 1930 , 801 M ichel D o sk o cz
Les e n tr e p ö ts f r a n c s sur le te r r ito ir e douanier p o l o n a i s ...823
S. S z y m k ie w ic z
Au su je t du r e c e n s e m e n t de la population de Var- sovie en 1792 ... 833
H . D r z a ż d ż y ń s k a
Replique ä M. S. S z y m k i e w i c z ... 840
r * : « # f ' *fc ł » . :> ’ $. f f
K W A R T A L N I K S T A T Y S T Y C Z N Y
ROK 1931, TOM VIII, Z E S Z Y T 3
R E V U E T R I M E S T R I E L L E D E S T A T I S T I Q U E
ANNEE 1931, TOME VIII, FASCICULE 3
S. F O G E L S O N
O wyrównaniu szeregów statystycznych ze szczególnem uwzględnieniem rozkładu ludności według
T R E Ś Ć J y
I. Ogólne zasady wyrównywania szeregów: i. Z ad an ia w y r ó w n a n ia 693. 2. Z a sa d y k ia sy fik a b g Q N ^ o d w y r ó w n an ia 694. 3. K ry terja g ła d k o śc i sz e r e g u 696. 4. O cen a sk u te cz n o śc i w y r ó w n a n ia 697. 5. O zn a cz en ia 697.
II. Metody analityczne: 6. M etoda n a jm n ie jsz y ch k w a d r a tó w 699. 7. M etoda m o m e n tó w 701. 8. Z a sto so w a n ie m eto d a n a lity cz n y c h do s z e r e g ó w d e m o g r a fic z n y c h 702. III. Metody mechaniczne: 9. W ła sn o śc i o g ó ln e 703.
10. Ś r e d n ia ru ch o m a i jej u o g ó ln ie n ia 704 1 1. Z n ie k s z ta łc e n ia s y s te m a ty c z n e 706. 12. M eto d y su m a cy jn e 707. 13- K o n stru k cja g e o m e tr y c z n a m e to d m ec h a n ic z n y c h 711. 1 4. M etod y m in im a ln e 716. 1 5. M etoda R h o d e s ’a 718. 1 6. U o g ó ln ie n ie m eto d m ec h a n icz n y c h 719. IV. Metody interpolacyjno-stycznościow e: 17. C ha
r a k t e r y s t y k a o g ó ln a 720. 18. M etoda K i n g a 723. 1 9. M etoda G l o v e r a 726. 2 0. W n io s k i 738.
Praca niniejsza powstała na gruncie pew
nego konkretnego zagadnienia. Prof. S t.
S z u l c w pracy Ludność Polski według imeku w latach 1 9 2J, 1 9 2 8 i 1 9 2 .9 (Kwartalnik S ta tystyczny 1 9 8 0, zeszyt 4, str. 1 5 0 1—1 5 0 6) wskazał na wielką nieregularność szeregu wieku ludności Polski a zwłaszcza woje
wództw centralnych i wschodnich, na istnienie zaokrągleń na zerach i piątkach-, tak silnych, że wzór Woolhouse’a okazał się zupełnie niewystarczającym dla ich wygładzenia. Zja
wisko to jest zresztą dobrze znane w bardzo wielu krajach. Jednocześnie wspomniał prof. St. Szulc o zarządzonem w Głównym Urzędzie Statystycznym badaniu możliwości zastosowania innych, mocniejszych metod wyrównania. Artykuł niniejszy przedstawia właśnie wyniki tego badania, przyczem, z uwagi na zupełny niemal brak literatury w języku polskim w tej dziedzinie, wydawało się celowem połączenie przedstawienia tych wyników z zarysem ogólnej teorji wyrówna
nia szeregów statystycznych i próbą racjo
nalnej klasyfikacji najbardziej znanych m e
tod. Jako materjał liczbowy, ilustrujący po
równanie i zestawienie krytyczne rozmaitych metod, posłużyły zasadniczo dane spisu 1 9 2 1 r.
0 rozkładzie ludności według wieku w wo
jewództwach centralnych. Wszystkie tablice 1 wykresy, w których szereg poddany wy
równaniu nie jest wyraźnie wymieniony, dotyczą tego właśnie szeregu. Część I pracy zawiera omówienie ogólne zadań wyrówna
nia oraz podstawy klasyfikacji rozmaitych metod, część II omawia metody analityczne, część III—metody t. z w. mechaniczne proste, część IV — metody oparte na interpolacji stycznościowej i wnioski. Na końcu pracy podano wykaz literatury.
I . O g ó l n e z a s a d y w y r ó w n y w a n i a s z e r e g ó w s t a t y s t y c z n y c h
1. Zadania wyrównania. W najogólniejszem ujęciu wyrównaniem szeregu statystycznego nazywa się zastąpienie go przez szereg inny, o przebiegu bardziej regularnym, ewentualnie bardziej, według naszego mniemania, odpo
wiadającym istotnym cechom rozpatrywanego zjawiska. Konkretyzacja tego określenia może iść w rozmaitych kierunkach i, jak zobaczy
my, wiąże się w sposób naturalny z klasy
fikacją metod wyrównania. Z punktu widze
nia statystyki matematycznej, gdy mamy dany szereg, otrzymany z materjału statystycznego przez klasyfikację według pewnej cechy wymierzałnej x,
( I) / # 2* • • • • • / ^5, • • • • • K/V
(gdzie us oznacza liczbę osobników, dla któ
rych x ma wartość s)1, podstawowe zagad
nienie składa się z dwóch części. Przede-
I Dla dalszych rozważań je st rzeczą obojętną, czy x oznacza cech ę n ieciągłą, i rów ność x ~ s zachodzi dokładnie dla w szystkich o sob n ik ów klasy us czy też x je st cechą ciągłą, zaś u s oznacza liczbę osobników , dla których x je st zawarte w pew nym przedziale kla
sow ym , którego s jest środkiem albo początkiem . W razie potrzeby w tym ostatnim wypadku zakładać będziem y raczej S X <C S + I , obierając raz na zaw sze długość przedziału klasow ego za jed n o stk ę. Z ałożen ie rów ności przedziałów klasow ych je st isto tn e dla zacho
w ania formy w szystkich późniejszych w zorów .
Kwartalnik S tatystyczn y, 1931. 45
wszystkiem należy zbadać, czy i w jakim stopniu szereg ten można uważać za wyloso
wany, t. zn. za wynik M = u1 + u2 + .. . + un prób, dokonanych nad cechą % według pew
nego prawa prawdopodobieństwa p (x), ciąg
łego lub nieciągłego; następnie — trzeba wy
znaczyć owo prawo pi a wdopodobieństwap (x).
Pozornie odmiennie formułuje się zagadnienie dla szeregów t. zw. rozwojowych, gdzie us oznacza natężenie pewnego zjawiska w za
leżności od pewnej zmiennej niezależnej %, np. od czasu, wyrażone w liczbach bezwzględ
nych lub względnych. Mówi się wówczas o wy
kryciu „tendencji rozwojowej“ (trendu), uwol
nionej od wahań przypadkowych. Odpowiada to w istocie rzeczy sformułowaniu poprzed
niemu, z tą tylko różnicą, że liczba „prób“
wynosi N a nie M. Dotyczy to naprzykład badań konjunkturalnych, wyznaczania śmier
telności i jej wahań, stosunku liczebnego płci i t. d. Poszukiwanie funkcji p (x) stano
wić tu będzie jedną z odmian wyrównania szeregu (i).
Wyznaczenie funkcji p(x) i zastąpienie szeregu (u s ) przez szereg, utworzony z od
powiednich wartości tej funkcji, jednocześnie daje nowy szereg o przebiegu bardziej re
gularnym, niż szereg (i).
Nie porzucając gruntu statystyki matema
tycznej, t. zn. traktując wciąż szereg (i) jako
3/ereg losowy, można ten wynik wtórny uważać za cel zasadniczy. Jeżeli mianowicie przypuścimy, że zaobserwowane wyrazy us stanowią sumy wartości teoretycznych, od
powiadających pewnemu prawu prawdopodo
bieństwa o regularnym przebiegu i błędów przypadkowych, wywołujących nieregular- ności i załamania, wówczas, nie przesądzając sprawy ewentualnego poszukiwania owego prawa prawdopodobieństwa, można przy
puścić, że każde wygładzenie tych nieregu- larności, niekoniecznie oparte na określonej funkcji p(x), da nam szereg bardziej zbliżony do teoretycznego. W ten sposób wyrównanie szeregu traktuje się jako eliminację błędów przypadkowych.
Niekiedy odrzuca się powyższe względy teoretyczne, podporządkowując cele wyrów
nania wymogom praktycznym. W rachunkach ubezpieczeniowych naprzykład idzie przede- wszystkiem o uzyskanie tablic zupełnie gład
kich, bez względu na to, czy w ten sposób otrzymujemy zbliżenie do jakiegoś prawa teoretycznego czy też nie.
Przy powyższem precyzowaniu zadań wy
równania zakładaliśmy implicite, że szereg (i) ściśle odpowiada zaobserwowanej rzeczy
wistości, czyli nie zawiera odchyleń syste
matycznych. Znacznie trudniejszą jest sprawa, gdy trzeba myśleć o zneutralizowaniu tych właśnie odchyleń, jak to ma miejsce w naj
bardziej nas interesującym przypadku kon
kretnym rozkładu ludności według wieku.
Tutaj zadaniem wyrównania jest dać szereg jednocześnie bardziej regularny i bardziej
zbliżony do rzeczywistości od szeregu (i).
Kwestja wyznaczenia rozkładu prawdopo
dobieństwa, odpowiadającego danemu szere
gowi (i), jest ściśle związana z matematyczną teorją prawdopodobieństw aposteriori i t. zw.
teorją wiarogodności hipotez b
Charakter niniejszego artykułu nie po
zwala na omówienie tutaj tego związku, jak również na wyłożenie interesującej teorji wy
bitnego austrjackiego matematyka ubezpie
czeniowego, E. B 1 a s c h k e’g o, który w dziele p. t. Die Methoden der Ausgleichung von Massenerscheinungen dał wyczerpujący wykład metod wyrównania, oparty na po
szukiwaniu najbardziej racjonalnego kompro
misu pomiędzy dążeniem do wygładzenia szeregu a dążeniem do uzyskania wyników najbardziej prawdopodobnych.
2. Zasady klasyfikacji metod wyrównania. Rozróż
nia się trzy zasadnicze grupy metod wyrów
nania. Jeżeli przyjmiemy pierwsze z opisa
nych wyżej sformułowań celu wyrównania, oparte na rachunku prawdopodobieństwa, wówczas będzie rzeczą naturalną poszukiwać pewnej funkcji f(x ), która dla x= s przybie
rałaby wartości takie, iż różnice f( s ) —ue miałyby charakter błędów przypadkowych.
Jeżeli poszukujemy f( x ) jako funkcji ciągłej, zadanie to wymaga dalszego sprecyzowania, ponieważ skończona liczba wartości nie wy
znacza funkcji bez bliższych założeń. Zwykle też zakłada się a priori formę analityczną funkcji, pozostawiając pewną liczbę para
metrów dowolnych; wybór odpowiednich wartości tych parametrów stanowi właściwy rachunek wyrównania. Otrzymujemy w ten sposób grupę metod t. zw. analitycznych.
Niektórzy autorowie (zwłaszcza angielscy) przeciwstawiają je wszystkim pozostałym nazywając je theory o f curve f i t t i n g , w prze
ciwieństwie do terminów graduation, adju- stement, smoothing obejmującym te ostatnie.
Podobnie B laschke2 odróżnia metody, dą-
1 Por. np. J . S p ł a w a - N e y m a n , P r z y c z y n e k do te o r ji w iarogodności h ip o te z s ta ty s ty c z n y c h . K w a r ta ln ik S ta ty s ty c z n y 1929, zesz. 4. s tr . 1441—1469.
2 A u s g le ic h u n g von M assenerscheinungen, s t r . 2. Ob. w ykaz lit e r a tu r y na k c ó c u .
żące do eliminacji błędów przypadkowych (AusgleichsmetZioden)y a w tej liczbie również i analityczne, od metod, mających na celu wyłącz
nie formalne wyrównanie szeregu (Ebnungs- methoden). Oczywiście metody analityczne mają największe zastosowanie tam, gdzie istnieją podstawy do przypuszczenia pewnej prawidłowości badanego zjawiska. Tern też tłumaczy się ich wyłączne niemal stosowanie w naukach ścisłych w postaci t. z w. rachun
ku wyrównania obserwacyj. Cechą charakte
rystyczną metod analitycznych jest, że za
kładając istnienie pewnej zależności anali
tycznej wyrazów szeregu od cechy, grającej rolę zmiennej niezależnej, uzależniają one każdy wyraz szeregu wyrównanego od wszyst
kich wyrazów szeregu surowego. W niniej
szej pracy ograniczymy się do bardzo krót
kiego omówienia tych metod, z powodów, które zostaną wyłuszczone na końcu części II.
D rugą grupę metod wyrównania stanowią metody, ograniczające się do formalnego wygładzenia nieregularności szeregu surowe
go, odpowiadające więc drugiemu ujęciu zagadnienia. Metody te noszą nazwę mecha
nicznych i najszersze zastosowanie znalazły w statystyce demograficznej, zwłaszcza przy badaniu wymieralności. Ograniczają one wpływ wzajemny wyrazów szeregu w yrów nanego do kilku wyrazów sąsiednich i p r z e ważnie wyznaczają każdy wyraz z osobna, ale przy pomocy regularnie się powtarzają
cych działań i wzorów o stałych spółczyn- nikach.
Do trzeciej wreszcie grupy zaliczyć na
leży bardziej nowoczesne metody, zajmujące do pewnego stopnia miejsce pośrednie po
między analitycznemi i mechanicznemu Są Tó metody oparte na interpolacji1, narzuca
jące na szereg pewną formę analityczną tylko w obrębie grupy z kilku wyrazów, przyczem forma ta nie jest wynikiem żadnych założeń co do istoty szeregu, lecz zastosowaniem
praw matematycznych o aproksymacji do
wolnych funkcyj przez wyrażenia prostsze, w szczególności przez wielomiany.
Powyższe trzy grupy rachunkowych me
tod wyrównania można nazwać klasycznemu Wyczerpują one zasadniczo zapas środków rachunkowych, stosowanych dotychczas w praktyce dla wyrównania szeregów. W cza
sach nowszych obmyślono kilka nowych zupełnie metod, opartych na odmiennych zasadach. Do takich metod zaliczyć należy np. metodę W h i t t a k e r a 2, opartą na roz
ważaniach zbliżonych do teorji Blaschke’go.
W hittaker zakłada, że szereg surowy jest szeregiem losowym, że prawdopodobieństwo zaobserwowania szeregu, którego wyrazy za
warte są odpowiednio pomiędzy us i us + a, jest równe
h
j
h 2 . . . Ji N _ p N(ł/O*
gdzie
F = h l2 (m1-m1)2 + /z2(«2-«2)2 + . . + htf(uN-uiv)2}
jeżeli przez us oznaczymy teoretyczne war
tości wyrazów szeregu, zaś przez hs — do
kładność każdej obserwacji (jest to prawo błędów Gauss’a); jednocześnie zakłada on, że prawdopodobieństwo szeregu maleje wraz z jego gładkością, mierzoną sumą kwadratów drugich różnic, według tego samego prawa.
Oznaczając tę ostatnią sumę przez S docho
dzi on do wniosku, że najbardziej prawdo
podobnym będzie szereg, dla którego w y rażenie
F + ^ S
ma wartość najmniejszą. E jest tu parametrem dowolnym, zaś h—wspólną wartością miar dokładności hs (wymaga to osobnego założe
nia /zŁ — h2 = . . = /zw). Rachunek jest dość skomplikowany, polega zasadniczo na po
prowadzeniu paraboli II stopnia metodą naj-
I Podstaw owe zagadnienie m atem atycznej teorji inte rp o la c ji, ściśle związanej z r a c h u n k ie m ró żn ic skończonych, można s fo r m u ło w ać w sposób n a stę p u jąc y : znam y w a r to ś c i pe w ne j funkcji / ( x ) dla n ie k tó r y c h wartości zm iennej niezależnej x , n p .d l a x = x , , x 2, . . . x n \ n ależy obliczyć p rzy o d pow ie dnic h założeniach f ( x ) dla dow olnej w a rtośc i x , z a w a rte j pomiędzy ja k ą ś p arą w a r to ś c i f oraz oszaco
wać b łą d , t. zn. znaleźć m aksym alną w a r to ś ć ró żn ic y pom iędzy obliczoną a p ra w d z iw ą w a r to ś c ią funkcji (ta d ru g a część zadania stanow i n ie z b ę d n e u z u p e łn ien ie pierw szej; pom inięcie o sz ac o w an ia b łędu, często się z darzające w p rak ty c e, poz ba w ia w yniki w szelkiej w artości, gdyż uniem ożliwia zdanie sobie s p r a w y z ich do k ład n o śc i). N a js z e rz e j sto s o w an a j e s t inte rp o la c ja przy p om ocy w ie lo m ia n ó w posta c i
(Iq —{— Cli % —{—#2 -j— • • —1~ Clk .
Jeżeli w a rto ś c i Xj tw o rz ą p o s tę p a r y tm e ty c z n y o różnicy h , — h , w ów czas p ro w a d z i ona do klasycznego wzoru New ton a
(2) f ( x ) = f ( x O + * - = ? A + K f ( X i ) + ■ ■ ;
Szczegółowo i bardzo p r z y s tę p n ie op rac o w an ą t e o r j ę interpolacji znaleść m ożna u S t e f f e n s e n ' a ( Interpolation) o raz W h i t t a k e r a (C a lc u lu s o f O bservalions, ro zd z ia ły 1—IV). B e z p o ś re d n ie z a sto s o w a n ie w s ta ty s ty c e z n a jd u je in te r p o la c ja w w ypad k a c h , gdy zachodzi p o trz e b a o szacow ania w y r a z ó w szeregu sta ty sty c z n eg o , odpow iadających p o ś re d n im , n iesta b u la ry z o w a n y m w a rto śc io m cechy (np. jeżeli mając grupy 5-letnie wieku chcem y prze jść do grup rocznych, albo mając n o to w a n ia ja k ie g o ś zja w iska co p ew ien o d s tę p czasu, c hc em y obliczyć je dla m om entów p o ś re d n ic h pom iędzy n o to w a n ia m i). Szczegółow y opis o d pow ie dnic h m eto d rachunkow ych znaleźć m ożna w ro z p r a w ie K. P e a r s o n * a Ott the C onstruetion v f Tablcs a n d on In te rp o la tio n .
p The C alculus o f O bservalions, s ir . 303—315. Ob. w ykaz lit e r a tu r y na końcu.
mniejszych kwadratów (ob. niżej) i obliczaniu odpowiednich „poprawek“ przy pomocy różnic pomiędzy wyrazami surowenń a wyrównane
mu Poprawki te zależą linjowo od dowolnego parametru e, powodując w ten sposób dużą elastyczność metody. Małe wartości e dają w wyniku szereg bardziej gładki, większe—
szereg bardziej zbliżony do surowego.
Zupełnie odmienną od metod klasycz
nych, bo opartą na teorji korelacji, metodę wyrównania opracował j. F u h r i c h (Unter
suchung Statistischer Reihen m it H ilfe der K or
relat io ns theorie, Versicherungs wissenschaft
liche Mitteilungen des Deutschen Vereins für Versicherungswesen in der Tchechoslovaki- schen Republik, 1 9 2 7, 5. Heft, str. 5 1 — 8 0).
Przy pomocy szeregu spółczynników kore
lacji odgranicza on niejako zakres wpływu każdego wyrazu na wyrazy sąsiednie, obli
cza wartości, jakie powinien by mieć każdy wyraz na zasadzie odpowiednich prostych regresji i za wyraz wyrównany uważa śre
dnią z kilku podobnych wyznaczeń.
Obie metody powyższe, wymagające bar
dzo uciążliwych rachunków, nie zostały uwzględnione w niniejszej pracy.
Odmienną znów metodę wyrównania sta
nowi wyrównanie graficzne, polegające na odręcznem wygładzaniu wykresu, przedsta
wiającego dany szereg. Przy dostatecznej wprawie rysownika i zachowaniu pewnych ostrożności (parokrotne wykonanie przez różnych rysowników niezależnie od siebie, zachowanie sumy szeregu przy pomocy po
miarów planimetrycznych) daje ono często zupełnie dobre wyniki. W pracy niniejszej, poświęconej wyłącznie metodom rachunko
wym, nie będziemy szczegółowiej omawiać tej metody.
3. Kryterja gładkości szeregu. Przeważna część niniejszej pracy poświęcona jest metodom mechanicznym i interpolacyjnym, czyli me
todom, skierowanym w pierwszym rzędzie ku usunięciu nierówności i nieregularności szeregu, ku otrzymaniu szeregu „gładkiego“.
Należy więc przedewszystkiem postarać się sprecyzować intuicyjne pojęcie „gładkości“
lub regularności szeregu zarówno dla oceny potrzeby wyrównania jak i wyników jego.
O ile intuicyjna ocena danego szeregu jako
„gładkiego“ lub „niegładkiego“ jest rzeczą względnie łatwą, zwłaszcza przy przedsta
wieniu graficznem, o tyle znalezienie objek- tywnego i racjonalnego kryterjurn gładkości jest trudne. Analogiczne pojęcia, zapożyczone z teorji krzywych płaskich ‘ (ciągłość krzy
wizny, czyli zmian kierunku stycznej, brak
punktów kątowych, ciągłość zmian krzywizny, ograniczoność krzywizny), łatwo wyrażalne w terminach rachunku - różniczkowego, nie nadają się tu ze względu na nieciągłość, tkwiącą w samej naturze szeregu statystycz
nego i niemożliwość nieograniczonego zbli
żania do siebie punktów reprezentujących na wykresie jego wyrazy. Naturalnem wydaje się tu zastąpienie pochodnych przez różnice skończone (por. § 5 wzory (7) ) i szukanie kry te rj ów gładkości przy pomocy badania szeregów różnic kolejnych. Tak, np. W h i t - t a k e r przyjmuje za miarę „niegładkości“
(roughness) szeregu sumę kwadratów różnic III rzędu. Oczywiście lepiej jest badać sumę wartości bezwzględnych, gdyż suma kwadra
tów nadaje zbyt wielką wagę pojedyńczym dużym wartościom; wprowadzenie tej ostat
niej spowodowane jest, jak zwykle, większą łatwością operowania nią. Nasuwa się tu jednakże zarzut bardzo istotny: wielkości różnic nie stanowią jeszcze o gładkości sze
regu. Najlepiej wyjaśni to przykład szeregu a, a2, a3... «” , . . . .
dla którego szereg k-tych różnic jest (a—1)*, a (a—1)*, a2 (a—1)*, . . . .;
jeżeli więc a >» 2, to szereg pierwszych róż
nic ma wyrazy większe od wyrazów szeregu danego, szereg drugich różnic—jeszcze więk
sze i t. d. Tymczasem szereg rozpatrywany jest oczywiście zupełnie gładki. Również i zachowanie stałego znaku przez kolejne różnice nie stanowi niezbędnego warunku gładkości, jak to widać na przykładzie sze
regu wartości funkcji s in x lub cosx. Wydaje się, iż dopiero łączne uwzględnienie wiel
kości różnic, ich znaków oraz regularności w rozkładzie tych ostatnich, może tu dopro
wadzić do celu. Będziemy w dalszym ciągu dla określania gładkości szeregów stosowali schemat następujący: szereg będziemy uwa
żali za gładki, jeżeli wyrazy kolejnych sze
regów pierwszych, drugich, trzecich i t. d.
różnic są coraz mniejsze, zaś znaki tych wy
razów mają rozkład regularny, t. zn. me ule
gają zmianom częstym i bezładnym. Jest to warunek dostateczny ale, jak wspomnieliśmy wyżej, bynajmniej nie konieczny gładkości szeregu. W praktyce kryte rj um to wystarcza w zupełności. W większości szeregów róż
nice dość wysokiego rzędu tworzą już szereg o znakach bezładnie rozmieszczonych; różni
ce następnego rzędu są wówczas już znacznie większe. Im dalej musimy się posunąć przy obliczaniu różnic, aby dojść do takiego bez
ładnego szeregu, tein gładszy jest szereg pierwotnie dany. Dopiero dla porównania gładkości dwóch szeregów, w których róż
nice tego samego rzędu tworzą jeszcze sze
reg o regularnych zmianach znaków, będzie
my porównywać sumy wartości bezwzględ
nych tych różnic. Oczywiście dla dwóch szeregów, znacznie się różniących co do liczby i wielkości wyrazów, trzeba wziąć przeciętną wartość różnicy w stosunku do sumy wyrazów lub średniej wartości jednego wyrazu.
4. Ocena skuteczności wyrównania. Ażeby wy
równanie było skutecznem, szereg wyrównany musi spełniać dwa warunki zasadnicze: musi on być dostatecznie gładki, oraz dostatecznie mało różnić się od szeregu surowego. Te dwa warunki są oczywiście sprzeczne ze sobą, i cała trudność wyboru odpowiedniej metody wyrównania polega na każdorazowem odna
lezieniu najbardziej racjonalnego kompromisu.
Gładkość szeregu wyrównanego oceniamy według wyżej omówionych zasad; naturalną miarą zgodności z szeregiem surowym jest suma wartości bezwzględnych różnic pomię
dzy wyrazami obu szeregów, względnie suma kwadratów tych różnic, bardziej nadająca się do rachunku, lecz bardziej wrażliwa na od
chylenia indywidualne. Obie sumy oczywiście trzeba porównywać z ogólną sumą wyrazów szeregu. Nie bez znaczenia jest też zwykła suma odchyleń, dająca zmianę ogólnej sumy szeregu, wywołaną przez wyrównanie.
Jeżeli wyrównanie wychodzi z założenia, że szereg jest losowy, wówczas ważniejszą jeszcze rolę odgrywa rozkład różnic według ich wielkości i znaków. Ponieważ różnice te mają w tym przypadku reprezentować błędy (odchylenia) przypadkowe, przeto najistot- niejszem staje się pytanie, czy stosują się one do prawa błędów. Teorję tę, która ma szcze
gólne zastosowanie do wyrównania anali
tycznego, rozwinął K. Pearson i jego szkoła1.
Gdy szereg dany zawiera znaczne błędy systematyczne, powyższe kryterjurn staje się bezwartościowem. Ale i kryterjum zgodności z szeregiem surowym traci wiele na swej wartości i skuteczność wyrównania ocenić można tylko indywidualnie w każdym kon
kretnym przypadku, wprowadzając do rozwa
żania naturę badanego zjawiska i korzystając z analogji z innemi szeregami o zbliżonej strukturze.
5. Oznaczenia. Zanim przejdziemy do wła
ściwego przeglądu metod wyrównania, usta
1 Obacz W P a l i a
limy szereg oznaczeń, symboli i skrótów, których używać będziemy w dalszym ciągu.
Pozwoli to uniknąć częstych powtórzeń i ułatwi usystematyzowanie wyników.
W yrazy szeregu danego, podlegającego wyrównaniu, oznaczać będziemy stale przez us, przyczem s przybierać będzie wartości
i, 2, __ , N . N oznacza więc liczbę wyra
zów szeregu pierwotnego. Odpowiednie wy
razy szeregu wyrównanego oznaczać będzie
my przez vs ; jeżeli wyrównanie odbywa się w kilku stadjach (por. np. § § i3 i 1 9), wówczas vs oznaczać będzie zawsze wyrazy szeregu ostatecznie wyrównanego, wyrazy kolejno otrzymywanych szeregów pośrednich ozna
czać będziemy odpowiednio przez vs , vs , v "
i t. d. (wskaźnik u góry oznacza więc kolej
ność szeregu).
Przedstawiając dany szereg graficznie w prostokątnym układzie spółrzędnych za po
mocą punktów o spółrzędnych x = s, y —us względnie vs, będziemy punkty te nazywali krótko punktami Us lub Vs . x będzie więc zawsze oznaczać wartości cechy, według któ
rej szereg jest uporządkowany-, traktowanej jako cecha ciągła, s —wartości całkowite i do
datnie tej cechy?.
Będziemy mieli w dalszym ciągu bardzo często do czynienia z grupami wyrazów na
szego szeregu, najczęściej złożonemi z nie
parzystej liczby wyrazów.
Dla grupy takiej
Us—n •) Us—«-(-i , . . . , Us—1 , Us , , . . .
którą oznaczać będziemy? przez „Gs {n wska
zuje na to, że grupa składa się z 2 7 7 + 1 wyra
zów, 5—że środkowym wyrazem jest us ), wprowadzimy następujące symbole:
(3) - i
u M o . Us-j-i — Us —„ *+ Us —w-J-i 1 • • * ! 77v_! „ t— —n
z ) * '= + »
„ M r;> = JE i us+i
i—+ n
„ M i‘> = . S i* us+i.
1=—n
Są to kolejne momenty rozpatrywanej grupy wyrazów względem x = s. Jeżeli nie będzie obawy co do nieporozumień, będziemy opuszczać lewy wskaźnik u dołu, wskazujący' liczbę wyrazów grupy oraz prawy górny, oznaczający kolejny numer grupy.
Często będziemy wprowadzać dla grupy?
Gs pewne funkcje i odpowiadające im krzy
fI
E l d c r t o n, Frequettry C urves a nd C orrclaiiont ro zd z ia ł X I .
we; dla otrzymania równań tych krzywych przenosić będziemy początek układu spół- rzędnych do punktu ;c = s, y — o i nową od
ciętą oznaczać będziemy przez
Z s = X — s ,
opuszczając wskaźnik s, o ile to nie nastrę
czy powodu do nieporozumienia.
Kolejnym wyrazom grupy „Gs odpowia
dają wówczas wartości
Z = --- 77, ----1i~\~ I , . . . ) I , Oj d ~ I J . . . “I“ VI.
Często potrzebne nam będą również sumy potęg kolejnych liczb naturalnych
(4)
z (:>=
oraz
(5)
=
-S?'; : S{”; :
2W + i ;
S x — o X = — M
1 "
r=—wa:2
_ *=+» , _ 2 jeżeli & jest parzyste
*=—« O „ £ jest nieparzyste Sumy — a więc i S*'y — dla małych wartości w i £ można obliczyć bezpośrednio;
dla dowolnych wartości można korzystać ze wzorów rachunku różnic skończonych1 albo ze specjalnie obliczonych tablic2.
Będziemy również używali obok M („s) odmiennego nieco systemu znakowania dla zwykłych sum wyrazów, zawartych w gru
pie nGs , w wypadkach, gdy będziemy się posługiwali t. z w. sumami iterowanemi. Sumę M (o \ a więc
Ms—n -f- Ms—n+i -j- • • • d~ Mn d~ • • • ~f" Us+n
będziemy oznaczali symbolem + ; sumę nieparzystej liczby takich sum
3M+/ v2»+* 2,,+i v2«+/ , v»”+' , s .+ S x + • • + S + vs + 2s+, +
+ •• + 2S + W2 M + I
będziemy oznaczali symbolem Es +/’ ' ”,+/ ; podobnież sumę nieparzystej liczby, tip. 2^ + 1, tych sum podwójnych, taką, że + ' ’”+/
zajmuje miejsce środkowe, oznaczać będzie-
, i V J ” + Z' ,
my symbolem l s 1 t. d.
Tak więc,
yź * /» 7* S
oznacza wyrażenie otrzymane w sposób na
stępujący: tworzymy sumy zawierające po 3 kolejne wyrazy szeregu
ms—j d~ u$ T tis-j-/;
następnie kolejne sumy tych sum po 5, sumy sum podwójnych po 7, sumy tych ostatnich znów po 3; każda taka suma czterokrotna zawiera, jak łatwo sprawdzić, piętnaście ko lejnych wyrazów szeregu pierwotnego, grupę i j Gs ; wskaźnik dolny s odpowiada wyrazowi środkowemu tej grupy. Ogólnie biorąc, suma
V r 1 ) r 2 ) • • • ) Zj
s
gdzie rx, r2, . . . , rn są liczbami niepa- rzystemi, jest funkcją linjową kolejnych (r i + r 2 + • • + r» + i — n) wyrazów szeregu, z których us jest środkowym, przyczem spół- czynniki wyrazów równoodległych są równe:
(6) »r t . • • • »>» — Us 4 - ü j ( M s+ / 4 - Ms_ z) 4 .
4 " • • • ~ł~ dk (lis—k ~ł~ Ms-\-k) >
1 . 7 t'i -f- T2 T- • • d” V u — VI
gdzie k = — !———-—* ; warto zauwa
żyć, że ak są liczbami całkowi- temi i dodatniemi.
Podobne sumy oczywiście można tworzyć również i dla grup o parzystej liczbie wyra
zów. Ponieważ jednak wszystkie mechanicz
ne metody wyrównania operują wzorami sy- metrycznemi względem us , będziemy rozpa
trywać tylko takie sumy o parzystej liczbie wyrazów, które w ostatecznym wyniku speł
niają warunki, wyrażone wzorem (6); w tym celu należy przestrzegać, aby liczba sumo
wań parzystych była zawsze parzysta, np.
= (iis- 2 + «*_, + Us. + us+I) +
+
( l i s — 1+
l i s .+
U s + I+
U s + 3) .Będziemy również niekiedy zwracali uwagę nie na środkowy, lecz na pierwszy wyraz
1 P o r . np. S t e f f e n s c n , 1. c., s tr . 87 > 124.
2 P e a r s o n , Tables f o r S fa lis tie ia n s a n d B io m e tric ia n s, tabi. X X V III, s tr . 40 i 41.
sumy, co będziemy odróżniali przy pomocy symbolu
Y (s)
-k l i s . -j~ U$-\-i • • ~j~ Ms-\-k—i.
Dla takich sum zachodzi oczywiście związek
A . = Ms+/fc
W wielu przypadkach będziemy spotykać t. z w. różnice skończone, określone przy pomocy wzorów
(7)
A Ug — Wj ,
A -- A A Mj — llgĄ-2 2Mj I Us—j ,
A
A kUs = A — A =
= J ) U s + k - I + ( J ) U g + k-2 --- + Ug ,
™ i 7 ; r / * \ k ( k — l ) ( k —2) . . . ( k — i + l ) ___ [k]i
gdzie t , ) — n _ 3. — .•/ • Czasami używać będziemy też symboli A\us dla oznaczenia różnic, dotyczących powięk
szonych przedziałów
vs
(«)
i t. d.
I I . M e t o d y a n a l i t y c z n e
Podstawowe założenie tych metod można sformułować jak następuje*, zakłada się, że szereg wyrównany jest szeregiem wartości pewnej funkcji, zależnej od n parametrów nieznanych
( 0 TJg f ( s , Cl o d / , • • • , —/ )
przyczem kształt funkcji f (s) jest a priori znany; zadanie polega na wyznaczeniu sta
łych a0y alt . . . , a„-t. Oczywiście n musi być mniejsze od iV, inaczej niema żadnego w y równania.
6. Metoda najmniejszych kwadratów. Jest to me
toda najbardziej klasyczna, której początki sięgają G a u s s a i L a p l a c e ’a i która ma szczególnie szerokie zastosowanie w naukach ścisłych zwłaszcza astronomji i geodezji, przy wyrównywaniu obserwacyj. Mniej lub więcej szczegółowy jej wykład znaleźć można w każdym podręczniku teorji prawdopodobień
stwa lub jednej z wyżej wspomnianych nauk.
Stosuje ona najbardziej naturalny sposób wyboru stałych a,, wyznacza je mianowicie tak, aby uzyskać możliwie najlepszą zgodność z szeregiem surowym. Jako kryterjurn tej
zgodności przyjmuje się sumę kwadratów odchyleń. Przemawiają tu za tern kryterjum nietylko względy rachunkowe (por. § 4), lecz również związek z t. zw. prawem błę
dów Gauss’a—Laplace’a. Można mianowicie udowodnić, że jeżeli szereg jest losowym i odchylenia rzeczywistej wartości każdego wyrazu od jego wartości teoretycznej (na
dziei matematycznej) podlegają prawu błę
dów, wówczas z pośród wszystkich możli
wych funkcyj postaci (1) z największem prawdopodobieństwem odtwarza teoretyczny przebieg szeregu właśnie funkcja, wyznaczo
na tą metodą. Ten właśnie wzgląd tłumaczy stosowanie metody najmniejszych kwadratów do wyrównywania obserwacyj, obarczonych błędami przypadkowemi, jak pomiary fizycz
ne i astronomiczne.
Stałe a0, ax . . . , aM- T wyznacza się więc z warunku
(2)
N
S (us — vs )2 = minimum.
S — l
Uwzględniając wzór (1) mamy jako wa
runki konieczne minimum równania N
s ~ i d f
d a n \ttg f ( s , G0 , . . . , Uff—/ ) ] o
N d j
(3) \ \us f (5, G0 , . . . , G,t—/) ] -- O
s = z 1
N d f
^ da f (^1G0 y . . . j Gm—j) j — o
S _ r
Przy dość ogólnych założeniach, dotyczą
cych 'natury analitycznej funkcji f (s), rów
nania te dają się rozwiązać względem nie
wiadomych a0, aly . . . a,u Otrzymane wartości podstawiamy do wzoru (1), i pozostaje tylko obliczyć wartości tak otrzymanej funkcji dla
S I y • • • ) W*
Rachunek konkretny kształtuje się szcze
gólnie prosto, jeżeli f (s, <z0 , . . . , g„) jest funkcją linjową parametrów g,
n
Vs G{ fi (s) .
(4)
Równania (3) są wówczas również łinjowe względem <7, , mianowicie
a° s Ł f° (s) + az ^ / , ( s ) fj (s) +
( 5 ) N ' N
+ . . . + 0» J 7 /« (s)/y (s) — Ug fj (5)
( j —— 7» 2, . . . , it).
i dają się odrazu rozwiązać przy pomocy wzorów
D i
(6) Cli D
gdzie D oznacza wyznacznik, utworzony ze spółczynników przy zaś Di — tenże wy
znacznik, w którym i —ta kolumna została zastąpiona przez wyrazy, znajdujące się po prawej stronie wzorów (5). W szczególności, jeżeli f (s) jest wielomianem stopnia n
f (5) = aQ + at s + . . . + an s”
otrzymamy, zachowując oznaczenia § 5, N , ^ ’ , y(lf)
* •) y (N) (?a) D =
£->1 ,y Ł->2 ,y (N) y W
^•3 > • ♦ •) z S U 7 (N)
S-^n j Z ^ j Z < P • • > y(N)
^an
Mo, y m
1 ) ^ 2 y 0V)j • • • ł y (AV (7b) D0 = M , , y ^ y (N)
• • y z < $ M„, z (Z> Z (P • • » y<K) ( 7 (N)
i y M„, y m
'■^2 , • * • 1 7 (N) (7C) D , =
7 (N)
•^2 , M ,, y W '^ 3 > • * Z%>
y n t M„, Z^P^nĄ-a y • • • > 7 W i tak dalej. Zanotujemy tu, ze wz ględu
(8)
późniejsze zastosowania, ostateczną postać wzorów dla n = i (linja prosta),
/ W = &o + 5, Mamy, z uwagi na
7 ( N ) N ( N + \ ) 7 ( N ) N ( N + \ ) ( 2 N + \ )
— 2 » 2 6 ’
( 8 )
ar (2vV-f~l) Mq— 3 M x N { N - \ ) - (AM -l) M ,+ 2 Mi
Ar(iV2—1)
Jeżeli N j est liczbą nieparzystą, N —2 N '+ 1, wzory upraszczają się znacznie, jeżeli zastą
pimy s przez t = s — N ' ; t wówczas zmienia się od —N ' do + N ', we wzorach (7 ) trzeba zastąpić Z,• przez S,- , co znacznie je upraszcza,
gdyż Ą O.
(8a) a*
Mamy wówczas dla linji prostej
M '
2yv/0-f-l j e d n i a wartość wyrazu szeregu)
3 M /
M / _____________________________________
S 2.v' (2/V '-j-l) (2A ' - f 2) (4Av+ 3 ) .
(Mz, są to momenty względem t = o ). Po
dobnież dla paraboli drugiego stopnia f ( s ) — a0 + aA s + a2 s2
otrzymujemy łatwe do rozwiązania równania (2vVz+ i ) a0 + S 2n> a2 M '
(9) S 2a ' a0 + 5 4a ' a2 = M'.
M x
Powyższe wzory znajdują szerokie zasto
sowanie przy wyznaczaniu trendów linjowych i parabolicznych, linij regresji i t. d,
Jeżeli f (s) nie jest funkcją linj ową para
metrów a,, wówczas rozwiązanie liczbowe równań (3) staje się o wiele trudniejsze.
Stosuje się wówczas skomplikowane i wy
magające długich rachunków metody przy
bliżeń kolejnych, albo specjalnie dostoso
wane metody. Takie specjalne metody opra
cowano np. dla wyznaczenia stałych we wzorze G o m p e r t z - M a k e h a m a .
f ( x ) — k s x g c x
używanego z powodzeniem przy wyrówny
waniu tablic wymieralności2.
Metoda najmniejszych kwadratów jest szczególnie odpowiednia w wypadkach, gdy znamy a priori kształt funkcji f (s) bądź to na mocy dedukcji teoretycznej, jak w obser
wacjach astronomicznych lub pomiarach ge- odetycznych, bądź też z poprzedniego do
świadczenia, jak dla wzoru G o m p e r t z - M a k e h a m a . Służy ona wtedy jednakże nie tyle do wyrównania szeregu, ile do ekspe
rymentalnego sprawdzenia teorji, na której dedukcja była opartą, lub do wyznaczenia stałych, mających jakieś znaczenie istotne.
Z teoretycznego punktu widzenia pozwala ona odtworzyć każdy szereg z dowolnie wielką dokładnością, za cenę powiększenia liczby parametrów a, ; jest jednak rzeczą jasną, że na tej drodze szybko utraci się wszelką możność zorjentowania się w naturze szeregu. W praktyce stosowalność metody do danego szeregu uzależniona jest od mo
żliwości znalezienia odpowiedniej funkcji f f s )
N
V s« lis
s— i
s Por. np. G. R o s m a 11 i t h. M ath em a tisch e S ta tis tik ■ ilcr l'r r s o iie m c r siehe i tn ;g , sir. 84—56.
1 M i oznacza tu «-ty moment szeregu surowego względem .rrrro, M i
o względnie niewielkiej liczbie parametrów, któraby dała dostatecznie dobre przybliżenie.
Od dawna starano się ustalić pewien „uni
wersalny“ system funkcyj, któryby czynił zadość tym warunkom dla dowolnego szeregu.
Jednym z takich systemów jest wyżej omó
wiony system parabol (wielomianów). Jest on jednakże mało elastyczny i przy niewiel
kiej liczbie parametrów rzadko kiedy daje wyniki zadawalniaja.ee. O innych takich syste
mach, częściowo lub całkowicie związanych z metodą momentów, będzie mowa niżej.
Jeżeli idzie o szeregi silnie nieregularne, metoda najmniejszych kwadratów w jej po
staci klasycznej najczęściej zawodzi, gdyż albo daje zbyt słabą zgodność, albo, naod- wrót, zbyt wiernie otwarza wszystkie waha
nia, zaokrąglając je tylko. W szczególności do szeregów klasyfikowanych według wieku nie jest prawie nigdy stosowaną, zwłaszcza ze względu na brak teoretycznych form ta
kich szeregów l.
7. Metoda momentów. Teoretyczną podstawą jest tu twierdzenie matematyczne, orzekające, iż każda funkcja ciągła i posiadająca skoń
czone momenty wszystkich rzędów
+CN3 +CO
1¼ J~ f fö) dx > — J x f { x ) d x ,
—oo —co
-f-oo -j-co
{12 = J X2 / ( % ) ą „ = J x Hf ( x ) dx, .. .
—OO ——CO
jest, przy spełnieniu pewnych założeń do
datkowych, całkowicie i jednoznacznie przez układ tych momentów wyznaczona. Stąd nasuwa się myśl, że każdą funkcję, mającą n pierwszych momentów takich samych, jak funkcja f ( x ) , można do pewnego stopnia uważać za aproksymację tej ostatniej. Dalszem rozwinięciem tej myśli, w zastosowaniu do wyrównania analitycznego, będzie wyzna
czanie stałych a0, al , . . . , a„ we wzorze (i) przy pomocy warunku, aby w- f z pierwszych momentów funkcji f (x), będących oczywiście funkcjami parametrów ait były równe odpo
wiednim momentom szeregu surowego, czyli z równań
1¼ K ) »• • • i ) — M0
( l o ) P"1 (« 0 i * ł flrt )
\x„ (a0, a,,) — M„
Oczywiście momenty można równie dobrze obliczać nie względem x = o , lecz względem innej, rachunkowo bardziej dogodnej war
tości x. Jest rzeczą godną uwagi, że dla wielomianów metoda momentów prowadzi do tych samych wzorów, co i metoda naj
mniejszych kwadratów.
Metoda momentów została szeroko roz
budowana przez K. P e a r s o n a, który skon
struował układ funkcyj, odpowiadających najważniejszym typom szeregów statystycz
nych i szczegółowo opracował odpowiednie metody rachunkow e2. System Pearsona cie
szy się wielkiem uznaniem pośród statysty
ków angielskich, posiada jednakże szereg wad, utrudniających jego stosowalność. Prze- dewszystkiem jest on zbyt mało elastyczny.
Stosowane w praktyce krzywe Pearsona zawierają 4 albo 5 parametrów (momenty do '4 3 lub \±4 włącznie); dalej posunąć się jest niezmiernie trudno, gdyż z jednej strony wzory stałyby się niesłychanie skomplikowane, z drugiej zaś—wpływ skrajnych wyrazów szeregu, o niewielkich liczebnościach i naj
bardziej podlegających wahaniom przypad
kowym, na wartość momentów M,- rośnie bardzo szybko wraz z rzędem momentu, wobec czego wartości momentów surowych są coraz mniej pewne. Zarzut ten dotyczy zresztą już momentów trzeciego i czwartego rzędu, których wartości w szeregach o znacz
nej liczbie wyrazów są dość niepewne. P o woduje to często bardzo mierną zgodność szeregu wyrównanego z surowym. W związku z przymusowem ograniczeniem się do mo
mentów IV rzędu najwyżej, wszystkie krzywe Pearsona posiadają jedno maximum albo jedno minimum (nie licząc końców szeregu), wobec czego zasadniczo nadają się tylko do przedstawienia szeregów t. zw. unimodalnych.
Niekorzystną wreszcie cechą metody Pearsona jest duża uciążliwość wymaganych przez nią
rachunków.
Za dodatnią cechę metody momentów w ogóle uważać należy, źe operuje ona wiel
kościami, mającemi doniosłe znaczenie dla badania szeregu z punktu widzenia statystyki teoretycznej: moment zerowego rzędu jest sumą wyrazów szeregu, moment pierwszego rzędu daje średnią wartość cechy x, moment II rzędu—dyspersję, moment III rzędu—tak zwany „eksces" szeregu, moment IV rzędu—
1 Ciekaw ą próbą ustalenia teo re ty c z n e j postaci ro z k ła d u ludnośc i w e d łu g w ie k u są prace A. J . L o t k i (P h y sic a t B io lo g y i inne).
Rozpatrując ludność t. zw. stateczną, czyli taką, k tó r e j r o z k ła d w e d łu g w ie k u nie zależy od czasu, o trzym uje on dla niej w z ó r
c (a) — b e~ra p (a)
gdzie c (a ) da oznacza ilość osób w w ie k u (a , a + da ), p (a ) — ilość d o ż yw ających do w ie k u a (według tablicy w y m iera ln o śc i), r —p r z y ro s t n a tu ra ln y na je d n o s tk ę ludności, b — ilość u rodzeń n a je d n o s tk ę , p (a) j e s t w tym w z orz e d o w o ln e . W s k a z a n y ro z k ła d ludnośc i w e d łu g wieku je s t ró w n ie ż s ta ły . t. zn., źe o ile w y o b ra z im y so b ie p o p u lac ję izolow aną, w k tó re j r o z k ła d ten z o s ta ł zak łó c o n y p rzez ja k iś kataklizm (w o jn a , cpidem ja), to p rzy założeniu niezmienności płodności i u m ie ra ln o ś c i z o sta n ie on po w zględnie któtkim czasie
spontanicznie przyw rócony.
2 P o r . W . P a l i ń E l d e r t o n , F requeney C urves a n d C orrelaiion.
jego „skośność“ i t. cl. Z tego względu na spe
cjalną uwagę zasługują układy funkcyj, dla których obydwie metody (momentów i naj
mniejszych kwadratów) prowadzą do tych samych wyników. Pierwszym przykładem takiego systemu funkcyj są omawiane wyżej wielomiany. Drugim przykładem jest t. z w.
szereg C h a r l i e r a, (nazywany również sze
regiem B r u n s a lub G r a m a ) .
Opiera się on na twierdzeniu, że każda funkcja ciągła, posiadająca ciągłe pochodne I i II rzędu, daje się przedstawić dla wszyst
kich wartości a w postaci szeregu zbieżnego
oo
S a cpi (x) t—o
I **
gdzie cp0 (x) oznacza funkcję 2 zw- prawo błędów G a u s s a - L a p l a c e’a), zaś (p,: (x) — kolejne pochodne tej funkcji. Wynika stąd naturalna myśl aproksymacji dowolnej funkcji f ( x ) przy pomocy sum skończonych postaci
n
% c, ?, W
l —O
Jeżeli spółczynniki c, wyznaczać metodą najmniejszych kwadratów, posiadają one na
stępujące ważne własności: i° wartości ich nie zależą od n, to znaczy, że o ile chcemy uwzględnić dalsze wyrazy rozwinięcia, nie zmienia to w niczem poprzednio obliczonych.
Okoliczność ta stanowi ogromne ułatwienie teoretyczne i praktyczne. Zupełnie przeciw
nie rzecz się ma dla wielomianów, w których wzory dla każdego spółczynnika zależą od wszystkich pozostałych. 2° — wartości spół- czynników są te same, co i według metody momentów, wyrażają się więc przy pomocy tych ostatnich. Obierając jako początek układu średnią wartość x, jako jednostkę—
średnie odchylenie kwadratowe, otrzymujemy mianowicie
f ( x ) = Af0 % (x) + M»~Ml ę3 (x) +
Szczegółowo opracowaną teorję wzoru
( i i ) i zastosowania jej do wyrównania sze
regów znaleźć można w dziełach A. F i s h e r ’a (Ob. wykaz literatury na końcu).
8. Zastosowanie metod analitycznych do szeregów demograficznych. Jak wynika z powyższych uwag, metody analityczne nie najlepiej się do tych szeregów dają zastosować, nawet jeżeli szereg surowy nie jest obarczony błę
dami systematycznemu W tym ostatnim przy
padku stosowanie metod analitycznych może
doprowadzić do poważnych błędów. W rzeczy samej, przy obliczaniu momentów wyższych rzędów dla szeregu ludnościowego, zaokrąg
lenia na zerach i piątkach, coraz silniejsze w miarę zwiększania się wieku, mogą zu
pełnie wypaczyć obraz. Jeżeli zaś obliczać będziemy momenty w sposób skrócony—
pięcio-lub dziesięcioletniemi grupami, toprzc- dewszystkiem trzeba wprowadzić poprawki grupowe (typu S h e p p a r d a naprzykład), bardzo wątpliwej wartości w tym przypadku, następnie zaś—odstępujemy od podstawowej zasady metod analitycznych uwzględnienia wszystkich wyrazów szeregu.
Lecz nawet dla szeregów względnie słabo zniekształconych, metody analityczne w po
staci klasycznej dają wyniki niedostateczne.
Jedyny wyjątek stanowi wzór M a k e h a m a . Dla innych szeregów próbowano rozszerzyć metody poprzednio omówione przez stoso
wanie kilku rozmaitych funkcyj, rozbijanie szeregu na części i t. d. K. P e a r s o n 1
przedstawił, naprzykład, szereg zgonów we
dług wieku (ale wzięty z tablicy wymieral- ności, czyli uprzednio wyrównany!), w po
staci sumy pięciu składników—funkcyj, na
leżących do wspomnianego w § 7 układu.
A. F i s h e r2 w podobny sposób zbudował tablicę wymięralności, opierając się na da
nych surowych i przedstawiając szereg zgo
nów jako sumę 8 składników postaci (1 1);
w odróżnienie od Pearsona użył on jednak
że nie formalnego sposobu rozbicia szeregu, lecz skorzystał z danych co do przyczyn zgonów, budując osobny szereg dla zgonów, spowodowanych chorobami dziecięcemi, osob
ny dla zgonów z przyczyn typowych dla wieku starczego i t. d. T ak skomplikowane metody dają oczywiście dość dobre wyniki, wymagają jednakże olbrzymiego nakładu pracy rachunkowej. Tak naprzykład, F i s h e r (/. r., str. 1 9 8) powiada, że obliczenie tablicy wymieralności jego metodą w ymagało pracy
2 rachmistrzów w ciągu 7 0 — 7 5 godzin.
To samo powiedzieć należy o metodzie, stosowanej do wyrównania austrjackich tablic wymieralności przez B 1 a s c h k e’g o 3. W y równanie to odbywało się w trzech stadjach (wyrównywano szereg prawdopodobieństw zgonu). Najpierw wyrównano zaokrąglenia na zerach i piątkach przy pomocy bardzo prostego wzoru
“- i + " o + “i . 2(«-i +"o + "i)
3 X Chances o f D eaih.
2 F rcquency C urves, part II: H u m a n D eaih C u rre s.
3 D ie A u s g le ic h u n g von A b s ie r b to r d n u n g tn a u s d e r B e v ö lk e r u n g s s ta tis tik .