• Nie Znaleziono Wyników

Kwartalnik Statystyczny, 1931, T. 8, z. 3

N/A
N/A
Protected

Academic year: 2022

Share "Kwartalnik Statystyczny, 1931, T. 8, z. 3"

Copied!
152
0
0

Pełen tekst

(1)

k w a r t a l n i k s t a t y s t y c z n y

ROK 19 31, TOM VIII, ZE SZ Y T 3

R E V U E T R 1 M E S T R I E L L E D E S T f l T I S T I Q U E

ANNEE 1931, TOME VIII, FASCICULE 3

K O M IT E T R E D A K C Y J N Y

G Ł Ó W N E G O U R Z Ę D U S T A T Y S T Y C Z N E G O

P r z ew o d n ic zą c y :

D yrekto r Gł U. S t . — EDW ARD SZTURM DE SZTRĘM C z ło n k o w ie :

STE FA N SZULC — R edaktor g łó w n y

IGNACY K R Ä U T L E R — Zastępca red a kto ra g łó w n e g o T A D E U S Z SZTURM DE SZTREM

S e k r e ta r z e :

JA D W IG A O R Ł O W S K A , MARJA G IEY SZTO R

C O M IT E D E R E D A C T IO N

D E L O F F IC E C E N T R A L D E S T A T I S T I Q U E

P r ä sid e n t:

D ir e c te n r d e I ' O ff. C e n tr .d e S t .— EDOUARD SZTURM DE S Z T R E M M em bres:

S T E P H A N E SZULC — R ed a rteu r en elief IGNACE K R Ä U T L E R — R ćdactenr su p p lea n t T H A D E E SZTURM D E SZTREM

S e c r ć t a ir e s :

H E D V IG E O R Ł O W S K A , MARIE G IE Y S Z T O R - KOMIJET REDAKCYJNY TELEFON 232-79

T R E Ś Ć

. s t r . -

S . F ogelson

0 wyrównaniu szereg ó w statystycznych ze s z c z e g ó l- nem uwzględnieniem rozkładu ludności według w i e k u ...6 9 3

I n ż . J u l j u s z M iller

Podstawy kalkulacji kosztów maszynowego opraco­

wania dat s t a t y s t y c z n y c h ...7 4 1

D r. J a n P ie k a lk ie w ic z

Biura statystyczno-ekonom iczne w instytucjach rol­

nego kredytu h ip o te c z n e g o ...7 7 1

M ie c z y sła w Z arem ba

Ubój zw ierząt gospodarskich w latach 1929 i 1930 . 801 M ichał D o sk o cz

Składy wolnocłowe na polskim obszarze celnym . . 823 S . S z y m k ie w ic z

0 sp isie ludności Warszawy w r. 1792 ... 833 H alin a D r z a ż d ż y ń s k a

Odpowiedź p. S. S z y m k ie w ic z o w i... 840

S O M M A I R E

A page

S. F o g e lĄ n

Sur l ’a ju stem en t d es s e r i e s s t a t is t iq u e s e t en par- tic u lier de la repartition de la popułation d'apres

l äge . . .

I

... 693 In g . Ju les M iller

Les b a se s da l’evaluation de f r a i s du depouillem ent mecanique de donnees s t a t i s t i q u e s ... 741

D r . Jean P iek a łk iew icz

Le s e r v ic e s* a tistiq u e d es banques de c r e d it hypo- th e c a ir e a g r i c o l e ...771

M ieczysla s Z arem ba

Abatage d e s animaux de fe r m e en 1929 e t 1930 , 801 M ichel D o sk o cz

Les e n tr e p ö ts f r a n c s sur le te r r ito ir e douanier p o l o n a i s ...823

S. S z y m k ie w ic z

Au su je t du r e c e n s e m e n t de la population de Var- sovie en 1792 ... 833

H . D r z a ż d ż y ń s k a

Replique ä M. S. S z y m k i e w i c z ... 840

(2)

r * : « # f ' *fc ł » . :> ’ $. f f

(3)

K W A R T A L N I K S T A T Y S T Y C Z N Y

ROK 1931, TOM VIII, Z E S Z Y T 3

R E V U E T R I M E S T R I E L L E D E S T A T I S T I Q U E

ANNEE 1931, TOME VIII, FASCICULE 3

S. F O G E L S O N

O wyrównaniu szeregów statystycznych ze szczególnem uwzględnieniem rozkładu ludności według

T R E Ś Ć J y

I. Ogólne zasady wyrównywania szeregów: i. Z ad an ia w y r ó w n a n ia 693. 2. Z a sa d y k ia sy fik a b g Q N ^ o d w y r ó w ­ n an ia 694. 3. K ry terja g ła d k o śc i sz e r e g u 696. 4. O cen a sk u te cz n o śc i w y r ó w n a n ia 697. 5. O zn a cz en ia 697.

II. Metody analityczne: 6. M etoda n a jm n ie jsz y ch k w a d r a tó w 699. 7. M etoda m o m e n tó w 701. 8. Z a sto so w a n ie m eto d a n a lity cz n y c h do s z e r e g ó w d e m o g r a fic z n y c h 702. III. Metody mechaniczne: 9. W ła sn o śc i o g ó ln e 703.

10. Ś r e d n ia ru ch o m a i jej u o g ó ln ie n ia 704 1 1. Z n ie k s z ta łc e n ia s y s te m a ty c z n e 706. 12. M eto d y su m a cy jn e 707. 13- K o n stru k cja g e o m e tr y c z n a m e to d m ec h a n ic z n y c h 711. 1 4. M etod y m in im a ln e 716. 1 5. M etoda R h o d e s ’a 718. 1 6. U o g ó ln ie n ie m eto d m ec h a n icz n y c h 719. IV. Metody interpolacyjno-stycznościow e: 17. C ha­

r a k t e r y s t y k a o g ó ln a 720. 18. M etoda K i n g a 723. 1 9. M etoda G l o v e r a 726. 2 0. W n io s k i 738.

Praca niniejsza powstała na gruncie pew­

nego konkretnego zagadnienia. Prof. S t.

S z u l c w pracy Ludność Polski według imeku w latach 1 9 2J, 1 9 2 8 i 1 9 2 .9 (Kwartalnik S ta ­ tystyczny 1 9 8 0, zeszyt 4, str. 1 5 0 11 5 0 6) wskazał na wielką nieregularność szeregu wieku ludności Polski a zwłaszcza woje­

wództw centralnych i wschodnich, na istnienie zaokrągleń na zerach i piątkach-, tak silnych, że wzór Woolhouse’a okazał się zupełnie niewystarczającym dla ich wygładzenia. Zja­

wisko to jest zresztą dobrze znane w bardzo wielu krajach. Jednocześnie wspomniał prof. St. Szulc o zarządzonem w Głównym Urzędzie Statystycznym badaniu możliwości zastosowania innych, mocniejszych metod wyrównania. Artykuł niniejszy przedstawia właśnie wyniki tego badania, przyczem, z uwagi na zupełny niemal brak literatury w języku polskim w tej dziedzinie, wydawało się celowem połączenie przedstawienia tych wyników z zarysem ogólnej teorji wyrówna­

nia szeregów statystycznych i próbą racjo­

nalnej klasyfikacji najbardziej znanych m e­

tod. Jako materjał liczbowy, ilustrujący po­

równanie i zestawienie krytyczne rozmaitych metod, posłużyły zasadniczo dane spisu 1 9 2 1 r.

0 rozkładzie ludności według wieku w wo­

jewództwach centralnych. Wszystkie tablice 1 wykresy, w których szereg poddany wy­

równaniu nie jest wyraźnie wymieniony, dotyczą tego właśnie szeregu. Część I pracy zawiera omówienie ogólne zadań wyrówna­

nia oraz podstawy klasyfikacji rozmaitych metod, część II omawia metody analityczne, część III—metody t. z w. mechaniczne proste, część IV — metody oparte na interpolacji stycznościowej i wnioski. Na końcu pracy podano wykaz literatury.

I . O g ó l n e z a s a d y w y r ó w n y w a n i a s z e r e g ó w s t a t y s t y c z n y c h

1. Zadania wyrównania. W najogólniejszem ujęciu wyrównaniem szeregu statystycznego nazywa się zastąpienie go przez szereg inny, o przebiegu bardziej regularnym, ewentualnie bardziej, według naszego mniemania, odpo­

wiadającym istotnym cechom rozpatrywanego zjawiska. Konkretyzacja tego określenia może iść w rozmaitych kierunkach i, jak zobaczy­

my, wiąże się w sposób naturalny z klasy­

fikacją metod wyrównania. Z punktu widze­

nia statystyki matematycznej, gdy mamy dany szereg, otrzymany z materjału statystycznego przez klasyfikację według pewnej cechy wymierzałnej x,

( I) / # 2* • • • • • / ^5, • • • • • K/V

(gdzie us oznacza liczbę osobników, dla któ­

rych x ma wartość s)1, podstawowe zagad­

nienie składa się z dwóch części. Przede-

I Dla dalszych rozważań je st rzeczą obojętną, czy x oznacza cech ę n ieciągłą, i rów ność x ~ s zachodzi dokładnie dla w szystkich o sob n ik ów klasy us czy też x je st cechą ciągłą, zaś u s oznacza liczbę osobników , dla których x je st zawarte w pew nym przedziale kla­

sow ym , którego s jest środkiem albo początkiem . W razie potrzeby w tym ostatnim wypadku zakładać będziem y raczej S X <C S + I , obierając raz na zaw sze długość przedziału klasow ego za jed n o stk ę. Z ałożen ie rów ności przedziałów klasow ych je st isto tn e dla zacho­

w ania formy w szystkich późniejszych w zorów .

Kwartalnik S tatystyczn y, 1931. 45

(4)

wszystkiem należy zbadać, czy i w jakim stopniu szereg ten można uważać za wyloso­

wany, t. zn. za wynik M = u1 + u2 + .. . + un prób, dokonanych nad cechą % według pew­

nego prawa prawdopodobieństwa p (x), ciąg­

łego lub nieciągłego; następnie — trzeba wy­

znaczyć owo prawo pi a wdopodobieństwap (x).

Pozornie odmiennie formułuje się zagadnienie dla szeregów t. zw. rozwojowych, gdzie us oznacza natężenie pewnego zjawiska w za­

leżności od pewnej zmiennej niezależnej %, np. od czasu, wyrażone w liczbach bezwzględ­

nych lub względnych. Mówi się wówczas o wy­

kryciu „tendencji rozwojowej“ (trendu), uwol­

nionej od wahań przypadkowych. Odpowiada to w istocie rzeczy sformułowaniu poprzed­

niemu, z tą tylko różnicą, że liczba „prób“

wynosi N a nie M. Dotyczy to naprzykład badań konjunkturalnych, wyznaczania śmier­

telności i jej wahań, stosunku liczebnego płci i t. d. Poszukiwanie funkcji p (x) stano­

wić tu będzie jedną z odmian wyrównania szeregu (i).

Wyznaczenie funkcji p(x) i zastąpienie szeregu (u s ) przez szereg, utworzony z od­

powiednich wartości tej funkcji, jednocześnie daje nowy szereg o przebiegu bardziej re­

gularnym, niż szereg (i).

Nie porzucając gruntu statystyki matema­

tycznej, t. zn. traktując wciąż szereg (i) jako

3/ereg losowy, można ten wynik wtórny uważać za cel zasadniczy. Jeżeli mianowicie przypuścimy, że zaobserwowane wyrazy us stanowią sumy wartości teoretycznych, od­

powiadających pewnemu prawu prawdopodo­

bieństwa o regularnym przebiegu i błędów przypadkowych, wywołujących nieregular- ności i załamania, wówczas, nie przesądzając sprawy ewentualnego poszukiwania owego prawa prawdopodobieństwa, można przy­

puścić, że każde wygładzenie tych nieregu- larności, niekoniecznie oparte na określonej funkcji p(x), da nam szereg bardziej zbliżony do teoretycznego. W ten sposób wyrównanie szeregu traktuje się jako eliminację błędów przypadkowych.

Niekiedy odrzuca się powyższe względy teoretyczne, podporządkowując cele wyrów­

nania wymogom praktycznym. W rachunkach ubezpieczeniowych naprzykład idzie przede- wszystkiem o uzyskanie tablic zupełnie gład­

kich, bez względu na to, czy w ten sposób otrzymujemy zbliżenie do jakiegoś prawa teoretycznego czy też nie.

Przy powyższem precyzowaniu zadań wy­

równania zakładaliśmy implicite, że szereg (i) ściśle odpowiada zaobserwowanej rzeczy­

wistości, czyli nie zawiera odchyleń syste­

matycznych. Znacznie trudniejszą jest sprawa, gdy trzeba myśleć o zneutralizowaniu tych właśnie odchyleń, jak to ma miejsce w naj­

bardziej nas interesującym przypadku kon­

kretnym rozkładu ludności według wieku.

Tutaj zadaniem wyrównania jest dać szereg jednocześnie bardziej regularny i bardziej

zbliżony do rzeczywistości od szeregu (i).

Kwestja wyznaczenia rozkładu prawdopo­

dobieństwa, odpowiadającego danemu szere­

gowi (i), jest ściśle związana z matematyczną teorją prawdopodobieństw aposteriori i t. zw.

teorją wiarogodności hipotez b

Charakter niniejszego artykułu nie po­

zwala na omówienie tutaj tego związku, jak również na wyłożenie interesującej teorji wy­

bitnego austrjackiego matematyka ubezpie­

czeniowego, E. B 1 a s c h k e’g o, który w dziele p. t. Die Methoden der Ausgleichung von Massenerscheinungen dał wyczerpujący wykład metod wyrównania, oparty na po­

szukiwaniu najbardziej racjonalnego kompro­

misu pomiędzy dążeniem do wygładzenia szeregu a dążeniem do uzyskania wyników najbardziej prawdopodobnych.

2. Zasady klasyfikacji metod wyrównania. Rozróż­

nia się trzy zasadnicze grupy metod wyrów­

nania. Jeżeli przyjmiemy pierwsze z opisa­

nych wyżej sformułowań celu wyrównania, oparte na rachunku prawdopodobieństwa, wówczas będzie rzeczą naturalną poszukiwać pewnej funkcji f(x ), która dla x= s przybie­

rałaby wartości takie, iż różnice f( s ) —ue miałyby charakter błędów przypadkowych.

Jeżeli poszukujemy f( x ) jako funkcji ciągłej, zadanie to wymaga dalszego sprecyzowania, ponieważ skończona liczba wartości nie wy­

znacza funkcji bez bliższych założeń. Zwykle też zakłada się a priori formę analityczną funkcji, pozostawiając pewną liczbę para­

metrów dowolnych; wybór odpowiednich wartości tych parametrów stanowi właściwy rachunek wyrównania. Otrzymujemy w ten sposób grupę metod t. zw. analitycznych.

Niektórzy autorowie (zwłaszcza angielscy) przeciwstawiają je wszystkim pozostałym nazywając je theory o f curve f i t t i n g , w prze­

ciwieństwie do terminów graduation, adju- stement, smoothing obejmującym te ostatnie.

Podobnie B laschke2 odróżnia metody, dą-

1 Por. np. J . S p ł a w a - N e y m a n , P r z y c z y n e k do te o r ji w iarogodności h ip o te z s ta ty s ty c z n y c h . K w a r ta ln ik S ta ty s ty c z n y 1929, zesz. 4. s tr . 1441—1469.

2 A u s g le ic h u n g von M assenerscheinungen, s t r . 2. Ob. w ykaz lit e r a tu r y na k c ó c u .

(5)

żące do eliminacji błędów przypadkowych (AusgleichsmetZioden)y a w tej liczbie również i analityczne, od metod, mających na celu wyłącz­

nie formalne wyrównanie szeregu (Ebnungs- methoden). Oczywiście metody analityczne mają największe zastosowanie tam, gdzie istnieją podstawy do przypuszczenia pewnej prawidłowości badanego zjawiska. Tern też tłumaczy się ich wyłączne niemal stosowanie w naukach ścisłych w postaci t. z w. rachun­

ku wyrównania obserwacyj. Cechą charakte­

rystyczną metod analitycznych jest, że za­

kładając istnienie pewnej zależności anali­

tycznej wyrazów szeregu od cechy, grającej rolę zmiennej niezależnej, uzależniają one każdy wyraz szeregu wyrównanego od wszyst­

kich wyrazów szeregu surowego. W niniej­

szej pracy ograniczymy się do bardzo krót­

kiego omówienia tych metod, z powodów, które zostaną wyłuszczone na końcu części II.

D rugą grupę metod wyrównania stanowią metody, ograniczające się do formalnego wygładzenia nieregularności szeregu surowe­

go, odpowiadające więc drugiemu ujęciu zagadnienia. Metody te noszą nazwę mecha­

nicznych i najszersze zastosowanie znalazły w statystyce demograficznej, zwłaszcza przy badaniu wymieralności. Ograniczają one wpływ wzajemny wyrazów szeregu w yrów ­ nanego do kilku wyrazów sąsiednich i p r z e ­ ważnie wyznaczają każdy wyraz z osobna, ale przy pomocy regularnie się powtarzają­

cych działań i wzorów o stałych spółczyn- nikach.

Do trzeciej wreszcie grupy zaliczyć na­

leży bardziej nowoczesne metody, zajmujące do pewnego stopnia miejsce pośrednie po­

między analitycznemi i mechanicznemu Są Tó metody oparte na interpolacji1, narzuca­

jące na szereg pewną formę analityczną tylko w obrębie grupy z kilku wyrazów, przyczem forma ta nie jest wynikiem żadnych założeń co do istoty szeregu, lecz zastosowaniem

praw matematycznych o aproksymacji do­

wolnych funkcyj przez wyrażenia prostsze, w szczególności przez wielomiany.

Powyższe trzy grupy rachunkowych me­

tod wyrównania można nazwać klasycznemu Wyczerpują one zasadniczo zapas środków rachunkowych, stosowanych dotychczas w praktyce dla wyrównania szeregów. W cza­

sach nowszych obmyślono kilka nowych zupełnie metod, opartych na odmiennych zasadach. Do takich metod zaliczyć należy np. metodę W h i t t a k e r a 2, opartą na roz­

ważaniach zbliżonych do teorji Blaschke’go.

W hittaker zakłada, że szereg surowy jest szeregiem losowym, że prawdopodobieństwo zaobserwowania szeregu, którego wyrazy za­

warte są odpowiednio pomiędzy us i us + a, jest równe

h

j

h 2 . . . Ji N _ p N

(ł/O*

gdzie

F = h l2 (m1-m1)2 + /z2(«2-«2)2 + . . + htf(uN-uiv)2}

jeżeli przez us oznaczymy teoretyczne war­

tości wyrazów szeregu, zaś przez hs — do­

kładność każdej obserwacji (jest to prawo błędów Gauss’a); jednocześnie zakłada on, że prawdopodobieństwo szeregu maleje wraz z jego gładkością, mierzoną sumą kwadratów drugich różnic, według tego samego prawa.

Oznaczając tę ostatnią sumę przez S docho­

dzi on do wniosku, że najbardziej prawdo­

podobnym będzie szereg, dla którego w y ­ rażenie

F + ^ S

ma wartość najmniejszą. E jest tu parametrem dowolnym, zaś h—wspólną wartością miar dokładności hs (wymaga to osobnego założe­

nia /zŁ — h2 = . . = /zw). Rachunek jest dość skomplikowany, polega zasadniczo na po­

prowadzeniu paraboli II stopnia metodą naj-

I Podstaw owe zagadnienie m atem atycznej teorji inte rp o la c ji, ściśle związanej z r a c h u n k ie m ró żn ic skończonych, można s fo r m u ło ­ w ać w sposób n a stę p u jąc y : znam y w a r to ś c i pe w ne j funkcji / ( x ) dla n ie k tó r y c h wartości zm iennej niezależnej x , n p .d l a x = x , , x 2, . . . x n \ n ależy obliczyć p rzy o d pow ie dnic h założeniach f ( x ) dla dow olnej w a rtośc i x , z a w a rte j pomiędzy ja k ą ś p arą w a r to ś c i f oraz oszaco­

wać b łą d , t. zn. znaleźć m aksym alną w a r to ś ć ró żn ic y pom iędzy obliczoną a p ra w d z iw ą w a r to ś c ią funkcji (ta d ru g a część zadania stanow i n ie z b ę d n e u z u p e łn ien ie pierw szej; pom inięcie o sz ac o w an ia b łędu, często się z darzające w p rak ty c e, poz ba w ia w yniki w szelkiej w artości, gdyż uniem ożliwia zdanie sobie s p r a w y z ich do k ład n o śc i). N a js z e rz e j sto s o w an a j e s t inte rp o la c ja przy p om ocy w ie lo m ia n ó w posta c i

(Iq{— Cli % —{—#2 -j— • • —1~ Clk .

Jeżeli w a rto ś c i Xj tw o rz ą p o s tę p a r y tm e ty c z n y o różnicy h , — h , w ów czas p ro w a d z i ona do klasycznego wzoru New ton a

(2) f ( x ) = f ( x O + * - = ? A + K f ( X i ) + ■ ■ ;

Szczegółowo i bardzo p r z y s tę p n ie op rac o w an ą t e o r j ę interpolacji znaleść m ożna u S t e f f e n s e n ' a ( Interpolation) o raz W h i t ­ t a k e r a (C a lc u lu s o f O bservalions, ro zd z ia ły 1—IV). B e z p o ś re d n ie z a sto s o w a n ie w s ta ty s ty c e z n a jd u je in te r p o la c ja w w ypad k a c h , gdy zachodzi p o trz e b a o szacow ania w y r a z ó w szeregu sta ty sty c z n eg o , odpow iadających p o ś re d n im , n iesta b u la ry z o w a n y m w a rto śc io m cechy (np. jeżeli mając grupy 5-letnie wieku chcem y prze jść do grup rocznych, albo mając n o to w a n ia ja k ie g o ś zja w iska co p ew ien o d s tę p czasu, c hc em y obliczyć je dla m om entów p o ś re d n ic h pom iędzy n o to w a n ia m i). Szczegółow y opis o d pow ie dnic h m eto d rachunkow ych znaleźć m ożna w ro z p r a w ie K. P e a r s o n * a Ott the C onstruetion v f Tablcs a n d on In te rp o la tio n .

p The C alculus o f O bservalions, s ir . 303—315. Ob. w ykaz lit e r a tu r y na końcu.

(6)

mniejszych kwadratów (ob. niżej) i obliczaniu odpowiednich „poprawek“ przy pomocy różnic pomiędzy wyrazami surowenń a wyrównane­

mu Poprawki te zależą linjowo od dowolnego parametru e, powodując w ten sposób dużą elastyczność metody. Małe wartości e dają w wyniku szereg bardziej gładki, większe—

szereg bardziej zbliżony do surowego.

Zupełnie odmienną od metod klasycz­

nych, bo opartą na teorji korelacji, metodę wyrównania opracował j. F u h r i c h (Unter­

suchung Statistischer Reihen m it H ilfe der K or­

relat io ns theorie, Versicherungs wissenschaft­

liche Mitteilungen des Deutschen Vereins für Versicherungswesen in der Tchechoslovaki- schen Republik, 1 9 2 7, 5. Heft, str. 5 18 0).

Przy pomocy szeregu spółczynników kore­

lacji odgranicza on niejako zakres wpływu każdego wyrazu na wyrazy sąsiednie, obli­

cza wartości, jakie powinien by mieć każdy wyraz na zasadzie odpowiednich prostych regresji i za wyraz wyrównany uważa śre­

dnią z kilku podobnych wyznaczeń.

Obie metody powyższe, wymagające bar­

dzo uciążliwych rachunków, nie zostały uwzględnione w niniejszej pracy.

Odmienną znów metodę wyrównania sta­

nowi wyrównanie graficzne, polegające na odręcznem wygładzaniu wykresu, przedsta­

wiającego dany szereg. Przy dostatecznej wprawie rysownika i zachowaniu pewnych ostrożności (parokrotne wykonanie przez różnych rysowników niezależnie od siebie, zachowanie sumy szeregu przy pomocy po­

miarów planimetrycznych) daje ono często zupełnie dobre wyniki. W pracy niniejszej, poświęconej wyłącznie metodom rachunko­

wym, nie będziemy szczegółowiej omawiać tej metody.

3. Kryterja gładkości szeregu. Przeważna część niniejszej pracy poświęcona jest metodom mechanicznym i interpolacyjnym, czyli me­

todom, skierowanym w pierwszym rzędzie ku usunięciu nierówności i nieregularności szeregu, ku otrzymaniu szeregu „gładkiego“.

Należy więc przedewszystkiem postarać się sprecyzować intuicyjne pojęcie „gładkości“

lub regularności szeregu zarówno dla oceny potrzeby wyrównania jak i wyników jego.

O ile intuicyjna ocena danego szeregu jako

„gładkiego“ lub „niegładkiego“ jest rzeczą względnie łatwą, zwłaszcza przy przedsta­

wieniu graficznem, o tyle znalezienie objek- tywnego i racjonalnego kryterjurn gładkości jest trudne. Analogiczne pojęcia, zapożyczone z teorji krzywych płaskich ‘ (ciągłość krzy­

wizny, czyli zmian kierunku stycznej, brak

punktów kątowych, ciągłość zmian krzywizny, ograniczoność krzywizny), łatwo wyrażalne w terminach rachunku - różniczkowego, nie nadają się tu ze względu na nieciągłość, tkwiącą w samej naturze szeregu statystycz­

nego i niemożliwość nieograniczonego zbli­

żania do siebie punktów reprezentujących na wykresie jego wyrazy. Naturalnem wydaje się tu zastąpienie pochodnych przez różnice skończone (por. § 5 wzory (7) ) i szukanie kry te rj ów gładkości przy pomocy badania szeregów różnic kolejnych. Tak, np. W h i t - t a k e r przyjmuje za miarę „niegładkości“

(roughness) szeregu sumę kwadratów różnic III rzędu. Oczywiście lepiej jest badać sumę wartości bezwzględnych, gdyż suma kwadra­

tów nadaje zbyt wielką wagę pojedyńczym dużym wartościom; wprowadzenie tej ostat­

niej spowodowane jest, jak zwykle, większą łatwością operowania nią. Nasuwa się tu jednakże zarzut bardzo istotny: wielkości różnic nie stanowią jeszcze o gładkości sze­

regu. Najlepiej wyjaśni to przykład szeregu a, a2, a3... «” , . . . .

dla którego szereg k-tych różnic jest (a—1)*, a (a—1)*, a2 (a—1)*, . . . .;

jeżeli więc a >» 2, to szereg pierwszych róż­

nic ma wyrazy większe od wyrazów szeregu danego, szereg drugich różnic—jeszcze więk­

sze i t. d. Tymczasem szereg rozpatrywany jest oczywiście zupełnie gładki. Również i zachowanie stałego znaku przez kolejne różnice nie stanowi niezbędnego warunku gładkości, jak to widać na przykładzie sze­

regu wartości funkcji s in x lub cosx. Wydaje się, iż dopiero łączne uwzględnienie wiel­

kości różnic, ich znaków oraz regularności w rozkładzie tych ostatnich, może tu dopro­

wadzić do celu. Będziemy w dalszym ciągu dla określania gładkości szeregów stosowali schemat następujący: szereg będziemy uwa­

żali za gładki, jeżeli wyrazy kolejnych sze­

regów pierwszych, drugich, trzecich i t. d.

różnic są coraz mniejsze, zaś znaki tych wy­

razów mają rozkład regularny, t. zn. me ule­

gają zmianom częstym i bezładnym. Jest to warunek dostateczny ale, jak wspomnieliśmy wyżej, bynajmniej nie konieczny gładkości szeregu. W praktyce kryte rj um to wystarcza w zupełności. W większości szeregów róż­

nice dość wysokiego rzędu tworzą już szereg o znakach bezładnie rozmieszczonych; różni­

ce następnego rzędu są wówczas już znacznie większe. Im dalej musimy się posunąć przy obliczaniu różnic, aby dojść do takiego bez­

(7)

ładnego szeregu, tein gładszy jest szereg pierwotnie dany. Dopiero dla porównania gładkości dwóch szeregów, w których róż­

nice tego samego rzędu tworzą jeszcze sze­

reg o regularnych zmianach znaków, będzie­

my porównywać sumy wartości bezwzględ­

nych tych różnic. Oczywiście dla dwóch szeregów, znacznie się różniących co do liczby i wielkości wyrazów, trzeba wziąć przeciętną wartość różnicy w stosunku do sumy wyrazów lub średniej wartości jednego wyrazu.

4. Ocena skuteczności wyrównania. Ażeby wy­

równanie było skutecznem, szereg wyrównany musi spełniać dwa warunki zasadnicze: musi on być dostatecznie gładki, oraz dostatecznie mało różnić się od szeregu surowego. Te dwa warunki są oczywiście sprzeczne ze sobą, i cała trudność wyboru odpowiedniej metody wyrównania polega na każdorazowem odna­

lezieniu najbardziej racjonalnego kompromisu.

Gładkość szeregu wyrównanego oceniamy według wyżej omówionych zasad; naturalną miarą zgodności z szeregiem surowym jest suma wartości bezwzględnych różnic pomię­

dzy wyrazami obu szeregów, względnie suma kwadratów tych różnic, bardziej nadająca się do rachunku, lecz bardziej wrażliwa na od­

chylenia indywidualne. Obie sumy oczywiście trzeba porównywać z ogólną sumą wyrazów szeregu. Nie bez znaczenia jest też zwykła suma odchyleń, dająca zmianę ogólnej sumy szeregu, wywołaną przez wyrównanie.

Jeżeli wyrównanie wychodzi z założenia, że szereg jest losowy, wówczas ważniejszą jeszcze rolę odgrywa rozkład różnic według ich wielkości i znaków. Ponieważ różnice te mają w tym przypadku reprezentować błędy (odchylenia) przypadkowe, przeto najistot- niejszem staje się pytanie, czy stosują się one do prawa błędów. Teorję tę, która ma szcze­

gólne zastosowanie do wyrównania anali­

tycznego, rozwinął K. Pearson i jego szkoła1.

Gdy szereg dany zawiera znaczne błędy systematyczne, powyższe kryterjurn staje się bezwartościowem. Ale i kryterjum zgodności z szeregiem surowym traci wiele na swej wartości i skuteczność wyrównania ocenić można tylko indywidualnie w każdym kon­

kretnym przypadku, wprowadzając do rozwa­

żania naturę badanego zjawiska i korzystając z analogji z innemi szeregami o zbliżonej strukturze.

5. Oznaczenia. Zanim przejdziemy do wła­

ściwego przeglądu metod wyrównania, usta­

1 Obacz W P a l i a

limy szereg oznaczeń, symboli i skrótów, których używać będziemy w dalszym ciągu.

Pozwoli to uniknąć częstych powtórzeń i ułatwi usystematyzowanie wyników.

W yrazy szeregu danego, podlegającego wyrównaniu, oznaczać będziemy stale przez us, przyczem s przybierać będzie wartości

i, 2, __ , N . N oznacza więc liczbę wyra­

zów szeregu pierwotnego. Odpowiednie wy­

razy szeregu wyrównanego oznaczać będzie­

my przez vs ; jeżeli wyrównanie odbywa się w kilku stadjach (por. np. § § i3 i 1 9), wówczas vs oznaczać będzie zawsze wyrazy szeregu ostatecznie wyrównanego, wyrazy kolejno otrzymywanych szeregów pośrednich ozna­

czać będziemy odpowiednio przez vs , vs , v "

i t. d. (wskaźnik u góry oznacza więc kolej­

ność szeregu).

Przedstawiając dany szereg graficznie w prostokątnym układzie spółrzędnych za po­

mocą punktów o spółrzędnych x = s, y —us względnie vs, będziemy punkty te nazywali krótko punktami Us lub Vs . x będzie więc zawsze oznaczać wartości cechy, według któ­

rej szereg jest uporządkowany-, traktowanej jako cecha ciągła, s —wartości całkowite i do­

datnie tej cechy?.

Będziemy mieli w dalszym ciągu bardzo często do czynienia z grupami wyrazów na­

szego szeregu, najczęściej złożonemi z nie­

parzystej liczby wyrazów.

Dla grupy takiej

Us—n •) Us—«-(-i , . . . , Us—1 , Us , , . . .

którą oznaczać będziemy? przez „Gs {n wska­

zuje na to, że grupa składa się z 2 7 7 + 1 wyra­

zów, 5—że środkowym wyrazem jest us ), wprowadzimy następujące symbole:

(3) - i

u M o . Us-j-i — Us —„ *+ Us —w-J-i 1 • • * ! 77v_! „ t— —n

z ) * '= + »

„ M r;> = JE i us+i

i—+ n

„ M i‘> = . S i* us+i.

1=—n

Są to kolejne momenty rozpatrywanej grupy wyrazów względem x = s. Jeżeli nie będzie obawy co do nieporozumień, będziemy opuszczać lewy wskaźnik u dołu, wskazujący' liczbę wyrazów grupy oraz prawy górny, oznaczający kolejny numer grupy.

Często będziemy wprowadzać dla grupy?

Gs pewne funkcje i odpowiadające im krzy­

fI

E l d c r t o n, Frequettry C urves a nd C orrclaiiont ro zd z ia ł X I .

(8)

we; dla otrzymania równań tych krzywych przenosić będziemy początek układu spół- rzędnych do punktu ;c = s, y — o i nową od­

ciętą oznaczać będziemy przez

Z s = X — s ,

opuszczając wskaźnik s, o ile to nie nastrę­

czy powodu do nieporozumienia.

Kolejnym wyrazom grupy „Gs odpowia­

dają wówczas wartości

Z = --- 77, ----1i~\~ I , . . . ) I , Oj d ~ I J . . . “I“ VI.

Często potrzebne nam będą również sumy potęg kolejnych liczb naturalnych

(4)

z (:>=

oraz

(5)

=

-S?'; : S{”; :

2W + i ;

S x o X = — M

1 "

r=—wa:2

_ *=+» , _ 2 jeżeli & jest parzyste

*=—« O „ £ jest nieparzyste Sumy — a więc i S*'y — dla małych wartości w i £ można obliczyć bezpośrednio;

dla dowolnych wartości można korzystać ze wzorów rachunku różnic skończonych1 albo ze specjalnie obliczonych tablic2.

Będziemy również używali obok M („s) odmiennego nieco systemu znakowania dla zwykłych sum wyrazów, zawartych w gru­

pie nGs , w wypadkach, gdy będziemy się posługiwali t. z w. sumami iterowanemi. Sumę M (o \ a więc

Ms—n -f- Ms—n+i -j- • • • d~ Mn d~ • • • ~f" Us+n

będziemy oznaczali symbolem + ; sumę nieparzystej liczby takich sum

3M+/ v2»+* 2,,+i v2«+/ , v»”+' , s .+ S x + • • + S + vs + 2s+, +

+ •• + 2S + W2 M + I

będziemy oznaczali symbolem Es +/’ ' ”,+/ ; podobnież sumę nieparzystej liczby, tip. 2^ + 1, tych sum podwójnych, taką, że + ' ’”+/

zajmuje miejsce środkowe, oznaczać będzie-

, i V J ” + Z' ,

my symbolem l s 1 t. d.

Tak więc,

yź * /» 7* S

oznacza wyrażenie otrzymane w sposób na­

stępujący: tworzymy sumy zawierające po 3 kolejne wyrazy szeregu

ms—j d~ u$ T tis-j-/;

następnie kolejne sumy tych sum po 5, sumy sum podwójnych po 7, sumy tych ostatnich znów po 3; każda taka suma czterokrotna zawiera, jak łatwo sprawdzić, piętnaście ko ­ lejnych wyrazów szeregu pierwotnego, grupę i j Gs ; wskaźnik dolny s odpowiada wyrazowi środkowemu tej grupy. Ogólnie biorąc, suma

V r 1 ) r 2 ) • • • ) Zj

s

gdzie rx, r2, . . . , rn są liczbami niepa- rzystemi, jest funkcją linjową kolejnych (r i + r 2 + • • + r» + i — n) wyrazów szeregu, z których us jest środkowym, przyczem spół- czynniki wyrazów równoodległych są równe:

(6) »r t . • • • »>» — Us 4 - ü j ( M s+ / 4 - Ms_ z) 4 .

4 " • • • ~ł~ dk (lis—k ~ł~ Ms-\-k) >

1 . 7 t'i -f- T2 T- • • d” V u — VI

gdzie k = — !———-—* ; warto zauwa­

żyć, że ak są liczbami całkowi- temi i dodatniemi.

Podobne sumy oczywiście można tworzyć również i dla grup o parzystej liczbie wyra­

zów. Ponieważ jednak wszystkie mechanicz­

ne metody wyrównania operują wzorami sy- metrycznemi względem us , będziemy rozpa­

trywać tylko takie sumy o parzystej liczbie wyrazów, które w ostatecznym wyniku speł­

niają warunki, wyrażone wzorem (6); w tym celu należy przestrzegać, aby liczba sumo­

wań parzystych była zawsze parzysta, np.

= (iis- 2 + «*_, + Us. + us+I) +

+

( l i s — 1

+

l i s .

+

U s + I

+

U s + 3) .

Będziemy również niekiedy zwracali uwagę nie na środkowy, lecz na pierwszy wyraz

1 P o r . np. S t e f f e n s c n , 1. c., s tr . 87 > 124.

2 P e a r s o n , Tables f o r S fa lis tie ia n s a n d B io m e tric ia n s, tabi. X X V III, s tr . 40 i 41.

(9)

sumy, co będziemy odróżniali przy pomocy symbolu

Y (s)

-k l i s . -j~ U$-\-i • • ~j~ Ms-\-k—i.

Dla takich sum zachodzi oczywiście związek

A . = Ms+/fc

W wielu przypadkach będziemy spotykać t. z w. różnice skończone, określone przy pomocy wzorów

(7)

A Ug Wj ,

A -- A A Mj llgĄ-2 2Mj I Us—j ,

A

A kUs = A — A =

= J ) U s + k - I + ( J ) U g + k-2 --- + Ug ,

™ i 7 ; r / * \ k ( k — l ) ( k —2) . . . ( k — i + l ) ___ [k]i

gdzie t , ) — n _ 3. — .•/ • Czasami używać będziemy też symboli A\us dla oznaczenia różnic, dotyczących powięk­

szonych przedziałów

vs

(«)

i t. d.

I I . M e t o d y a n a l i t y c z n e

Podstawowe założenie tych metod można sformułować jak następuje*, zakłada się, że szereg wyrównany jest szeregiem wartości pewnej funkcji, zależnej od n parametrów nieznanych

( 0 TJg f ( s , Cl o d / , • • • , —/ )

przyczem kształt funkcji f (s) jest a priori znany; zadanie polega na wyznaczeniu sta­

łych a0y alt . . . , a„-t. Oczywiście n musi być mniejsze od iV, inaczej niema żadnego w y ­ równania.

6. Metoda najmniejszych kwadratów. Jest to me­

toda najbardziej klasyczna, której początki sięgają G a u s s a i L a p l a c e ’a i która ma szczególnie szerokie zastosowanie w naukach ścisłych zwłaszcza astronomji i geodezji, przy wyrównywaniu obserwacyj. Mniej lub więcej szczegółowy jej wykład znaleźć można w każdym podręczniku teorji prawdopodobień­

stwa lub jednej z wyżej wspomnianych nauk.

Stosuje ona najbardziej naturalny sposób wyboru stałych a,, wyznacza je mianowicie tak, aby uzyskać możliwie najlepszą zgodność z szeregiem surowym. Jako kryterjurn tej

zgodności przyjmuje się sumę kwadratów odchyleń. Przemawiają tu za tern kryterjum nietylko względy rachunkowe (por. § 4), lecz również związek z t. zw. prawem błę­

dów Gauss’a—Laplace’a. Można mianowicie udowodnić, że jeżeli szereg jest losowym i odchylenia rzeczywistej wartości każdego wyrazu od jego wartości teoretycznej (na­

dziei matematycznej) podlegają prawu błę­

dów, wówczas z pośród wszystkich możli­

wych funkcyj postaci (1) z największem prawdopodobieństwem odtwarza teoretyczny przebieg szeregu właśnie funkcja, wyznaczo­

na tą metodą. Ten właśnie wzgląd tłumaczy stosowanie metody najmniejszych kwadratów do wyrównywania obserwacyj, obarczonych błędami przypadkowemi, jak pomiary fizycz­

ne i astronomiczne.

Stałe a0, ax . . . , aM- T wyznacza się więc z warunku

(2)

N

S (usvs )2 = minimum.

S — l

Uwzględniając wzór (1) mamy jako wa­

runki konieczne minimum równania N

s ~ i d f

d a n \ttg f ( s , G0 , . . . , Uff—/ ) ] o

N d j

(3) \ \us f (5, G0 , . . . , G,t—/) ] -- O

s = z 1

N d f

^ da f (^1G0 y . . . j Gm—j) j o

S _ r

Przy dość ogólnych założeniach, dotyczą­

cych 'natury analitycznej funkcji f (s), rów­

nania te dają się rozwiązać względem nie­

wiadomych a0, aly . . . a,u Otrzymane wartości podstawiamy do wzoru (1), i pozostaje tylko obliczyć wartości tak otrzymanej funkcji dla

S I y • • • ) W*

Rachunek konkretny kształtuje się szcze­

gólnie prosto, jeżeli f (s, <z0 , . . . , g„) jest funkcją linjową parametrów g,

n

Vs G{ fi (s) .

(4)

Równania (3) są wówczas również łinjowe względem <7, , mianowicie

a° s Ł f° (s) + az ^ / , ( s ) fj (s) +

( 5 ) N ' N

+ . . . + 0» J 7 /« (s)/y (s) — Ug fj (5)

( j —— 7» 2, . . . , it).

(10)

i dają się odrazu rozwiązać przy pomocy wzorów

D i

(6) Cli D

gdzie D oznacza wyznacznik, utworzony ze spółczynników przy zaś Di — tenże wy­

znacznik, w którym i —ta kolumna została zastąpiona przez wyrazy, znajdujące się po prawej stronie wzorów (5). W szczególności, jeżeli f (s) jest wielomianem stopnia n

f (5) = aQ + at s + . . . + an s”

otrzymamy, zachowując oznaczenia § 5, N , ^ ’ , y(lf)

* •) y (N) (?a) D =

£->1 ,y Ł->2 ,y (N) y W

^•3 > • ♦ •) z S U 7 (N)

S-^n j Z ^ j Z < P • • > y(N)

^an

Mo, y m

1 ) ^ 2 y 0V)j • • • ł y (AV (7b) D0 = M , , y ^ y (N)

• • y z < $ M„, z (Z> Z (P • • » y<K) ( 7 (N)

i y M„, y m

'■^2 , • * • 1 7 (N) (7C) D , =

7 (N)

•^2 , M ,, y W '^ 3 > • * Z%>

y n t M„, Z^P^nĄ-a y • • • > 7 W i tak dalej. Zanotujemy tu, ze wz ględu

(8)

późniejsze zastosowania, ostateczną postać wzorów dla n = i (linja prosta),

/ W = &o + 5, Mamy, z uwagi na

7 ( N ) N ( N + \ ) 7 ( N ) N ( N + \ ) ( 2 N + \ )

2 » 2 6

( 8 )

ar (2vV-f~l) Mq— 3 M x N { N - \ ) - (AM -l) M ,+ 2 Mi

Ar(iV2—1)

Jeżeli N j est liczbą nieparzystą, N —2 N '+ 1, wzory upraszczają się znacznie, jeżeli zastą­

pimy s przez t = s — N ' ; t wówczas zmienia się od —N ' do + N ', we wzorach (7 ) trzeba zastąpić Z,• przez S,- , co znacznie je upraszcza,

gdyż Ą O.

(8a) a*

Mamy wówczas dla linji prostej

M '

2yv/0-f-l j e d n i a wartość wyrazu szeregu)

3 M /

M / _____________________________________

S 2.v' (2/V '-j-l) (2A ' - f 2) (4Av+ 3 ) .

(Mz, są to momenty względem t = o ). Po­

dobnież dla paraboli drugiego stopnia f ( s ) — a0 + aA s + a2 s2

otrzymujemy łatwe do rozwiązania równania (2vVz+ i ) a0 + S 2n> a2 M '

(9) S 2a ' a0 + 5 4a ' a2 = M'.

M x

Powyższe wzory znajdują szerokie zasto­

sowanie przy wyznaczaniu trendów linjowych i parabolicznych, linij regresji i t. d,

Jeżeli f (s) nie jest funkcją linj ową para­

metrów a,, wówczas rozwiązanie liczbowe równań (3) staje się o wiele trudniejsze.

Stosuje się wówczas skomplikowane i wy­

magające długich rachunków metody przy­

bliżeń kolejnych, albo specjalnie dostoso­

wane metody. Takie specjalne metody opra­

cowano np. dla wyznaczenia stałych we wzorze G o m p e r t z - M a k e h a m a .

f ( x ) — k s x g c x

używanego z powodzeniem przy wyrówny­

waniu tablic wymieralności2.

Metoda najmniejszych kwadratów jest szczególnie odpowiednia w wypadkach, gdy znamy a priori kształt funkcji f (s) bądź to na mocy dedukcji teoretycznej, jak w obser­

wacjach astronomicznych lub pomiarach ge- odetycznych, bądź też z poprzedniego do­

świadczenia, jak dla wzoru G o m p e r t z - M a k e h a m a . Służy ona wtedy jednakże nie tyle do wyrównania szeregu, ile do ekspe­

rymentalnego sprawdzenia teorji, na której dedukcja była opartą, lub do wyznaczenia stałych, mających jakieś znaczenie istotne.

Z teoretycznego punktu widzenia pozwala ona odtworzyć każdy szereg z dowolnie wielką dokładnością, za cenę powiększenia liczby parametrów a, ; jest jednak rzeczą jasną, że na tej drodze szybko utraci się wszelką możność zorjentowania się w naturze szeregu. W praktyce stosowalność metody do danego szeregu uzależniona jest od mo­

żliwości znalezienia odpowiedniej funkcji f f s )

N

V lis

s— i

s Por. np. G. R o s m a 11 i t h. M ath em a tisch e S ta tis tik ■ ilcr l'r r s o iie m c r siehe i tn ;g , sir. 8456.

1 M i oznacza tu «-ty moment szeregu surowego względem .rrrro, M i

(11)

o względnie niewielkiej liczbie parametrów, któraby dała dostatecznie dobre przybliżenie.

Od dawna starano się ustalić pewien „uni­

wersalny“ system funkcyj, któryby czynił zadość tym warunkom dla dowolnego szeregu.

Jednym z takich systemów jest wyżej omó­

wiony system parabol (wielomianów). Jest on jednakże mało elastyczny i przy niewiel­

kiej liczbie parametrów rzadko kiedy daje wyniki zadawalniaja.ee. O innych takich syste­

mach, częściowo lub całkowicie związanych z metodą momentów, będzie mowa niżej.

Jeżeli idzie o szeregi silnie nieregularne, metoda najmniejszych kwadratów w jej po­

staci klasycznej najczęściej zawodzi, gdyż albo daje zbyt słabą zgodność, albo, naod- wrót, zbyt wiernie otwarza wszystkie waha­

nia, zaokrąglając je tylko. W szczególności do szeregów klasyfikowanych według wieku nie jest prawie nigdy stosowaną, zwłaszcza ze względu na brak teoretycznych form ta­

kich szeregów l.

7. Metoda momentów. Teoretyczną podstawą jest tu twierdzenie matematyczne, orzekające, iż każda funkcja ciągła i posiadająca skoń­

czone momenty wszystkich rzędów

+CN3 +CO

1¼ J~ f fö) dx > — J x f { x ) d x ,

—oo —co

-f-oo -j-co

{12 = J X2 / ( % ) ą „ = J x Hf ( x ) dx, .. .

—OO CO

jest, przy spełnieniu pewnych założeń do­

datkowych, całkowicie i jednoznacznie przez układ tych momentów wyznaczona. Stąd nasuwa się myśl, że każdą funkcję, mającą n pierwszych momentów takich samych, jak funkcja f ( x ) , można do pewnego stopnia uważać za aproksymację tej ostatniej. Dalszem rozwinięciem tej myśli, w zastosowaniu do wyrównania analitycznego, będzie wyzna­

czanie stałych a0, al , . . . , a„ we wzorze (i) przy pomocy warunku, aby w- f z pierwszych momentów funkcji f (x), będących oczywiście funkcjami parametrów ait były równe odpo­

wiednim momentom szeregu surowego, czyli z równań

1¼ K ) »• • • i ) — M0

( l o ) P"1 (« 0 i * ł flrt )

\x„ (a0, a,,) — M„

Oczywiście momenty można równie dobrze obliczać nie względem x = o , lecz względem innej, rachunkowo bardziej dogodnej war­

tości x. Jest rzeczą godną uwagi, że dla wielomianów metoda momentów prowadzi do tych samych wzorów, co i metoda naj­

mniejszych kwadratów.

Metoda momentów została szeroko roz­

budowana przez K. P e a r s o n a, który skon­

struował układ funkcyj, odpowiadających najważniejszym typom szeregów statystycz­

nych i szczegółowo opracował odpowiednie metody rachunkow e2. System Pearsona cie­

szy się wielkiem uznaniem pośród statysty­

ków angielskich, posiada jednakże szereg wad, utrudniających jego stosowalność. Prze- dewszystkiem jest on zbyt mało elastyczny.

Stosowane w praktyce krzywe Pearsona zawierają 4 albo 5 parametrów (momenty do '4 3 lub \±4 włącznie); dalej posunąć się jest niezmiernie trudno, gdyż z jednej strony wzory stałyby się niesłychanie skomplikowane, z drugiej zaś—wpływ skrajnych wyrazów szeregu, o niewielkich liczebnościach i naj­

bardziej podlegających wahaniom przypad­

kowym, na wartość momentów M,- rośnie bardzo szybko wraz z rzędem momentu, wobec czego wartości momentów surowych są coraz mniej pewne. Zarzut ten dotyczy zresztą już momentów trzeciego i czwartego rzędu, których wartości w szeregach o znacz­

nej liczbie wyrazów są dość niepewne. P o ­ woduje to często bardzo mierną zgodność szeregu wyrównanego z surowym. W związku z przymusowem ograniczeniem się do mo­

mentów IV rzędu najwyżej, wszystkie krzywe Pearsona posiadają jedno maximum albo jedno minimum (nie licząc końców szeregu), wobec czego zasadniczo nadają się tylko do przedstawienia szeregów t. zw. unimodalnych.

Niekorzystną wreszcie cechą metody Pearsona jest duża uciążliwość wymaganych przez nią

rachunków.

Za dodatnią cechę metody momentów w ogóle uważać należy, źe operuje ona wiel­

kościami, mającemi doniosłe znaczenie dla badania szeregu z punktu widzenia statystyki teoretycznej: moment zerowego rzędu jest sumą wyrazów szeregu, moment pierwszego rzędu daje średnią wartość cechy x, moment II rzędu—dyspersję, moment III rzędu—tak zwany „eksces" szeregu, moment IV rzędu—

1 Ciekaw ą próbą ustalenia teo re ty c z n e j postaci ro z k ła d u ludnośc i w e d łu g w ie k u są prace A. J . L o t k i (P h y sic a t B io lo g y i inne).

Rozpatrując ludność t. zw. stateczną, czyli taką, k tó r e j r o z k ła d w e d łu g w ie k u nie zależy od czasu, o trzym uje on dla niej w z ó r

c (a) — b e~ra p (a)

gdzie c (a ) da oznacza ilość osób w w ie k u (a , a + da ), p (a ) — ilość d o ż yw ających do w ie k u a (według tablicy w y m iera ln o śc i), r —p r z y ­ ro s t n a tu ra ln y na je d n o s tk ę ludności, b — ilość u rodzeń n a je d n o s tk ę , p (a) j e s t w tym w z orz e d o w o ln e . W s k a z a n y ro z k ła d ludnośc i w e d łu g wieku je s t ró w n ie ż s ta ły . t. zn., źe o ile w y o b ra z im y so b ie p o p u lac ję izolow aną, w k tó re j r o z k ła d ten z o s ta ł zak łó c o n y p rzez ja k iś kataklizm (w o jn a , cpidem ja), to p rzy założeniu niezmienności płodności i u m ie ra ln o ś c i z o sta n ie on po w zględnie któtkim czasie

spontanicznie przyw rócony.

2 P o r . W . P a l i ń E l d e r t o n , F requeney C urves a n d C orrelaiion.

(12)

jego „skośność“ i t. cl. Z tego względu na spe­

cjalną uwagę zasługują układy funkcyj, dla których obydwie metody (momentów i naj­

mniejszych kwadratów) prowadzą do tych samych wyników. Pierwszym przykładem takiego systemu funkcyj są omawiane wyżej wielomiany. Drugim przykładem jest t. z w.

szereg C h a r l i e r a, (nazywany również sze­

regiem B r u n s a lub G r a m a ) .

Opiera się on na twierdzeniu, że każda funkcja ciągła, posiadająca ciągłe pochodne I i II rzędu, daje się przedstawić dla wszyst­

kich wartości a w postaci szeregu zbieżnego

oo

S a cpi (x) t—o

I **

gdzie cp0 (x) oznacza funkcję 2 zw- prawo błędów G a u s s a - L a p l a c e’a), zaś (p,: (x) — kolejne pochodne tej funkcji. Wynika stąd naturalna myśl aproksymacji dowolnej funkcji f ( x ) przy pomocy sum skończonych postaci

n

% c, ?, W

l —O

Jeżeli spółczynniki c, wyznaczać metodą najmniejszych kwadratów, posiadają one na­

stępujące ważne własności: i° wartości ich nie zależą od n, to znaczy, że o ile chcemy uwzględnić dalsze wyrazy rozwinięcia, nie zmienia to w niczem poprzednio obliczonych.

Okoliczność ta stanowi ogromne ułatwienie teoretyczne i praktyczne. Zupełnie przeciw­

nie rzecz się ma dla wielomianów, w których wzory dla każdego spółczynnika zależą od wszystkich pozostałych. 2° — wartości spół- czynników są te same, co i według metody momentów, wyrażają się więc przy pomocy tych ostatnich. Obierając jako początek układu średnią wartość x, jako jednostkę—

średnie odchylenie kwadratowe, otrzymujemy mianowicie

f ( x ) = Af0 % (x) + M»~Ml ę3 (x) +

Szczegółowo opracowaną teorję wzoru

( i i ) i zastosowania jej do wyrównania sze­

regów znaleźć można w dziełach A. F i s h e r ’a (Ob. wykaz literatury na końcu).

8. Zastosowanie metod analitycznych do szeregów demograficznych. Jak wynika z powyższych uwag, metody analityczne nie najlepiej się do tych szeregów dają zastosować, nawet jeżeli szereg surowy nie jest obarczony błę­

dami systematycznemu W tym ostatnim przy­

padku stosowanie metod analitycznych może

doprowadzić do poważnych błędów. W rzeczy samej, przy obliczaniu momentów wyższych rzędów dla szeregu ludnościowego, zaokrąg­

lenia na zerach i piątkach, coraz silniejsze w miarę zwiększania się wieku, mogą zu­

pełnie wypaczyć obraz. Jeżeli zaś obliczać będziemy momenty w sposób skrócony—

pięcio-lub dziesięcioletniemi grupami, toprzc- dewszystkiem trzeba wprowadzić poprawki grupowe (typu S h e p p a r d a naprzykład), bardzo wątpliwej wartości w tym przypadku, następnie zaś—odstępujemy od podstawowej zasady metod analitycznych uwzględnienia wszystkich wyrazów szeregu.

Lecz nawet dla szeregów względnie słabo zniekształconych, metody analityczne w po­

staci klasycznej dają wyniki niedostateczne.

Jedyny wyjątek stanowi wzór M a k e h a m a . Dla innych szeregów próbowano rozszerzyć metody poprzednio omówione przez stoso­

wanie kilku rozmaitych funkcyj, rozbijanie szeregu na części i t. d. K. P e a r s o n 1

przedstawił, naprzykład, szereg zgonów we­

dług wieku (ale wzięty z tablicy wymieral- ności, czyli uprzednio wyrównany!), w po­

staci sumy pięciu składników—funkcyj, na­

leżących do wspomnianego w § 7 układu.

A. F i s h e r2 w podobny sposób zbudował tablicę wymięralności, opierając się na da­

nych surowych i przedstawiając szereg zgo­

nów jako sumę 8 składników postaci (1 1);

w odróżnienie od Pearsona użył on jednak­

że nie formalnego sposobu rozbicia szeregu, lecz skorzystał z danych co do przyczyn zgonów, budując osobny szereg dla zgonów, spowodowanych chorobami dziecięcemi, osob­

ny dla zgonów z przyczyn typowych dla wieku starczego i t. d. T ak skomplikowane metody dają oczywiście dość dobre wyniki, wymagają jednakże olbrzymiego nakładu pracy rachunkowej. Tak naprzykład, F i s h e r (/. r., str. 1 9 8) powiada, że obliczenie tablicy wymieralności jego metodą w ymagało pracy

2 rachmistrzów w ciągu 7 0 — 7 5 godzin.

To samo powiedzieć należy o metodzie, stosowanej do wyrównania austrjackich tablic wymieralności przez B 1 a s c h k e’g o 3. W y ­ równanie to odbywało się w trzech stadjach (wyrównywano szereg prawdopodobieństw zgonu). Najpierw wyrównano zaokrąglenia na zerach i piątkach przy pomocy bardzo prostego wzoru

“- i + " o + “i . 2(«-i +"o + "i)

3 X Chances o f D eaih.

2 F rcquency C urves, part II: H u m a n D eaih C u rre s.

3 D ie A u s g le ic h u n g von A b s ie r b to r d n u n g tn a u s d e r B e v ö lk e r u n g s s ta tis tik .

Cytaty

Powiązane dokumenty

[r]

Dans la balance de 1925 une circonstance favorable pour la Pologne attire surtout notre attention: c ’est que, si l ’on ne tient pas compte de recettes et de dépenses à titre

kich tych powiatach słabo jest rozwinięty przemysł spożywczy za wyjątkiem powiatu Starogard, który w przemyśle spożywczym zatrudnia 920 robotników, z tego jednak

Nie włączając pomagających członków rodziny zgóry do osób czynnych zawodowo, Belgja, Czechosłowacja i Estonia stawiaja ją jednocześnie poza nawiasem podziału według

ności, k tóra w stosunku do ludności osiąga poziom znacznie niższy, aniżeli przed w ojną. N ie należy jednak wyprowadzać stąd daleko idących wniosków i poszukiwać

Przywłaszczenie lub roztrwonienie znalezionej cudzej jylasności. Przyw łaszczenie p ow ierzon ej cudzej własności. Kradzież przy obciążających okolicznościach. ; Inne

Tak pojęty obszar wyżyny Małopolskiej przedstawia się pod względem wielkości, gęstości i rozmieszczenia osiedli nieomal zupełnie jednolicie. Pierwsza wybitna

przednich, w danym razie w szczególności roku 1980 do 1929. Na ścisłość określenia tego stosunku wpływa: 1) ścisłość określenia analogicznego stosunku w powierzchni upraw,