K W A R T A L N I K S T A T Y S T Y C Z N Y
ROK 1931, TOM V I I I , ZE SZ Y T 4
REVUE TRIMESTRIELLE DE S T A T I S T I Q U E
ANNEE 1931, TOM E VIII, FASCICULE 4
AL. RAJ OHM AN
O niektórycli RryterjacH przypadkowości
(„Prawo wielkich lic z b “ i jego z a o s tr z e n ie w ujęciu staty sty ezn em )
U podstawy naszego badania leży do
mniemanie, że rozważana cecha jest przy
padkową, że pojawia się z pewnem s t a ł e m n i e w i a d o m e m p r a w d o p o d o b i e ń s t w e m p.
Zakładamy wzajemną niezależność każdej pary obserwacyj, co nie oznacza zresztą by
najmniej niezależności obserwacyj w ogóle (jeżeli naprzykład założymy, że prawdopo
dobieństwo pojawienia się rozważanej cechy u indywiduum numer i jest w każdym razie p i podobnie u indywiduum numer 2, zaś u indywiduum numer 3 owo prawdopodo
bieństwo wynosi: / , jeżeli wspomniana cecha istnieje i u numeru 1 i u n-ru 2, P (2-p) 1. U podstawy wszelkiego opracowania
materjału statystycznego leży pewne m i n i m u m powziętych zgóry założeń teoretycz
nych. Im bardziej świadome są te założenia, im jaśniej i dobitniej wysłowione—tern lepiej dla statystyka, który wszak zacząć musi od stwierdzenia: c z y e m p i r y c z n y m a- t e r j a ł n i e k ł ó c i s i ę z p o w z i ę t e m z g ó r y z a ł o ż e n i e m , czy dany schemat przypadkowości „pasuje“. Zarówno formalne opracowanie apriorycznych założeń statysty
ka, jak i ich krytyka rachunkowa na podstawie empirycznego materjału statystycznego to właściwie już zakres pracy m a t e m a t y k a . Tradycyjne sformułowania klasyków, prze
pisywane z podręcznika do podręcznika, nie zastąpią tu żywej pracy matematyka, który musi umieć przetłumaczyć na język statysty
ki każdy postęp teorji prawdopodobieństwa, który musi umieć wyciągnąć sprawdzalne rachunkowo nierówności o praktycznie skoń
czonej liczbie wyrazów z ogólnych tw ier
dzeń o mniej czy więcej zawiłych przejściach do granicy.
2. Przyjrzyjmy się zbliska najprostszemu z zadań statystycznych: wyznaczaniu niewia
domego stałego prawdopodobieństwa. Dla ustalenia uwagi przypuśćmy, że poszukujemy prawdopodobieństwa pewnej cechy, która może być tylko obecną, lub nieobecną, przy- czem nie stawiamy wcale sprawy ewentual
nie różnego natężenia tej cechy. (Przykład:
stwierdzanie płci noworodka). Wyobraźmy sobie, żeśmy zbadali pewną liczbę indywi
duów, które oznaczyliśmy numerami:
I, 2, 3, ... /V
każdemu z tych zbadanych indywiduów przy
pisaliśmy spółczynnik liczbowy: z e r o lub j e d e n .
i By rzecz postawić ściśle na grancie rachunku prawdopodobieństwa, wystarczy założyć, że prawdopodobieństwo nierówności
(l <Z f <Z b mierzy się różnicą: b—a (lub pozornie mniej, że nierówności: M <Z t <Z b i C < Z t <C ^ są równie prawdopodobne wtedy i tylko w tedy, gdy b— O — d—C).
2 ( I - / 9
przy nieobecności wspomnianej cechy u n-ru 1 i obecności u n-ru 2, takąż wartość przy obecności tej cechy u n-ru 1 i nieobecności u n-ru 2, wreszcie prawdopodobieństwo p jeżeli nic nie zakładać o indywiduach numery 1 i 2—w tych warunkach mamy niezależność cech indywiduum nr. 3 od cech indywiduów nr. 1 i 2 oddzielnie branych, lecz zależność od pary indywiduów 1 i 2.
W trącona przez nas uwaga nawiasowa nie jest istotna dla dalszego ciągu. Istotnym natomiast jest schemat aprioryczny, z którego korzystamy. Przystępujemy do zdefinjowania tego schematu.
3. Posiadanie, czy nie posiadanie rozwa
żanej cechy przez każde z N zbadanych indywiduów uważamy za zjawisko przypad
kowe. Matematycznie możemy to tak ująć:
z każdym ze wspomnianych N indywiduów kojarzymy pewną funkcję zmiennej rzeczy
wistej t, określonej w przedziale (o— i ) 1.
Funkcję tę nazywamy <]>* (t) (dla k-go indy-
Kwąrtąlnik Statystyczny, l%t. 54
widuum); funkcja ta przybiera tylko wartości z e r o i j e d e n .
W arun ki stałego prawdopodobieństwa po
jawiania się danej cechy i warunek nieza
leżności pojawiania się rozważanej cechy u każdych dwóch różnych indywiduów wy
rażają się wzorami następującemu
(1)
J
(t) dt = p (przy wszelkiem k)O
I I I
(2)
J‘
ł* (t)tyi (t) d t - J * ( t ) d t . f 6i (ł)d t= p 2O o o
(przy k /).
Ciąg empirycznie dany zer i jedynek (ciąg uwidoczniający, które ze zbadanych N indy
widuów posiada cechę rozważaną, a które nie) uważamy za ciąg postaci
(3) * ł \ ( t ) , ^ ( t ) . - - ^ N ( t )
przy pewnej wartości zmiennej t.
Jeżeli t nie należy do pewnego zbioru wyjątkowego, t. j. jeżeli punkt o odciętej t nie należy do żadnego z pewnych odcinków wyjątkowych o łącznej długości bardzo małej, to ciąg typu (3) musi posiadać pewne wła
sności liczbowe, stanowiące w danym razie
„kryterja przypadkowości“.
4. „ K r y t e r j a p r z y p a d k o w o ś c i " , o których tu mówimy, są w istocie sprecy- zowanemi wysłowieniami pewnych twierdzeń matematycznych. Sformułowania sprecyzo
wane to znaczy—mimowoli—sformułowania nieco zamaskowane. Najlepiej więc będzie, jeżeli zaczniemy od podania zwykłych sfor
mułowań twierdzeń, o które tu idzie, a na
stępnie dopiero sformułowania te przekształ
cimy odpowiednio do naszych potrzeb.
Owe twierdzenia to „zwykłe" i „zaostrzo
n e “ prawa wielkich liczb—w najogólniejszym przypadku — jeżeli nie chcemy rozszerzać naszego minimum powziętych zgóry hypotez.
W najogólniejszym przypadku prawo wielkich liczb—to twierdzenia o układach ortogonalnych.
Niech
(4) tPi ( t ) » (p2 ( t )
będzie ciągiem unormowanych funkcyj orto
gonalnych, t. j. funkcyj spełniających warunki:
i
(5) J yk (ł) cp7 (/; dt — o dla k ^ l
(6)
1
j yl(t) d ł — i dla wszelkiego k
Z w y k ł e prawo wielkich liczb jest bez
pośrednim wnioskiem z niemal oczywistej tożsamości następującej:
(7)
skad
J ( i
<p* (t) dł — n(8)
n
k — ti k — IZ
dt i
71
(9)
Do dalszych sformułowań potrzebne jest nam pojęcie m i a r y z b i o r u . Nie wpro
wadzając żadnych nowych założeń, specjali
zując jedynie—co nam wolno—użyte przez nas matematyczne odwzorowanie założeń (stałego prawdopodobieństwa i niezależności spostrze
żeń parami) możemy założyć, że każda z funkcyj <p* (t) ma tylko conajwyżej skoń
czoną liczbę punktów nieciągłości i że—dla każdej z funkcyj <p* (t) — przedział wartości t (o—1) podzielony został na skończoną liczbę przedziałów, wewnątrz każdego, z których (p* (t) jest stałą.
Przy powyższych założeniach zbiór war
tości t określony przez każdy ze związków poniższych:
(t)— a ; \<?k(t)I — a ; (p* (t)C a ; | yk (t) \<.a
<?k ( t ) > a; I cp* (t) \>a ; | (t) \< a ; | (t) \>a składa się oczywiście ze skończonej liczby przedziałów odcinka (o— 1) plus ewentualnie skończona liczba punktów. T o s a m o m o ż n a p o w i e d z i e ć o z w i ą z k a c h o g ó l n i e j s z y c h , k t ó r e o t r z y m u j e m y z a s t ę p u j ą c w (9) <?k (t) p r z e z „ k o m b i n a c j ę l i n j o w ą " w i e l k o ś c i cpA (t) t. j. p rz e z wyrażenia postaci następującej:
(10)
y x(t) + A 2 <?2(t) + . . .+ A k <p* (t) + .. Ar A n f(t) A l} A 2 . . . A n oznaczają tu jakiekolwiek stałe.
Możemy teraz zdefinjować pojęcie „ m i a r a z b i o r u " . Miarą odcinka nazywamy jego długość, za miarę punktu oraz zbioru złożo
nego ze skończonej liczby punktów uważamy z e r o . M i a r a z b i o r u s k ł a d a j ą c e g o s i ę z e s k o ń c z o n e j l i c z b y n i e z a c h o -
d z ą c y c h n a s i e b i e o d c i n k ó w p l u s e w e n t u a l n i e s k o ń c z o n a l i c z b a p u n k t ó w t o ł ą c z n a d ł u g o ś ć w s p o m n i a n y c h o d c i n k ó w . Innych zbiorów, niż typu opisanego powyżej (t. j. innych, niż składające się z jednego lub kilku nie zacho
dzących na siebie odcinków plus ewentualnie skończona liczba punktów) nie będziemy tu wcale rozważać (a tern mniej przypisywać im miarę).
Nazwijmy
Z (a, n)
zbiór wartości t spełniających nierówność następującą:
UD
k—r, n k ~ r
a
= )/ n
Z równości (8) wynika bezpośrednio nie
równość następująca:
(12) — • miara Z ( a , n ) ^ —
n
Czyli
(13) miara Z (a, n) i
5. Zanim pójdziemy dalej (do „zaostrzo
n ego“ prawa wielkich liczb) zużytkujmy sta
tystycznie nierówność (13).
Kładę:
Związek (2) § 3-go przybierze postać:
i
f
(t) ©/ ( t ) d t = o dla k ^ l i oczywiście będziey \ ( t ) d i = 1 dla wszelkiego k
I
Założenia (5) i (6) § 4 są więc spełnione, spełniona jest przeto i wynikająca z nich teza ( i3).
Dla ustalenia uwagi kładę a = 100.
W terminach rachunku prawdopodobień
stwa interpretuje się miarę Z (a,n) jako praw
dopodobieństwo nierówności (11).
Uwzględniając więc wzory (11), ( i3) i (14) i nadając n największą możliwą wartość n — N ( N liczba indywiduów zbadanych, patrz
§ 2), otrzymujemy wynik następujący:
Nierówność:
(15) k-N
Tfc T / 1,■ ... /
V P (1 —P,) h—11
I OO
— ]/ N
ma prawdopodobieństwo nie większe niż
^ = 0,0001.
Z prawdopodobieństwem przekraczającem 1 — IO* 0,9999 orzekamy więc:
(16)
I k-N
Z tyk(t)— p k—i
100
) / p (i - p ) ]/~N5»
(gdyż oczywiście: p { i —p) 1
2 ' Ł- i ) .2
Jeżeli Wjest dostatecznie wielkie, jeżeli np.
so
]/ N
1
100
N > 25 000 000 = 25 • 106
nierówność (16) wskazuje nam, że średnia wartość (ł)t.]. stosunek liczby indywiduów posiadających daną cechę do ogólnej liczby indywiduów zbadanych, daje z dwoma zna
kami dziesiętnemi i prawdopodobieństwem ponad 0,9999 szukane stałe prawdopodobień
stwo poszukiwanej cechy.
5. Wynik osiągnięty powyżej na zasadzie bezpośredniego zastosowania klasycznego prawa wielkich liczb (nierówności Ć z e b y - s z e w a ) (12) i jej wniosku (16) przedstawia się bardzo skromnie z punktu widzenia praktycznego i teoretycznie da się istotnie pogłębić.
Kosztem zaostrzenia założeń przez zakła
danie zupełnej niezależności wyników zna
lezionych u poszczególnych indywiduów moż
na polepszyć wynik z punktu widzenia licz
bowego.
W rzeczy samej, jeżeli przypuścimy nie
zależność obserwacyj będziemy mieli dla wszelkich funkcyj F i tp (dla których symbole użyte poniżej mają sens):
t
(17)
J
F ( $ k (t)) <p(4/ ( ł) ) d ł =o
I I
—
J
F (Ąi (t))dt- J < ? ( i ; )o O
dla l > k
ó* (t) oznacza tu jakąkolwiek wielkość za
leżną od <5>* (funkcję funkcyj).
Symbol F(Jjk (t)) był tu nawet zbędny, można było wprost pisać: 6* (t), użyliśmy go jedynie ze względów symetrji.
Kładę:
(1 8) i
—P
=q
i zachowuję oznaczenie (14).
Mamy oczywiście:
(19) Ceat k <V d t = p ea V 1 + qe~a V 7 ; O
wiadomo, że dla wszelkiego o < s < 3 e z < i z \ z 1 Ą-~ zz ez przeto:
(20)
. 1 , , 5 3
+ -7- 0? p ^ q — ^ e a V przy dostatecznie małem a mamy tai) „ y ? . .ł
nierówność (21) zachodzi napewno, gdy mamy równocześnie:
( 2 2 ) « < j / f i « < j / f + j / |
Związki (19), (20) i (21) dają
(23)
I
§ e a W d t < i + a> {± + ! L ) < e a\ i + ' j ) ; O
na zasadzie związku (17) mamy:
(24)
k = N
a Z yk (t)
e k—i dt =
1 1 1
■ f Jł...
0 0 o
Zestawiając związki (23) i (24) i kładąc a b
1/ N
otrzymujemy nierówność następującą:
(25)
1
J-
k = N
7n £ , f" (t>
b
l UL y ) iV
g vV V <7 /> /
(7 + 1 ) i, zastępując 6 przez—
(26) / ■
vw J , **w 4 / + 1 ) Gdy p~* o, lub o + 7 rośnie bez granic; dla wartości p bardzo małych, lub bardzo bliskich jedności prawe strony nie
równości (25) i (26) stają się bardzo wielkie i nierówności same wskutek tego stają się iluzoryczne. Założymy więc, że p niezbyt zbliża się do zera i do jedności. Jest to do
datkowe założenie aprioryczne, którego k ry tykę może dać choćby rachunek grubych oszacowań podług nierówności Czebyszewa, jak to było wyłożone w § 4.
Założymy, dla ustalenia uwagi, i
1 0 10
10 ; nierówności (25)
(27) j
co da nam:
p_\S_
i (26) wzmocnimy więc zastępując w nich 9 7 + 7 - przez 10. Będziemy wnioskować a f o r t i o r i z tak wzmocnionych nierówności.
Niech d będzie stałą, na razie, dowolną.
Na zasadzie wzmocnionej nierówności (25) nierówność następująca:
(28)
może zachodzić tylko dla zbioru wartości t o mierze mniejszej niż: innemi s ło w y : prawdopodobieństwo sprawdzania się nie
równości (28) nie przekracza wielkości:
e ~ d
Podobnie, na zasadzie nierówności (26), orzekamy, że prawdopodobieństwo nierów
ności, którą otrzymuje się z (28) przez za
mianę b n a — b, nie przekracza e~d \ przeto z prawdopodobieństwem przekraczającem (29) i — 2 e~~d
możemy orzec:
(30) J) /r=?M
Z (') C d-\- 10 b2
czyli
(31)
2 k ~ N
2
d io b
b ] / N ^ } / N
Nierówność powyższa (3i) zachodzi przy wszelkiej wartości dodatniej jej prawa stro
na osiąga m i n i m u m przy b — ^ ; m i n i m u m to wynosi:
io d
~N
mamy więc z prawdopodobieństwem prze- kraczającem i — 2 e~d
(32) Z
kazi
V
~N~io dJeżeli chcemy osiągnąć wynik, jak przy nierównościach (15) i (16), z prawdopodo
bieństwem przekraczającem 1 — ^ 4 musimy przyjąć
(33) 2 e~d < 1 o-4 ;
by uczynić zadość nierówności (33) wystar
czy przyjąć:
d> 8,5 . Wykonywając podstawienie (14) i korzy
stając z nierówności:
otrzymujemy z nierówności (32) przy pod
stawieniu d = 8,5 nierówność następującą:
(34)
j k—N
J? I'h U)
-P
k—l
2 \ f p ( i—p )
V'i-V
N85By otrzymać p z dwoma znakami dziesięt
nymi z prawdopodobieństwem przekraczają
cem 0,9999 wystarczy wziąć
czyli N > 850 000
Wartość na N jest tu mniejsza blisko 3o razy, niż wartość podana w końcu § 4.
Przy poprzestaniu na wiarogodności !> 0,9 i dokładności p do 0,1 znajdziemy na N niewielką wartość: 2000.
Myśl zasadnicza rachunku powyższego została wzięta od prof. B e r n s t e i n a (/s- czislenje wierojatiwstuiej\ Moskwa, Wydawnic
two państwowe, 1927).
Rząd wielkości przybliżenia jaki tu otrzy
mujemy jest co do istoty ten sam, jaki daje nam ostrzejsze „drugie twierdzenie graniczne“
L a p l a c e ’a. Przy stosowaniu wspomnianego twierdzenia ścisłe oszacowanie błędu jest dość kłopotliwe i przeważna liczba zastoso
wań spotykanych w podręcznikach statystyki oparta jest na szacowaniach „milczących“, które w istocie nie są wcale ściśle uzasad
niane.
6. W ynik podany w końcu § 4 jest skromny nietylko praktycznie, ale i teore
tycznie. Daje on (przy bardzo wysokiej war
tości N ze stosunkowo niewielką dokład
nością—to jego p r a k t y c z n e słabe strony) przybliżoną wartość p, ale nie daje on bez
pośrednio żadnych k r y t e r j ó w p r z y p a d k o w o ś c i , nie daje bezpośrednio możności skrytykowania samych zasadniczych założeń przypadkowości.
Możnaby, takby się zdawało na pierwszy rzut oka, kontrolować założenie przypadko
wości przez nadawanie N różnych wartości i badanie stałości otrzymywanych tak w różny sposób wartości p.
Przy bliższem wejrzeniu widzimy jednak,że:
12- procentowo nieznaczna zmiana A; nie zaważy znacznie na wartości stosunku
j krz N
y I ^ (*)
k ~ i
j a k a k o l w i e k byłaby natura ciągu zer i jedynek
<b(D> <k(0... ^N(t) ;
mogą więc wchodzić w rachubę tylko p r o c e n t o w o z n a c z n e t. j. absolutnie bardzo znaczne zmiany N powyżej wysokiej granicy, wyznaczonej w § § 4 i 5.
22- zaprzeczeniu nierówności (16) czy (34) przy o k r e ś l o n e j w a r t o ś c i W przypisu
jemy prawdopodobieństwo mniejsze niż i o —4;
zaprzeczeniu układowi m takich nierówności możemy przypisać jedynie prawdopodobień
stwo mniejsze od m. io - 4 ;innemi słowy, roz
ważając układ nierówności takich jak (16) czy (3ą) zamiast jednej nierówności, osłabia
my przez to wiarogodność konkluzji.
Trudność poruszona ostatnio zostaje roz
wiązana przez stosowanie t. zw. „zaostrzo
nego prawa wielkich liczb“, o czem niżej.
7. Przy staniu na gruncie klasycznego (nie
„zaostrzonego") prawa wielkich liczb B e r - n u i l l e g o —C z e b y s z e w a pozostaje nam jako kryterjum przypadkowości k r y t e r j u m
„ d y s p e r s y j n e “ L e x i s a. Przypatrzmy się tu nieco zastosowaniu tego kryterjum, odkła
dając szczegółową jego dyskusję do innej pracy.
Lexis poleca rozbić N obserwacji na s grup po k obserwacji w każdej.
Zgodnie z tern kładziemy:
p r (/) — p — 4 - 5 lp j { t ) — p] = % cpy {ł)
j —rk
, . U , „ w
k j = ( r — i ) £ - f - i « J — (*'— i ) Ä -J -I
i, podobnie, wobec wzoru (36)
’= N
(35)
(36)
A W
r —<?
j —rk
Z v w
j = ( r —i ) k + i
_ # -.-,-1 _ J——ks . J---H
p o ( 0 = 4 Z P r ( 0 = T i
Z
ł y ( 0 = 4 Z fc' ( 0" j —\ j — i
A- y = i % W
wynika stąd (wzory (5) i (6) § 4-go) bezpo
średnio:
'« ) J [ Pr(0 — P]* =
~~~~ r jPQ p (J
Mamy oczywiście, już przy założeniach J IA>(0 ^ ]2rf# = ^ = A . s
§ 4,
X I 1
(37)
f
p(0m A, (0 dt =j
(0 * • / a . (0 <*o 0 0
dla m ^ w i rn^po n ^ o 1
(38) j p n (/) dt — p przy wszelkiem O
I
(39) / p 0 (/) dt = p
o
Lexis rozważa:
„spółczynnik empiryczny“:
(40) A ( 0 = ^ 7 V [o i y ~ i a-(o - a. (o ]
D (/) = ^ ^ 1 M O I i „spółczynnik teoretyczny“
(41)
oraz „spółczynnik dyspersji“
(*2) 5 = ] / ^ -
Sprawdzianem przypadkowościmabyć,podług Lexisa, bliskość do jedności spółczynnika Q.
Mamy oczywiście:
Pj (/) — Po it) = [ A (/) —/ ] + [ p — po {t) ] [ pj [t) —p0 (/)]3 — [ a (/) — p f + [ a (/)—/*?
— 2 [ Po W — Al * [ / / W —Ä skąd, wobec definicji (36), otrzymujemy
(43)
(,__!) ;/(f) = - , [ A ( / ) - +
T
[A w - / ] * ;r — 1
kładąc jak w (18) : q = 1 — p , mamy, po
dług wzorów (14) i (35):
# k • s
Zestawiając wzory (ą3), (44) i (45) otrzymu
jemy:
i
(46) (5—1) / V { f ) d t - = — ^- + S P£ = ^ ( s —l)
o
czyli:
i
(47) f V( 0 < / / = ^
O
Podręczniki statystyki zazwyczaj utożsa
miają wartość V (/) z wartością jego „na
dziei matematycznej “ i
/ f (/) O
i ze wzoru (47) wnioskują o małości róż
nicy: | 0 — 1|
„V jest bliskie ~ jest również bliskie ^ , więc stosunek tych wielkości jest bliski jedności“.
Rozumowanie podobne zbyt pośpiesznie załatwia się ze sprawą zastosowania prawa wielkich liczb.
Przy 5 d o s t a t e c z n i e w i e l k i e m istotnie, z prawdopodobieństwem bliskiem 1,
można orzec, źe
r ~ s
W 7 £
r = x
mało różni się od i
(49) f [ p r ( t ) — p ] * d t = t e
Ale jak wielkie musi być s, by z praw dopodobieństwem, powiedzmy > 0,99, można było orzec, że wielkości (48) i (49) różnią się mniej niż np. o 10%? Jak wielkich błędów są powodem „poprawkowe“ wyrazy wzoru (48)?
Rachunek analogiczny do podanego w
§§ 4 i 5 daje odpowiedź dość niezadowala
jącą na te pytania \ gdyż otrzymane granice na 5 znacznie przekraczają wartości s uży
wane w praktyce. Należałoby przedyskutować ściśle możność zaostrzenia odnośnych nie
równości i dokładnie omówić sprawę względ
nych odchyleń
1
[poW — p YOd /
Mimochodem mogliśmy tylko p o s t a w i ć pewne kwestje dotyczące kryterjum Lexisa.
Przedyskutujemy je ściśle w osobnej pracy.
8. Przechodzimy do „zaostrzonego“ prawa wielkich liczb i jego zastosowania do staty
styki.
Wracając do funkcyj <?„ ( ł ) § 4, kładę
(50) k —H
s „ ( f ) = Z (ł) ; k—i
niech będzie “ > o i niech £ będzie dowolnie małą wielkością dodatnią.
Nazywam
f„(e)
zbiór wartości t przedziału (o—1) spełnia
jących nierówność następującą:
(51)
* 7 + »
Mamy oczywiście (wzór (7) § 4-go) 1
(52)
J
s2m ( t ) d ł = 11O skąd
(53)
J „7 + *
'dł tt
i 4-2»
» 3 1 n
1 2a Z samego określenia zbioru F„ (e) i z po
wyższej nierówności (58) wynika bezpośre
dnio nierówność następująca:
i i (54) £2. miara zbioru f w(£) 55 * n2a
Kładę n = m 2 ; mamy oczywiście [na zasadzie powyższej nierówności (58) ]
(55) miara zbioru r m* ( e ) Nazywam
m m 4“
^ («b y, o
zbiór wartości t przedziału (o—1) spełnia
jących warunek następujący:
(56)
m 24- 2a
Całka z kwadratu lewej strony powyższej nierówności (56) wynosi oczywiście
m 3+ 4®
możemy więc napisać nierówność następującą:
e*. miara zbioru g(jE) S “ 3+4«
czyli:
(57) miara zbioru g (»n ,j, e) § ' m 3+4„
Możemy teraz bezpośrednio zaatakować zagadnienie, którego rozwiązanie stanowi właśnie „zaostrzone prawo wielkich liczb“:
poszukiwać będziemy miary zbioru, który się oznacza w Teorji Mnogości przez:
(58) 2 r*(:)
n ~ N
t. j. zbioru takich wartości /, dla których można dobrać przynajmniej jedno n > N spełniające nierówność (51).
Postanowiliśmy sobie, dla wyeliminowa
nia trudności związanych z teorją miary i dla wygody czytelnika nie będącego matematy
kiem, operować wyłącznie zbiorami składa- jącemi się ze skończonej liczby przedziałów (plus, ewentualnie skończona liczba punktów), musimy więc zamiast sumy nieskończonej (58) operować sumą skończoną następującą:
(59)
n—N
A oznacza tu stałą dowolną, większą od N G (A, A , z) to zbiór wartości t takich, dla których nierówność (51) spełnia się przy
najmniej przy jednej wartości n spełniającej nierówność następującą:
i Założenia § 4 są tu niewystarczające nawet dla stosowania najprostszej, czebyszewow skiej, formy prawa wielkich liczb.
(60) N c n c A
Poszukujemy miary zbioru G (A, A , £).
Zwrócimy uwagę przedewszystkiem na okoliczność następującą:
w a r u n k i e m k o n i e c z n y m n a l e ż e n i a t d o r m2+7(e) j e s t n a l e ż e n i e t e j ż e w a r t o ś c i t d o e o n aj m n i e j j e d n e g o z d w ó c h z b i o r ó w p o n i ż s z y c h :
(61) m* 2£
(w rzeczy samej: przypuśćmy na chwilę, że / nie należy do żadnego z dwóch zbiorów po
wyższych (6i), wówczas, jak to wynika bez
pośrednio z definicji zbiorów (6i), t spełnia równocześnie dwie nierówności następujące:
(62)
(68)
S m 2 ( t ) 3 —I— 2 o.
W a
£ 2
2 <P,- ( f )
t—ro2+i
3 —I— 2 O.
m 2
skąd wnioskujemy bezpośrednio:
(64) S m 2-\~j ( t) 5 » + y (G
3 —1— cc ( * * + 7) T
3 -4— 2 cc W 2
m 2
S m 2 ( t )
S m 2 ( t ) I r= m * + j
3 —J— 2 O t _3_ —J - 2 c c a j C P / ( / )
m 2
w
+
i— m 2-\-j2 <p, ( / )ł ' r r m 2+ i
-1-L1
2 1 2
« T + 2“
nierówność (64) stanowi zaprzeczenie nie
równości (51) czyli oznacza nie—przynależ
ność t do Yn (e) przy n — m 2Ą-j\ więc.nie—
przynależność t do żadnego ze zbiorów (61) pociaga za soban ie—przynależność do Y (0
c. b. d. d. '
Zajmijmy się teraz bliżej zbiorem:
G (m 2, m 2 2 n i , e ) ;
na zasadzie uwagi zrobionej przed chwilą możemy twierdzić, że każda wartość t nale
żąca do G m 2 + 2 e ) należy równo
cześnie do conajmniej jednego ze zbiorów następujących:
(65)
przeto:
(66)
miara G (m2, m 2 -j- 2m, e) ^ miara Ym* [ ^ j +
j — zm f
+ miara g ^ m , j ,
stosując do prawej strony powyższej nie
równości (66) nierówności (55) i (57)) otrzy
mujemy nierówność następującą:
(67) miara G (w2, ;?z2 -f- 2m, £) 4 + 4
jz=2m
m 3+ 4% t
mi + 4 a1 + 7/71
2 i+4oc
W
34-4a
+
ę2 yyi1 + 4«
J. J =
2m (27/7-f" i ) 1
2 J '
+
_ i
1
m 3 + 4 a J
Nadając w nierówności powyższej wiel
kości m kolejno wartości następujące:
(68) A, A + 1, . . . A + a
i pamiętając, że miara zbioru—sumy (zbioru wartości t należących do chociażby jednego z danych „zbiorów—składników“) nie prze
kracza sumy miar zbiorów składników, mo
żemy, przez sumowanie, wyprowadzić nie
równość następującą:
(69) miara G (A2, (A+ćz + i)2—1, £) <C
< ± 2 y — '--- l i y
= £< I tn — N , „ = n " ' l+ 4« - ,,, - ,v m 3 + t ó I co
8 /
£
% "*3+4%
CO
\ j d x 2 f dx
2 J
x I+4a£2 J
x 3+ 4ori
N — i
a e 2 l ^ 4a ” £ 2 ( l - | - 2 a ) ( A T — 1 ) 2 + 4 «
Kładę, dla krótkości, (70)
2 I , I I
Y) (£ , a , A ) • ( j V _ i ) 4 a ^ £2 ( i - f - 2 a j ' ( # —1)2+ 4«
Oczywiście, przy wszelkiem M > A2, mamy:
(71) miara G (M, (N + a - \ - i ) 2—i, e) <5
^ miara G (A2, (A+ćz+i)2—i, £) < ^ (£, «, A) Treść nierówności (69) (i nierówności wynikającej zeń na zasadzie (71) ) możemy tak wyrazić:
z b i ó r w a r t o ś c i /, p r z y k t ó r y c h n i e r ó w n o ś ć n a s t ę p u j ą c a :
(72)
j —n
n 4
V ?/
z a w o d z i (czyli nie sprawdza się) c h o c i a ż b y d l a j e d n e j w a r t o ś c i n zawar
tej między M i dowolnie wielką liczbą.
( N + a + i)2— i
ma miarę nie przekraczającą tj (e, a, vV), gdzie N = [ \!M ] oznacza największą liczbę całko
witą nie przekraczającą M.
Przechodząc z języka geometrycznego na język rachunku prawdopodobieństwa i po
zwalając sobie na przejście graniczne przy a ->cc, możemy to samo tak wyrazić:
z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m i — ^ 0, «, m o ż n a t w i e r d z i ć , że n i e r ó w n o ś ć (72) s p r a w d z a s i ę p r z y w s z e l k i e m n > 7V2.
Skoro do twierdzenia powyższego dodamy jeszcze stwierdzenie oczywistego faktu, że
przy stałym z i a mamy
(73) lim '<] 0, «, A') = o
Ar->oo
będziemy mieli jedno z uogólnionych sfor
mułowań z a o s t r z o n e g o p r a w a w i e l k i c h l i c z b 1.
9. Zwykła postać z a o s t r z o n e g o p r a w a w i e l k i c h l i c z b i zwykłe zastosowa
nia statystyczne każą zamiast lewej strony (72) rozważać wyrażenia takie, jak te, które występują w nierównościach (15)—(ió) i (31)—
(32). Nadamy więc nierówności (72) postać następującą (n > N 2):
(74
t j (*) « 4 -a
Ari~ 2a
/ A"2 U —a
U ) 4 Możemy twierdzić z prawdopodobień
stwem przekraczaj ącem 1—''l (£> -W), że nie
równość (74) zachodzi przy wszelkiem n N 1.
Założymy, że N jest dość wielkie by było:
(75)
( 7 6 )
A 4 « ( A — 1)4«
3_
2
( l+ 2 a ) (A —1)2 + 4« a A4«
Rozwiązanie nierówności (75) da nam (75 bis)
4« log nat [l + -y—i ] < log n a t = 0,405.
ponieważ przy o log nat (1 + s)
z
przeto nierówności (75 bis) i (75) będą speł
nione dla wszelkiego N spełniającego waru
nek następujący
(75 ter)
0 , 4 0 6
4 «
0, 10 2
a a
0.102 + I
Przy spełnieniu warunku (75), spełnienie nierówności (76) będzie zapewnione -skoro będzie:
(76 bis) czyli
(76 ter)
(!)
2 + 40C
4«
(1 -f 2a) A2
N
1/ 1+ 2a
I + 2a
4«
przy sprawdzaniu się nierówności (75 ter) i (76 ter) mamy:
(77) v] (e, a, A)
Eł a A4«
Przez podstawienie (14) i uwzględnienie nie
równości:
p (1-/O i
wyprowadzamy z nierówności (74) nierów
ność następującą:
(78)
zn
1 ty (t)—p 1
2
2 A2T^— - f - ) 4A.—2a v. n )
-a
o r z e k a m y z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1 — ^ (£> a> ^0, a w i ę c z p r a w d o p o d o b i e ń s t w e m p r z e k r a-
4 d
c z aj ą c e m 1 — e2a jy*a s p r a w d z a n i e s i ę p o w y ż s z e j n i e r ó w n o ś c i (78) p r z y w s z e l k i e m n Z> N 2.
Jeżeli w powyższym przyjmiemy « — i, odpowiednio do założeń liczbowych § 4,
1
4
- = 0,01
4 . 1 0 4
£2(7 A4« A otrzymamy N = 4.108
10—4
N 2 — 16.1016.
i Twierdzenie to zostało poraź pierw szy —implicite—wypowiedziane przez B o r e l a w r. 1908. W r. toió w ypow iedział je explicxte C a n t e 1 1 i. Nieco ogólniej wypowiedział je i dow iódł S. M a z u r k i e w i c z ( W iadom ości Aktuarjalne, zeszyt 1, Warszawa 1922) i następnie C h i n c z i n (Osnoivnyje zakony te o r ji w iero ja tn o stiej, Moskwa 1927). W postaci najogólniejszej wspomniane twierdzenie zostało podane po raz pierw szy przez A. K o ł m o g o r o w a ( Comptes Rendus Akademji Paryskiej, 17 listopada 1930).
Wartości n, przy których wzór (78) jest sto
sowalny, są tu tak wielkie, że odbierają mu wszelką wartość praktyczno-statystyczną.
Nawet jeżeli się zadowolnić wiarogod-.
nością wyniku ponad 0,9 i przybliżeniem p do 0,1, czyli przyjąć:
4 - 0 , 1
— — o ,t ;
2 E%a A 4»
otrzymamy
^ = 0,1 czyli A = 4 000 N 2= 1 6 . i o G
t. j. wartości niemal nie do użycia w praktyce.
Zostawiając na razie otwartą kwestję po
lepszenia z punktu widzenia praktyczno- liczbowego powyższych wyników (o czem niżej), zwrócimy uwagę na k r y t e r j u m p r z y p a d k o w o ś c i , które otrzymujemy kła
dąc a c —.
4
Weźmy, dla ustalenia uwagi,
a i
T 1
2 N i -2 a
0,1
0,1
e 2cc N 4a
otrzymamy: A — 8.104 ; A 2 ===64.108 czyli znowu wartości liczbowe nie do p rak tycznego użytku.
Zasadniczo jednak mamy tu nietylko wartóść przybliżoną />, ale i kryterjum przy
padkowości. W rzeczy samej: z prawdopo
dobieństwem przekraczającem 0,9 orzekamy tu nietylko sprawdzanie się (78) przy pewnej określonej wartości %, ale p r z y w s z e l k i e m n > A 2. Prawa strona (78), zawieraj a ca obok
n y d ą ż ą c y d o z e r a p r z y «->^0: ( " ) aiŚ
dąży do zera przy n -+ c o . Kryterjum przy
padkowości będzie tu dążenie do określonej granicy wielkości
czynnika stałego: i ‘ 74 c z y n n i k z m i e ń -
(79)
T J H
j Z 4) » ^
n j = z i
Fakt dążenia do granicy da się przetłu
maczyć na język skończonych nierówności niezawierających nieznanej wielkości p cho
ciażby przez „kryterjum istnienia granicy"
(zwane niekiedy „określeniem istnienia gra
nicy") Cauchy’ego.
Rozważania powyższe, jak dotąd, mają charakter czysto-teoretyczny, gdyż liczby wchodzące tu w rachubę są zbyt wielkie dla praktycznego użytku. Przejście od teorji do praktyki wymaga tu przede wszy stkiem licz
bowego polepszenia osiągniętych wyników.
10. Metoda S. Bernsteina, którą rozwija
liśmy w § 5 dla „zwykłego" prawa wielkich liczb, da nam możność polepszenia liczbo
wych wyników i obecnie, przy prawie wiel
kich liczb „zaostrzonem".
Wychodzimy z bardziej specjalnych, niż robione powyżej (zgodne z § 4) założeń § 5 i powtarzamy cały nasz rachunek § 5 do nierówności (28) włącznie.
Przy omawianiu nierówności (28) wcale nie jest poruszana sprawa zmienności wiel
kości d\ n i c s i ę t u n i e z m i e n i j e ż e l i z a ł o ż y m y , ż e d j e s t j a k ą k o l w i e k f u n k c j ą A.
Uważając d za, niesprecyzowaną na razie, funkcję IV:
(80) d = d (N )
możemy orzec:
p r a w d o p o d o b i e ń s t w o z a c h o d z e n i a n i e r ó w n o ś c i n a s t ę p u j ą c e j :
(81)
k—N
Z <Pa (f) d (IV) + 10 b2
-d (N ) 1I N k
n i e p r z e k r a c z a w i e l k o ś c i e
Aby stąd otrzymać „zaostrzone" prawo wielkich liczb wystarczy dobrać funkcję d (N ) w ten sposób by zapewnić zbieżność szeregu:
(82) OO
N ~ AZ
Zbieżność szeregu (82) zachodzi o wiście przy d (A) == Aß przy wszelkiem j nawet przy d (A) = (1 +-%) log A przy w kiem » > 0 ; nie precyzując jeszcze fui
jedynie zbieżność sze
_______ -X / 71/7 \
kiem » > 0 ; nie precyzując jeszcze fi d (A), zakładając jedynie zbieżność sz (82), oznaczam przez o (M) jego resztę kładę:
(83) S W
OO
N — M
Korzystając z rachunków § 5 [nierówność (31) ] możemy orzec co następuje:
z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1—2 8 (M) m a m y s p r a w d z a n i e s i ę n i e r ó w n o ś c i n a s t ę p u j ą c e j : (84) I
II
kr^in
2
?* W k—1d ( n )
6 / »
+
f n106cl 1 a w s z e l k i e g o n M .
b oznacza tu dowolną wielkość dodatnią (niezależną lub zależną od n) spełniającą (warunki (22)) w istocie niekrępujące nie
równości następujące:
b / r__* b
\ n
(85) (1—pj5
p7 Prawa strona nierówności (84) osiąga (przy stałem n i dowolnie zmiennem b) swe mini
mum dla
(86; d (n) .
1 0 ’
przy wzroście d (n) wolniejszym niż n (co, oczywiście, zakładamy) poczynając od pewnej wartości n nierówności (85) zostają automa
tycznie spełnione, i, jak to łatwo sprawdzić w poniżej robionych zastosowaniach liczbo
wych, nie potrzebujemy się o nie troszczyć.
Dokonywując we wzorze (84) podstawie
nia (86), otrzymujemy (w analogji do wzoru (32) § 5) wynik następujący:
z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1-2 o {M) o r z e k a m y , s p r a w d z a n i e s i ę p r z y w s z e l k i e m 11 >> M, n i e r ó w n o ś c i n a s t ę p u j ą c e j :
(87)
J k— «
i r Z W
k ~ l < 2
V L
1 o d (n )nPrzeprowadzając podstawienie (14) i pa
miętając, że p (1—■/)<■£, możemy w w yra
żeniu powyższem zastąpić nierówność (87) przez nierówność następującą:
(88) 1 k—M
„ k—l Ił* 0O - P
V
1 0 d (M )MC 1 ^ 10d(») 1 / M ' d (n)
y d (M ) n
Pozostaje nam przerachowanie liczbowe osiągniętego wyniku. Zadowalniając się naj- skromniejszemi z wymagań liczbowych sta
wianych w paragrafie poprzednim, t. j. żąda
jąc wartości p z dokładnością do 0,1 i wia- rogodnością ponad 0,9 kładziemy
(89) (90)
1
/
Mi .—< 0,100
2 o (M2) 2 Z e~d ("> < 0,1 ;
H= A f , =
rozwiązawszy związki (89) i (90) przyjmiemy na M większą z dwóch liczb i M 2.
By otrzymać jaknajmniejszą wartość na M 1 winniśmy zakładać j a k n a j p o w o l - n i e j s z y w z r o s t f u n k c j i d(%); by otrzy
mać jaknaj mniej sza wartość na M 2 musimy, przeciwnie, zapewnić jaknajszybszą zbieżność szeregu (82) a tern samem j a k n a j s z y b s z y
w z r o s t f u n k c j i d { n) . Kładziemy:
(91) (92)
d (n) = «ß
o C ß C 1
«ß
lo g n ał n
(93) t (n)
Mamy oczywiście:
(94) B—d ( n) = c— wß = fi — ł (n) (95)
CO CO co
3 ( M ) = Z e - d ( n ) = Z n — t ( n ) < Z n - t ( M )
n— M co
n z M n—M
/ Al—i
x —t(M) dx _
t (M) — 1
Załóżmy, co jest, praktycznie biorąc, założe
niem niekrępującem:
(96) M 2 > 11 Wystarczy nam założyć
(97) t ( M 2) — i > 1 , 4
by otrzymać nietylko nierówność (po), lecz wynik mocniejszy:
(98) kładę
2 3 (M 2) < 2 1 0 —1,4 M
I
14
(99) « (n) — A n: — log nał n ; (A > o, mamy
A z n z — 1
O)
n) = Ag nz—1 i
11 n
przy Ag = i i n > 1 mamy ^ (n) ponieważ zaś oczywiście ? (1) o o, więc: ę (n) ;> o dla « J> 1
mamy przeto dla wszelkiego o «>1
( 100) log nat n
n z
a
skąd [wobec określenia (98) ] otrzymujemy, dla wszelkiego g >> o
(101) t {n) 7> a 7?ß—3;
jednem z rozwiązań nierówności (97) będzie:
( 102)
a-tu dowolnie obrana wielkość zawarta między 0 i ß.
Przy podstawieniu (91) rozwiązanie równania (89) nie przedstawia trudności. Mamy*.
ß czyli
(103)
Kładąc
(104)
otrzymujemy
1 0 M1
“ mT
ß = -
10—2
10' -ß i
1 0
10
Äf2 = (24) 3 = 18284 - / 24 40000 M x — i o 5 = 100000
Otrzymujemy więc ostatecznie następu
jące sformułowanie liczbowe:
z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j a c e m ^ m o ż e m y o r z e c s p r a w d z a n i e s i ę p r z y w s z e l k i e m
n i e r ó w n o ś c i n a s t ę p u j ą c e j : (105) i
n
k ~ n
k=IZ
I
10
n 3
1 0 2
3_
Mio 10'
Mamy tu, jak w § 9, nietylko przybliżoną wartość />, ale i kry ter j urn przypadkowości oparte na dążeniu do zera przy % co prawej strony nierówności (105).
11. Nie zmieniając nawet zasady naszych rozumowań, przez samo wyszukanie opty
malnych wartości spółczynników liczbowych (do czego prowadzi droga przez rozwiązanie szeregu liczbowych równań typu „przestęp
nego“) możnaby dość znacznie polepszyć liczbowo osiągnięte tu wyniki.
Dalsze polepszenie dałoby się osiągnąć—
jeżeli nie przez poszukiwanie funkcyj opty
malnych (czysto matematyczna strona zagad
nienia prowadzi—jak to wykazał przed paru laty Chinczyn—do znalezieniajako optymalny rząd wielkości funkcji log logn; dowód chinczynowski (Fundamenta Mathematicae, tom 6) jest dość zawiły i, w swej obecnej postaci, nie nadaje się do opracowania licz
bowego na użytek statystyki) to przez wpro
wadzenie funkcyj ogólniejszych, niż użyte tu n?j i znowu poszukiwanie optymalnych war
tości spółczynników.
Ale wszystkie te ulepszenia nie rozwią
zują kwestji: j a k i e s ą n a j l e p s z e p o m y ś l a 1 a e o s z a c o w a n i a l i c z b o w e w z a k r e s i e l i c z b , nie dowolnie wielkich, lecz f a k t y c z n i e s p o t y k a n y c h w b a- d a n i a c h s t a t y c z n y c h . Do kwestji te j, postawionej konkretnie dla poszczególnych typów badań statystycznych, spodziewamy się wrócić w dalszych publikacjach.
AL EX A N D R E RAJ CHM AN
Sur quelques criteres du „par hasard“
(La loi d es grands nombres „ordinaire“ e t la loi d e s grands nombres „ f o r t e “ au point de vue sta tistiq u e )
„Le c rite re du hasard“ c’est le synonyme du „theoreme du Calcul des Probabilites“.
Tont theoreme du Calcul des Probabilites donne virtuellement une condition necessaire (le p e u p r o b a b l e etant assimile ä Pim- p o s s i b l e ) que doivent remplir certaines suites numeriques produites avec Pinterven- tion du hasard. Par consequent tout theoreme du Calcul des Probabilites contient—theori- quement au moins—une methode propre ä contröler les suites des donnees statistiques au point de vue de ce qu’il y doit 6tre d’aleatoire.
Dans ce petit memoire j ’etudie dans cet o r d r e d ’idees l a l o i d e s g r a n d s n o m b r e s
„ c l a s s i q u e “ et l a l o i d e s g r a n d s n o m b r e s „ f o r t e “.
Je commence par citer la demonstra- tion classique de Tchebycheff de la loi des grands nombres „ordinaire“. Pour fixer les idees je ne la developpe numeriquement que dans le cas de Bernoulli. Je fais obser
ver que cette demonstration n ’exige nulle- ment Pindependance absoluc de tous les evenements elementaires, mais seulement leur independance deux-ä-deux ce qui n’est pas la m6me chose. Je precise par un calcul numerique le fait bien connu, que les inega
lites auxquelles conduit la methode de Tchebycheff sont tres peu propres aux appli- cations numeriques dans la pratique statistique.
Pour ameliorer numeriquement la loi des grands nombres au prix de sa generalite, je me sers de la methode de M. Serge Bern
stein. (Theorie des Probabilites r (en russe) Moscou-Leningrade, Edition d’Etat, 1927).
On doit, eil employant cette methode, sup- poser Pindependance absolue des evenements;
on arrive ä la loi des grands nombres pre- cisee par des inegalites p r a t i q u e m e n t u t i l i s a b l e s ; je precise ce fait par un calcul numerique.
Apres avoir etudie ainsi la loi des grands nombres ordinaire, je passe—et c’est cette partie du travail qui contient des resultats qui me paraissent nouveaux—ä la l o i d e s g r a n d s n o m b r e s f o r t e . Je demontre, que la l o i d e s g r a n d s n o m b r e s f o r t e e s t v a l a b l e m o y e n n a n t les m e m e s h y p o t h e s e s , q u e P o n a f ai t i ci d a n s l a d e m o n s t r a t i o n d e T c h e b y c h e f f d e l a l o i d e s g r a n d s n o m b r e s o r d i n a i r e 1;
la loi des grands nombres forte, comme la loi des grands nombres ordinaire, n ’exige que Pindependance deux ä deux des evene
ments elementaires et nullement leur inde
pendance absolue. Pour fixer les idees et rester autant pres que possible des applica- tions statistiques je ne developpe ici la demonstration que dans le cas Bernoulli—
Cantelli mais le fait est tout-ä-fait general et l’explicitation de la demonstration gene
rale est immediate.
Les inegalites auxquelles conduit la de
monstration en question ne sauraient 6tre meilleures que celles de Tchebycheff. Je fais le calcul numerique, qui montre qu’elles sont de beaucoup pires.
i C’est-ä-dire moyennant l ’hypothese des ecarts quadratiques moycns bornes.
L ’amelioration numerique des resultats au prix de leur generalite peut 6tre ici obtenue encore par un raisonnement tout analogue ä celui de M. Bernstein. En supposant l’inde- pendance absolue des evenements et en faisant un raisonnement calque sur celui, que je faisais clans le cas de la loi des grands
nombres ordinaire, j’arrive ä la loi des grands nombres forte precisee par des inegalites qui me paraissent pratiquement utilisables.
Je laisse ouverte la question si les ine
galites considerees sont les meilleures possi- bles. Cette question vaut la peine d’6tre
etiidiee et j ’espere y revenir.
JERZY NEYMAN
(Z Z ak ład u B io m e tr y c z n e g o In sty tu tu im . M. N e n c k ie g o , T. N. W.)
O korelacji pomiędzy ilorazami o wspólnym mianowniku.
Artykuł niniejszy ma na celu zwrócenie uwagi na pewne błędy metodyczne dość często spotykane w naszych pracach staty
stycznych, szczególnie często w pracach po święconych kwestjom ekonomiki gospodarstw wiejskich.
Nie mając zamiaru wdawać się w krytykę samych prac, tylko stosowanej w nich me
tody, będę rozważał jedno typowe zagad
nienie.
Polega ono na zbadaniu zależności pomię
dzy dochodem z gospodarstw, a rozmaitemi czynnikami na ten dochód wpływającemi, jak obszar, nakład, system gospodarowania i t. p.
Jasnem jest, że czynniki te są wszystkie związane ze sobą i rozplątanie skomplikowa
nych zależności stanowi trudne zadanie sta
tystyczne. Okoliczność ta jest ogólnie uzna
wana i omawiane wadliwe opracowanie ma
te rjał u statystycznego ma właśnie na celu usunięcie zakłócającego wpływu zmienności obszaru na zmienność innych czynników gos
podarczych, których współzależność chcieli
byśmy poznać. I tak, jeśli materjał staty
styczny zawiera dane o obszarze, nakładzie i dochodzie surowym z pewnej liczby gospo
darstw, przyczem obszar ich jest bardzo różny, to dla ustalenia związku pomiędzy nakładem a dochodem obliczenie korelacji pomiędzy temi zmiennemi jest słusznie uważane za za
bieg niewystarczający. Nie ulega bowiem wątpliwości, że śród tych gospodarstw, któ
re mają większy nakład (globalny), częściej spotykają się gospodarstwa o większych obszarach, wobec czego łatwe do skonstato
wania zwiększenie przeciętnego dochodu mo
że być związane całkowicie, lub chociaż tyl
ko częściowo z obszarem a nie z nakładem.
Wspomniana wyżej metoda usuwania tru
dności, którą należy traktować jako konku
rencyjną w stosunku do klasycznych metod
statystyki matematycznej, polega na przeli
czeniu tak nakładu gospodarczego, jak i do
chodu surowego na jednostkę obszaru gospo
darstwa i na następnem obliczeniu korelacji pomiędzy ilorazami.
Metoda ta stosuje się nietylko do badania za
leżności pomiędzy wy mienione mi zmiennemi, lecz do całej masy innych przykładów, jak (i) wydatki na pracę pieszą a (2) obszar pod okopowemi i t. d. W tym ostatnim przykła
dzie wartości obu zmiennych (1) i (2) dzieli się przez obszar gospodarstwa całkowity, względ
nie przez obszar użytków, później oblicza się korelację pomiędzy ilorazami.
Zobaczymy niżej, że stosowanie tej me
tody i wnioskowanie o istnieniu zależności pomiędzy np. nakładem a dochodem ze spół- czynnika korelacji pomiędzy ilorazami musi prowadzić do bardzo grubych błędów— zawsze z wyjątkiem niesłychanie rzadkich przy
padków.
Omówmy tu jeszcze użyte wyżej słowo
„zależność“. Słowo to i jego synonimy rozu
mieć będziemy w tym sensie, że ze zmianą np. nakładu w badanych gospodarstwach zmienia się przeciętny dochód. Może to za
chodzić dlatego, że zmiana nakładu jest p r z y c z y n ą zmiany dochodu, lub też dla
tego, że nakład jest związany z jakimś jeszcze innym czynnikiem, który dopiero wpływa na dochód. Oczywiście związek pomiędzy na
kładem a owym czynnikiem znów może nie posiadać charakteru przyczynowego.
Zdajmy sobie teraz sprawę z dokładnej treści zagadnienia o zależności np. pomiędzy nakładem a dochodem. Niewątpliwie intere
sującą jest tu kwestja, jakby się zmienił przeciętny dochód większej liczby gospo
darstw, gdyby nakład w tych gospodarstwach uległ zmianie w jakimkolwiek kierunku,