Kwartalnik Statystyczny, 1931, T. 8, z. 4

(1)

K W A R T A L N I K S T A T Y S T Y C Z N Y

ROK 1931, TOM V I I I , ZE SZ Y T 4

REVUE TRIMESTRIELLE DE S T A T I S T I Q U E

ANNEE 1931, TOM E VIII, FASCICULE 4

AL. RAJ OHM AN

O niektórycli RryterjacH przypadkowości

(„Prawo wielkich lic z b “ i jego z a o s tr z e n ie w ujęciu staty sty ezn em )

U podstawy naszego badania leży do

mniemanie, że rozważana cecha jest przy

padkową, że pojawia się z pewnem s t a ł e m n i e w i a d o m e m p r a w d o p o d o b i e ń s t w e m p.

Zakładamy wzajemną niezależność każdej pary obserwacyj, co nie oznacza zresztą by

najmniej niezależności obserwacyj w ogóle (jeżeli naprzykład założymy, że prawdopo

dobieństwo pojawienia się rozważanej cechy u indywiduum numer i jest w każdym razie p i podobnie u indywiduum numer 2, zaś u indywiduum numer 3 owo prawdopodo

bieństwo wynosi: / , jeżeli wspomniana cecha istnieje i u numeru 1 i u n-ru 2, P (2-p) 1. U podstawy wszelkiego opracowania

materjału statystycznego leży pewne m i n i m u m powziętych zgóry założeń teoretycz

nych. Im bardziej świadome są te założenia, im jaśniej i dobitniej wysłowione—tern lepiej dla statystyka, który wszak zacząć musi od stwierdzenia: c z y e m p i r y c z n y m a- t e r j a ł n i e k ł ó c i s i ę z p o w z i ę t e m z g ó r y z a ł o ż e n i e m , czy dany schemat przypadkowości „pasuje“. Zarówno formalne opracowanie apriorycznych założeń statysty

ka, jak i ich krytyka rachunkowa na podstawie empirycznego materjału statystycznego to właściwie już zakres pracy m a t e m a t y k a . Tradycyjne sformułowania klasyków, prze

pisywane z podręcznika do podręcznika, nie zastąpią tu żywej pracy matematyka, który musi umieć przetłumaczyć na język statysty

ki każdy postęp teorji prawdopodobieństwa, który musi umieć wyciągnąć sprawdzalne rachunkowo nierówności o praktycznie skoń

czonej liczbie wyrazów z ogólnych tw ier

dzeń o mniej czy więcej zawiłych przejściach do granicy.

2. Przyjrzyjmy się zbliska najprostszemu z zadań statystycznych: wyznaczaniu niewia

domego stałego prawdopodobieństwa. Dla ustalenia uwagi przypuśćmy, że poszukujemy prawdopodobieństwa pewnej cechy, która może być tylko obecną, lub nieobecną, przyczem nie stawiamy wcale sprawy ewentual

nie różnego natężenia tej cechy. (Przykład:

stwierdzanie płci noworodka). Wyobraźmy sobie, żeśmy zbadali pewną liczbę indywi

duów, które oznaczyliśmy numerami:

I, 2, 3, ... /V

każdemu z tych zbadanych indywiduów przy

pisaliśmy spółczynnik liczbowy: z e r o lub j e d e n .

i By rzecz postawić ściśle na grancie rachunku prawdopodobieństwa, wystarczy założyć, że prawdopodobieństwo nierówności

(l ^<Zf ^<Zb mierzy się różnicą: b^—a (lub pozornie mniej, że nierówności: M <Z t ^<Zb ⁱ ^{C < Z t} ^{<C ^} są równie prawdopodobne wtedy i tylko w tedy, gdy b— O — d—C).

2 ( I - / 9

przy nieobecności wspomnianej cechy u n-ru 1 i obecności u n-ru 2, takąż wartość przy obecności tej cechy u n-ru 1 i nieobecności u n-ru 2, wreszcie prawdopodobieństwo p jeżeli nic nie zakładać o indywiduach numery 1 i 2—w tych warunkach mamy niezależność cech indywiduum nr. 3 od cech indywiduów nr. 1 i 2 oddzielnie branych, lecz zależność od pary indywiduów 1 i 2.

W trącona przez nas uwaga nawiasowa nie jest istotna dla dalszego ciągu. Istotnym natomiast jest schemat aprioryczny, z którego korzystamy. Przystępujemy do zdefinjowania tego schematu.

3. Posiadanie, czy nie posiadanie rozwa

żanej cechy przez każde z N zbadanych indywiduów uważamy za zjawisko przypad

kowe. Matematycznie możemy to tak ująć:

z każdym ze wspomnianych N indywiduów kojarzymy pewną funkcję zmiennej rzeczy

wistej t, określonej w przedziale (o— i ) 1.

Funkcję tę nazywamy <]>* (t) (dla k-go indy-

Kwąrtąlnik Statystyczny, l%t. ₅₄

(2)

widuum); funkcja ta przybiera tylko wartości z e r o i j e d e n .

W arun ki stałego prawdopodobieństwa po

jawiania się danej cechy i warunek nieza

leżności pojawiania się rozważanej cechy u każdych dwóch różnych indywiduów wy

rażają się wzorami następującemu

(1)

J

(t) dt = p (przy wszelkiem k)

O

I I I

(2)

J‘

ł* (t)tyi (t) d t - J * ( t ) d t . f 6i (ł)d t= p 2

O o o

(przy k /).

Ciąg empirycznie dany zer i jedynek (ciąg uwidoczniający, które ze zbadanych N indy

widuów posiada cechę rozważaną, a które nie) uważamy za ciąg postaci

(3) * ł \ ( t ) , ^ ( t ) . - - ^ N ( t )

przy pewnej wartości zmiennej t.

Jeżeli t nie należy do pewnego zbioru wyjątkowego, t. j. jeżeli punkt o odciętej t nie należy do żadnego z pewnych odcinków wyjątkowych o łącznej długości bardzo małej, to ciąg typu (3) musi posiadać pewne wła

sności liczbowe, stanowiące w danym razie

„kryterja przypadkowości“.

4. „ K r y t e r j a p r z y p a d k o w o ś c i " , o których tu mówimy, są w istocie sprecy- zowanemi wysłowieniami pewnych twierdzeń matematycznych. Sformułowania sprecyzo

wane to znaczy—mimowoli—sformułowania nieco zamaskowane. Najlepiej więc będzie, jeżeli zaczniemy od podania zwykłych sfor

mułowań twierdzeń, o które tu idzie, a na

stępnie dopiero sformułowania te przekształ

cimy odpowiednio do naszych potrzeb.

Owe twierdzenia to „zwykłe" i „zaostrzo

n e “ prawa wielkich liczb—w najogólniejszym przypadku — jeżeli nie chcemy rozszerzać naszego minimum powziętych zgóry hypotez.

W najogólniejszym przypadku prawo wielkich liczb—to twierdzenia o układach ortogonalnych.

Niech

(4) tPi ( t ) » (p2 ( t )

będzie ciągiem unormowanych funkcyj orto

gonalnych, t. j. funkcyj spełniających warunki:

i

(5) J yk (ł) cp7 (/; dt — o dla k ^ l

(6)

1

j yl(t) d ł — i dla wszelkiego k

Z w y k ł e prawo wielkich liczb jest bez

pośrednim wnioskiem z niemal oczywistej tożsamości następującej:

(7)

skad

J ( i

<p* (t) dł — n

(8)

n

k — ti k — IZ

dt i

71

(9)

Do dalszych sformułowań potrzebne jest nam pojęcie m i a r y z b i o r u . Nie wpro

wadzając żadnych nowych założeń, specjali

zując jedynie—co nam wolno—użyte przez nas matematyczne odwzorowanie założeń (stałego prawdopodobieństwa i niezależności spostrze

żeń parami) możemy założyć, że każda z funkcyj ^<p*(t) ma tylko conajwyżej skoń

czoną liczbę punktów nieciągłości i że—dla każdej z funkcyj ^<p*(t)^—przedział wartości t (o—1) podzielony został na skończoną liczbę przedziałów, wewnątrz każdego, z których (p* (t) jest stałą.

Przy powyższych założeniach zbiór war

tości t określony przez każdy ze związków poniższych:

(t)— a ; \<?k(t)I — a ; (p* (t)C a^{; |}yk (t) \<.a

<?k ( t ) > a^{; I cp*}(t) \>a^{; |} (t) \< a^{; |} (t) \>a składa się oczywiście ze skończonej liczby przedziałów odcinka (o— 1) plus ewentualnie skończona liczba punktów. T o s a m o m o ż n a p o w i e d z i e ć o z w i ą z k a c h o g ó l n i e j s z y c h , k t ó r e o t r z y m u j e m y z a s t ę p u j ą c w (9) <?k (t) p r z e z „ k o m b i n a c j ę l i n j o w ą " w i e l k o ś c i ^cpA(t) t. j. p rz e z wyrażenia postaci następującej:

(10)

y x(t) + A 2 <?2(t) + . . .+ A k <p* (t) + .. Ar A n f(t) A l} A 2 . . . A n oznaczają tu jakiekolwiek stałe.

Możemy teraz zdefinjować pojęcie „ m i a r a z b i o r u " . Miarą odcinka nazywamy jego długość, za miarę punktu oraz zbioru złożo

nego ze skończonej liczby punktów uważamy z e r o . M i a r a z b i o r u s k ł a d a j ą c e g o s i ę z e s k o ń c z o n e j l i c z b y n i e z a c h o -

(3)

d z ą c y c h n a s i e b i e o d c i n k ó w p l u s e w e n t u a l n i e s k o ń c z o n a l i c z b a p u n k t ó w t o ł ą c z n a d ł u g o ś ć w s p o m n i a n y c h o d c i n k ó w . Innych zbiorów, niż typu opisanego powyżej (t. j. innych, niż składające się z jednego lub kilku nie zacho

dzących na siebie odcinków plus ewentualnie skończona liczba punktów) nie będziemy tu wcale rozważać (a tern mniej przypisywać im miarę).

Nazwijmy

Z (a, n)

zbiór wartości t spełniających nierówność następującą:

UD

k—r, n _{k ~ r}

a

= )/ n

Z równości (8) wynika bezpośrednio nie

równość następująca:

(12) — • miara Z ( a , n ) ^ —

n

Czyli

(13) miara Z (a, n) i

5. Zanim pójdziemy dalej (do „zaostrzo

n ego“ prawa wielkich liczb) zużytkujmy sta

tystycznie nierówność (13).

Kładę:

Związek (2) § 3-go przybierze postać:

i

f

(t) ©/ ( t ) d t = o dla k ^ l i oczywiście będzie

y \ ( t ) d i = 1 dla wszelkiego k

I

Założenia (5) i (6) § 4 są więc spełnione, spełniona jest przeto i wynikająca z nich teza ( i3).

Dla ustalenia uwagi kładę a = 100.

W terminach rachunku prawdopodobień

stwa interpretuje się miarę Z (a,n) jako praw

dopodobieństwo nierówności (11).

Uwzględniając więc wzory (11), ( i3) i (14) i nadając n największą możliwą wartość n — N ( N liczba indywiduów zbadanych, patrz

§ 2), otrzymujemy wynik następujący:

Nierówność:

(15) k-N

Tfc T / 1,■ ... /

V P (1 —P,) h—11

I OO

— ]/ N

ma prawdopodobieństwo nie większe niż

^ = 0,0001.

Z prawdopodobieństwem przekraczającem 1 — IO* 0,9999 orzekamy więc:

(16)

I k-N

Z tyk(t)— p k—i

100

) / p (i - p ) _]/~N^5»

(gdyż oczywiście: p { i —p) 1

2 ' Ł- i ) .2

Jeżeli Wjest dostatecznie wielkie, jeżeli np.

so

]/ N

1

100

N > 25 000 000 = 25 • 106

nierówność (16) wskazuje nam, że średnia wartość (ł)t.]. stosunek liczby indywiduów posiadających daną cechę do ogólnej liczby indywiduów zbadanych, daje z dwoma zna

kami dziesiętnemi i prawdopodobieństwem ponad 0,9999 szukane stałe prawdopodobień

stwo poszukiwanej cechy.

5. Wynik osiągnięty powyżej na zasadzie bezpośredniego zastosowania klasycznego prawa wielkich liczb (nierówności Ć z e b y - s z e w a ) (12) i jej wniosku (16) przedstawia się bardzo skromnie z punktu widzenia praktycznego i teoretycznie da się istotnie pogłębić.

Kosztem zaostrzenia założeń przez zakła

danie zupełnej niezależności wyników zna

lezionych u poszczególnych indywiduów moż

na polepszyć wynik z punktu widzenia licz

bowego.

W rzeczy samej, jeżeli przypuścimy nie

zależność obserwacyj będziemy mieli dla wszelkich funkcyj F i tp (dla których symbole użyte poniżej mają sens):

t

(17)

J

F ( $ k (t)) <p(4/ ( ł) ) d ł =

o

I I

—

J

^F ^(Ąi ^(t))d^t- J < ? ( i ; )

o O

dla l > k

ó* (t) oznacza tu jakąkolwiek wielkość za

leżną od <5>* (funkcję funkcyj).

(4)

Symbol F(Jjk (t)) był tu nawet zbędny, można było wprost pisać: 6* (t), użyliśmy go jedynie ze względów symetrji.

Kładę:

(1 8) i

—P

⁼

q

i zachowuję oznaczenie (14).

Mamy oczywiście:

(19) Ceat k <V d t = p ea V 1 + qe~a V 7 ; O

wiadomo, że dla wszelkiego o < s < 3 e z < i z \ z 1 Ą-~ zz ez przeto:

(20)

. 1 , , 5 3

+ -7- 0? p ^ q — ^ e a V przy dostatecznie małem a mamy tai) „ y ? . .ł

nierówność (21) zachodzi napewno, gdy mamy równocześnie:

( 2 2 ) « < j / f i « < j / f + j / |

Związki (19), (20) i (21) dają

(23)

I

§ e a W d t < i + a> {± + ! L ) < e a\ i + ' j ) ; O

na zasadzie związku (17) mamy:

(24)

k = N

a Z yk (t)

e k—i dt =

1 1 1

■ f Jł...

0 0 o

Zestawiając związki (23) i (24) i kładąc a b

1/ N

otrzymujemy nierówność następującą:

(25)

1

J-

k = N

7n £ , f" (t>

b

l UL y ) iV

g vV V <7 /> /

(7 + 1 ) i, zastępując 6 przez—

(26) / ■

vw J , **w 4 / + 1 ) Gdy p~* o, lub o + 7 rośnie bez granic; dla wartości p bardzo małych, lub bardzo bliskich jedności prawe strony nie

równości (25) i (26) stają się bardzo wielkie i nierówności same wskutek tego stają się iluzoryczne. Założymy więc, że p niezbyt zbliża się do zera i do jedności. Jest to do

datkowe założenie aprioryczne, którego k ry tykę może dać choćby rachunek grubych oszacowań podług nierówności Czebyszewa, jak to było wyłożone w § 4.

Założymy, dla ustalenia uwagi, i

1 0 10

10 ; nierówności (25)

(27) j

co da nam:

p_\S_

i (26) wzmocnimy więc zastępując w nich 9 7 + 7 - przez 10. Będziemy wnioskować a f o r t i o r i z tak wzmocnionych nierówności.

Niech d będzie stałą, na razie, dowolną.

Na zasadzie wzmocnionej nierówności (25) nierówność następująca:

(28)

może zachodzić tylko dla zbioru wartości t o mierze mniejszej niż: innemi s ło w y : prawdopodobieństwo sprawdzania się nie

równości (28) nie przekracza wielkości:

e ~ d

Podobnie, na zasadzie nierówności (26), orzekamy, że prawdopodobieństwo nierów

ności, którą otrzymuje się z (28) przez za

mianę b n a — b, nie przekracza e~d \ przeto z prawdopodobieństwem przekraczającem (29) i — 2 e~~d

możemy orzec:

(30) J) ^/r=?M

Z (') C d-\- 10 b2

(5)

czyli

(31)

2 k ~ N

2

d io ^b

b ] / N ^ } / N

Nierówność powyższa (3i) zachodzi przy wszelkiej wartości dodatniej jej prawa stro

na osiąga m i n i m u m przy b — ^ ; m i n i m u m to wynosi:

io d

~N

mamy więc z prawdopodobieństwem prze- kraczającem i — 2 e~d

(32) Z

kazi

V

^~N~^{io d}

Jeżeli chcemy osiągnąć wynik, jak przy nierównościach (15) i (16), z prawdopodo

bieństwem przekraczającem 1 — ^ 4 musimy przyjąć

(33) 2 e~d < 1 o-4 ;

by uczynić zadość nierówności (33) wystar

czy przyjąć:

d> 8,5 . Wykonywając podstawienie (14) i korzy

stając z nierówności:

otrzymujemy z nierówności (32) przy pod

stawieniu d = 8,5 nierówność następującą:

(34)

j k—N

J? I'h U)

^-

P

k—l

2 \ f p ( i—p )

V'i-V

^N⁸⁵

By otrzymać p z dwoma znakami dziesięt

nymi z prawdopodobieństwem przekraczają

cem 0,9999 wystarczy wziąć

czyli N > 850 000

Wartość na N jest tu mniejsza blisko 3o razy, niż wartość podana w końcu § 4.

Przy poprzestaniu na wiarogodności !> 0,9 i dokładności p do 0,1 znajdziemy na N niewielką wartość: 2000.

Myśl zasadnicza rachunku powyższego została wzięta od prof. B e r n s t e i n a (/s- czislenje wierojatiwstuiej\ Moskwa, Wydawnic

two państwowe, 1927).

Rząd wielkości przybliżenia jaki tu otrzy

mujemy jest co do istoty ten sam, jaki daje nam ostrzejsze „drugie twierdzenie graniczne“

L a p l a c e ’a. Przy stosowaniu wspomnianego twierdzenia ścisłe oszacowanie błędu jest dość kłopotliwe i przeważna liczba zastoso

wań spotykanych w podręcznikach statystyki oparta jest na szacowaniach „milczących“, które w istocie nie są wcale ściśle uzasad

niane.

6. W ynik podany w końcu § 4 jest skromny nietylko praktycznie, ale i teore

tycznie. Daje on (przy bardzo wysokiej war

tości N ze stosunkowo niewielką dokład

nością—to jego p r a k t y c z n e słabe strony) przybliżoną wartość p, ale nie daje on bez

pośrednio żadnych k r y t e r j ó w p r z y p a d k o w o ś c i , nie daje bezpośrednio możności skrytykowania samych zasadniczych założeń przypadkowości.

Możnaby, takby się zdawało na pierwszy rzut oka, kontrolować założenie przypadko

wości przez nadawanie N różnych wartości i badanie stałości otrzymywanych tak w różny sposób wartości p.

Przy bliższem wejrzeniu widzimy jednak,że:

12- procentowo nieznaczna zmiana A; nie zaważy znacznie na wartości stosunku

j krz N

y I ^ (*)

k ~ i

j a k a k o l w i e k byłaby natura ciągu zer i jedynek

<b(D> <k(0... ^N(t) ;

mogą więc wchodzić w rachubę tylko p r o c e n t o w o z n a c z n e t. j. absolutnie bardzo znaczne zmiany N powyżej wysokiej granicy, wyznaczonej w § § 4 i 5.

22- zaprzeczeniu nierówności (16) czy (34) przy o k r e ś l o n e j w a r t o ś c i W przypisu

jemy prawdopodobieństwo mniejsze niż i o —4;

zaprzeczeniu układowi m takich nierówności możemy przypisać jedynie prawdopodobień

stwo mniejsze od m. io - 4 ;innemi słowy, roz

ważając układ nierówności takich jak (16) czy (3ą) zamiast jednej nierówności, osłabia

my przez to wiarogodność konkluzji.

Trudność poruszona ostatnio zostaje roz

wiązana przez stosowanie t. zw. „zaostrzo

nego prawa wielkich liczb“, o czem niżej.

7. Przy staniu na gruncie klasycznego (nie

„zaostrzonego") prawa wielkich liczb B e r - n u i l l e g o —C z e b y s z e w a pozostaje nam jako kryterjum przypadkowości k r y t e r j u m

(6)

„ d y s p e r s y j n e “ L e x i s a. Przypatrzmy się tu nieco zastosowaniu tego kryterjum, odkła

dając szczegółową jego dyskusję do innej pracy.

Lexis poleca rozbić N obserwacji na s grup po k obserwacji w każdej.

Zgodnie z tern kładziemy:

p r (/) — p ^{— 4 -} 5 lp j { t ) — p] = % ^cpy {ł)

j —rk

, . U , „ w

k j = ( r — i ) £ - f - i « J — (*'— i ) Ä -J -I

i, podobnie, wobec wzoru (36)

’= N

(35)

(36)

A W

r —<?

j —rk

Z v w

j = ( r —i ) k + i

_ # -.-,-1 ^_ J——ks . J---H

p o ( 0 = 4 Z P r ( 0 = T i

Z

^{ł y ( 0} ⁼ ⁴ Z fc' ( 0

" j —\ j — i

A- y = i % W

wynika stąd (wzory (5) i (6) § 4-go) bezpo

średnio:

'« ) J [ Pr(0 — P]* =

~~~~ r jPQ p (J

Mamy oczywiście, już przy założeniach J IA>(0 ^ ]2rf# = ^ = A . s

§ 4,

X I 1

(37)

f

^p⁽⁰^m^A,⁽⁰^{dt =}

j

⁽⁰ * • / a . (0 <*

o 0 0

dla m ^ w i rn^po n ^ o 1

(38) j p n (/) dt — p przy wszelkiem O

I

(39) / p 0 (/) dt = p

o

Lexis rozważa:

„spółczynnik empiryczny“:

(40) A ( 0 = ^ 7 V [_o _{i y ~ i} â-(ô - â. (ô ]

D (/) = ^ ^ 1 M O I i „spółczynnik teoretyczny“

(41)

oraz „spółczynnik dyspersji“

(*2) 5 = ] / ^ -

Sprawdzianem przypadkowościmabyć,podług Lexisa, bliskość do jedności spółczynnika Q.

Mamy oczywiście:

Pj (/) — Po it) = [ A (/) —/ ] + [ p — po {t) ] [ pj [t) —p0 (/)]3 — [ a (/) — p f + [ a (/)—/*?

— 2 [ Po W — Al * [ / / W —Ä skąd, wobec definicji (36), otrzymujemy

(43)

(,__!) ;/(f) = - , [ A ( / ) - +

T

[A w - / ] * ;

r — 1

kładąc jak w (18) : q = 1 — p , mamy, po

dług wzorów (14) i (35):

# k • s

Zestawiając wzory (ą3), (44) i (45) otrzymu

jemy:

i

(46) (5—1) / V { f ) d t - = — ^- + S P£ = ^ ( s —l)

o

czyli:

i

(47) f V( 0 < / / = ^

O

Podręczniki statystyki zazwyczaj utożsa

miają wartość V (/) z wartością jego „na

dziei matematycznej “ i

/ ^f (/) O

i ze wzoru (47) wnioskują o małości róż

nicy: | 0 — 1|

„V jest bliskie ~ jest również bliskie ^ , więc stosunek tych wielkości jest bliski jedności“.

Rozumowanie podobne zbyt pośpiesznie załatwia się ze sprawą zastosowania prawa wielkich liczb.

Przy 5 d o s t a t e c z n i e w i e l k i e m istotnie, z prawdopodobieństwem bliskiem 1,

można orzec, źe

r ~ s

W 7 £

r = x

mało różni się od i

(49) f [ p r ( t ) — p ] * d t = t e

(7)

Ale jak wielkie musi być s, by z praw dopodobieństwem, powiedzmy > 0,99, można było orzec, że wielkości (48) i (49) różnią się mniej niż np. o 10%? Jak wielkich błędów są powodem „poprawkowe“ wyrazy wzoru (48)?

Rachunek analogiczny do podanego w

§§ 4 i 5 daje odpowiedź dość niezadowala

jącą na te pytania \ gdyż otrzymane granice na 5 znacznie przekraczają wartości s uży

wane w praktyce. Należałoby przedyskutować ściśle możność zaostrzenia odnośnych nie

równości i dokładnie omówić sprawę względ

nych odchyleń

1

[poW — p YOd /

Mimochodem mogliśmy tylko p o s t a w i ć pewne kwestje dotyczące kryterjum Lexisa.

Przedyskutujemy je ściśle w osobnej pracy.

8. Przechodzimy do „zaostrzonego“ prawa wielkich liczb i jego zastosowania do staty

styki.

Wracając do funkcyj <?„ ^{( ł )} § 4, kładę

(50) ^{k —H}

s „ ( f ) = Z (ł) ; k—i

niech będzie “ > o i niech £ będzie dowolnie małą wielkością dodatnią.

Nazywam

f„(e)

zbiór wartości t przedziału (o—1) spełnia

jących nierówność następującą:

(51)

* 7^{+ »}

Mamy oczywiście (wzór (7) § 4-go) 1

(52)

J

^s²^m ( t ) d ł = 11

O skąd

(53)

J „7 + *

'dł ^tt

i 4-2»

» 3 1 n

1 2a Z samego określenia zbioru F„ (e) i z po

wyższej nierówności (58) wynika bezpośre

dnio nierówność następująca:

i i (54) £2. miara zbioru f w(£) 55 * n2a

Kładę n = m 2 ; mamy oczywiście [na zasadzie powyższej nierówności (58) ]

(55) miara zbioru r m* ^{( e )} Nazywam

m m 4“

^ («b y, o

zbiór wartości ^t przedziału (o—1) spełnia

jących warunek następujący:

(56)

m 24- 2a

Całka z kwadratu lewej strony powyższej nierówności (56) wynosi oczywiście

m 3+ 4®

możemy więc napisać nierówność następującą:

e*. miara zbioru ^g^(jE) S “ 3+4«

czyli:

(57) miara zbioru g (»n ,j, e) § ' m 3+4„

Możemy teraz bezpośrednio zaatakować zagadnienie, którego rozwiązanie stanowi właśnie „zaostrzone prawo wielkich liczb“:

poszukiwać będziemy miary zbioru, który się oznacza w Teorji Mnogości przez:

(58) 2 r*(:)

n ~ N

t. j. zbioru takich wartości /, dla których można dobrać przynajmniej jedno n > N spełniające nierówność (51).

Postanowiliśmy sobie, dla wyeliminowa

nia trudności związanych z teorją miary i dla wygody czytelnika nie będącego matematy

kiem, operować wyłącznie zbiorami składa- jącemi się ze skończonej liczby przedziałów (plus, ewentualnie skończona liczba punktów), musimy więc zamiast sumy nieskończonej (58) operować sumą skończoną następującą:

(59)

n—N

A oznacza tu stałą dowolną, większą od N G (A, A , z) to zbiór wartości t takich, dla których nierówność (51) spełnia się przy

najmniej przy jednej wartości n spełniającej nierówność następującą:

i Założenia § 4 są tu niewystarczające nawet dla stosowania najprostszej, czebyszewow skiej, formy prawa wielkich liczb.

(8)

(60) N c n c A

Poszukujemy miary zbioru G (A, A , £).

Zwrócimy uwagę przedewszystkiem na okoliczność następującą:

w a r u n k i e m k o n i e c z n y m n a l e ż e n i a t d o r m2+7(e) j e s t n a l e ż e n i e t e j ż e w a r t o ś c i t d o e o n aj m n i e j j e d n e g o z d w ó c h z b i o r ó w p o n i ż s z y c h :

(61) m* ₂^£

(w rzeczy samej: przypuśćmy na chwilę, że / nie należy do żadnego z dwóch zbiorów po

wyższych (6i), wówczas, jak to wynika bez

pośrednio z definicji zbiorów (6i), t spełnia równocześnie dwie nierówności następujące:

(62)

(68)

S m 2 ( t ) 3 —I— 2 o.

W a

£ 2

2 <P,- ( f )

t—ro2+i

3 —I— 2 O.

m 2

skąd wnioskujemy bezpośrednio:

(64) S m 2-\~j ( t) 5 » + y (G

3 —1— cc ( * * + 7^{) T}

3 -4— 2 cc W 2

m²

S m 2 ( t )

S m 2 ( t ) I r= m * + j

3 —J— 2 O t _3_ —J - 2 c c a j C P / ( / )

m²

w

+

^{i— m 2-\-j}₂ <p, ( / )

ł ' r r m 2+ i

-1-L1

2 1 2

« T + 2“

nierówność (64) stanowi zaprzeczenie nie

równości (51) czyli oznacza nie—przynależ

ność t do Yn (e) przy n — m 2Ą-j\ więc.nie—

przynależność t do żadnego ze zbiorów (61) pociaga za soban ie—przynależność do Y (0

c. b. d. d. '

Zajmijmy się teraz bliżej zbiorem:

G ⁽m 2, m 2 2 n i , e ) ;

na zasadzie uwagi zrobionej przed chwilą możemy twierdzić, że każda wartość t nale

żąca do G m 2 + 2 ^{e )} należy równo

cześnie do conajmniej jednego ze zbiorów następujących:

(65)

przeto:

(66)

miara G (m2, m 2 -j- 2m, e) ^ miara Ym* [ ^ j +

j — zm f

+ miara g ^ m , j ,

stosując do prawej strony powyższej nie

równości (66) nierówności (55) i (57)) otrzy

mujemy nierówność następującą:

(67) miara G (w2, ;?z2 -f- 2m, £) 4 + 4

jz=2m

m ³⁺ ⁴^% ^t

m^{i + 4 a}¹ ⁺7/7¹

2 i+4oc

W

34-4a

+

ę2 yyi1 + 4«

J. J =

2m⁽27/7-f" i ) 1

2 J '

+

_ i

1

m 3 + 4 a J

Nadając w nierówności powyższej wiel

kości m kolejno wartości następujące:

(68) A, A + 1, . . . A + a

i pamiętając, że miara zbioru—sumy (zbioru wartości t należących do chociażby jednego z danych „zbiorów—składników“) nie prze

kracza sumy miar zbiorów składników, mo

żemy, przez sumowanie, wyprowadzić nie

równość następującą:

(69) miara G (A2, (A+ćz + i)2—1, £) <C

< ± 2 y — '--- l i y

= £< I tn — N , „ = n " ' l+ 4« - ,,, - ,v m 3 + t ó I co

8 /

£

% "*3+4%

CO

\ j d x 2 f dx

2 J

^{x I+4a}

£2 J

^{x 3+ 4or}

i

N — i

a e 2 l ^ 4a ” £ 2 ( l - | - 2 a ) ( A T — 1 ) 2 + 4 «

Kładę, dla krótkości, (70)

2 I , I I

Y) (£ , a , A ) • ( j V _ i ) 4 a ^ £2 ( i - f - 2 a j ' ( # —1)2+ 4«

Oczywiście, przy wszelkiem M > A2, mamy:

(71) miara G (M, (N + a - \ - i ) 2—i, e) <5

^ miara G (A2, (A+ćz+i)2—i, £) < ^ (£, «, A) Treść nierówności (69) (i nierówności wynikającej zeń na zasadzie (71) ) możemy tak wyrazić:

z b i ó r w a r t o ś c i /, p r z y k t ó r y c h n i e r ó w n o ś ć n a s t ę p u j ą c a :

(72)

j —n

n 4

V ?/

(9)

z a w o d z i (czyli nie sprawdza się) c h o c i a ż b y d l a j e d n e j w a r t o ś c i n zawar

tej między M i dowolnie wielką liczbą.

( N + a + i)2— i

ma miarę nie przekraczającą tj (e, a, vV), gdzie N = [ \!M ] oznacza największą liczbę całko

witą nie przekraczającą M.

Przechodząc z języka geometrycznego na język rachunku prawdopodobieństwa i po

zwalając sobie na przejście graniczne przy a ->cc, możemy to samo tak wyrazić:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m i — ^ 0, «, m o ż n a t w i e r d z i ć , że n i e r ó w n o ś ć (72) s p r a w d z a s i ę p r z y w s z e l k i e m n > 7V2.

Skoro do twierdzenia powyższego dodamy jeszcze stwierdzenie oczywistego faktu, że

przy stałym z i a mamy

(73) lim '<] 0, «, A') = ^o

Ar->oo

będziemy mieli jedno z uogólnionych sfor

mułowań z a o s t r z o n e g o p r a w a w i e l k i c h l i c z b 1.

9. Zwykła postać z a o s t r z o n e g o p r a w a w i e l k i c h l i c z b i zwykłe zastosowa

nia statystyczne każą zamiast lewej strony (72) rozważać wyrażenia takie, jak te, które występują w nierównościach (15)—(ió) i (31)—

(32). Nadamy więc nierówności (72) postać następującą (n > N 2):

(74

t j (*) _{« 4} ^-a

Ari~ 2a

/ A"2 U —a

U ) 4 Możemy twierdzić z prawdopodobień

stwem przekraczaj ącem 1—''l (£> -W), że nie

równość (74) zachodzi przy wszelkiem n N 1.

Założymy, że N jest dość wielkie by było:

(75)

( 7 6 )

A 4 « ( A — 1)4«

3_

2

( l+ 2 a ) (A —1)2 + 4« a A4«

Rozwiązanie nierówności (75) da nam (75 bis)

4« log nat [l + -y—i ] < log n a t = 0,405.

ponieważ przy o log nat (1 + ^s)

z

przeto nierówności (75 bis) i (75) będą speł

nione dla wszelkiego N spełniającego waru

nek następujący

(75 ter)

0 , 4 0 6

4 «

0, 10 2

a a

0.102 + I

Przy spełnieniu warunku (75), spełnienie nierówności (76) będzie zapewnione -skoro będzie:

(76 bis) czyli

(76 ter)

(!)

2 + 40C

4«

(1 -f 2a) A2

N

1/ 1+ 2a

I + 2a

4«

przy sprawdzaniu się nierówności (75 ter) i (76 ter) mamy:

(77) v] (e, a, A)

Eł a A4«

Przez podstawienie (14) i uwzględnienie nie

równości:

p (1-/O i

wyprowadzamy z nierówności (74) nierów

ność następującą:

(78)

zn

1 ty (t)—p 1

2

2 A2T^— - f - ) 4_A.—₂_a _{v. n )}

-a

o r z e k a m y z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1 — ^ (£> a> ^0, a w i ę c z p r a w d o p o d o b i e ń s t w e m p r z e k r a-

4 d

c z aj ą c e m 1 — e2a jy*a s p r a w d z a n i e s i ę p o w y ż s z e j n i e r ó w n o ś c i (78) p r z y w s z e l k i e m n Z> N 2.

Jeżeli w powyższym przyjmiemy « — i, odpowiednio do założeń liczbowych § 4,

1

4

- = 0,01

4 . 1 0 4

£2(7 A4« A otrzymamy N = 4.108

10^—4

N 2 — 16.1016.

i Twierdzenie to zostało poraź pierw szy —implicite—wypowiedziane przez B o r e l a w r. 1908. W r. toió w ypow iedział je explicxte C a n t e 1 1 i. Nieco ogólniej wypowiedział je i dow iódł S. M a z u r k i e w i c z ( W iadom ości Aktuarjalne, zeszyt 1, Warszawa 1922) i następnie C h i n c z i n (Osnoivnyje zakony te o r ji w iero ja tn o stiej, Moskwa 1927). W postaci najogólniejszej wspomniane twierdzenie zostało podane po raz pierw szy przez A. K o ł m o g o r o w a ( Comptes Rendus Akademji Paryskiej, 17 listopada 1930).

(10)

Wartości n, przy których wzór (78) jest sto

sowalny, są tu tak wielkie, że odbierają mu wszelką wartość praktyczno-statystyczną.

Nawet jeżeli się zadowolnić wiarogod-.

nością wyniku ponad 0,9 i przybliżeniem p do 0,1, czyli przyjąć:

4 - 0 , 1

— — o ,t ;

2 E%a A 4^»

otrzymamy

^ = 0,1 czyli A = 4 000 N 2= 1 6 . i o G

t. j. wartości niemal nie do użycia w praktyce.

Zostawiając na razie otwartą kwestję po

lepszenia z punktu widzenia praktyczno- liczbowego powyższych wyników (o czem niżej), zwrócimy uwagę na k r y t e r j u m p r z y p a d k o w o ś c i , które otrzymujemy kła

dąc a c —.

4

Weźmy, dla ustalenia uwagi,

a i

T 1

2 N i -2^a

0,1

e 2cc N 4a

otrzymamy: A — 8.104 ; A 2 ===64.108 czyli znowu wartości liczbowe nie do p rak tycznego użytku.

Zasadniczo jednak mamy tu nietylko wartóść przybliżoną />, ale i kryterjum przy

padkowości. W rzeczy samej: z prawdopo

dobieństwem przekraczającem 0,9 orzekamy tu nietylko sprawdzanie się (78) przy pewnej określonej wartości %, ale p r z y w s z e l k i e m n > A 2. Prawa strona (78), zawieraj a ca obok

n y d ą ż ą c y d o z e r a p r z y «->^0: ( " ) aiŚ

dąży do zera przy n -+ ^{c o .} Kryterjum przy

padkowości będzie tu dążenie do określonej granicy wielkości

czynnika stałego: i ‘ 74 c z y n n i k z m i e ń -

(79)

T J H

j Z 4) » ^

n j = z i

Fakt dążenia do granicy da się przetłu

maczyć na język skończonych nierówności niezawierających nieznanej wielkości p cho

ciażby przez „kryterjum istnienia granicy"

(zwane niekiedy „określeniem istnienia gra

nicy") Cauchy’ego.

Rozważania powyższe, jak dotąd, mają charakter czysto-teoretyczny, gdyż liczby wchodzące tu w rachubę są zbyt wielkie dla praktycznego użytku. Przejście od teorji do praktyki wymaga tu przede wszy stkiem licz

bowego polepszenia osiągniętych wyników.

10. Metoda S. Bernsteina, którą rozwija

liśmy w § 5 dla „zwykłego" prawa wielkich liczb, da nam możność polepszenia liczbo

wych wyników i obecnie, przy prawie wiel

kich liczb „zaostrzonem".

Wychodzimy z bardziej specjalnych, niż robione powyżej (zgodne z § 4) założeń § 5 i powtarzamy cały nasz rachunek § 5 do nierówności (28) włącznie.

Przy omawianiu nierówności (28) wcale nie jest poruszana sprawa zmienności wiel

kości d\ n i c s i ę t u n i e z m i e n i j e ż e l i z a ł o ż y m y , ż e d j e s t j a k ą k o l w i e k f u n k c j ą A.

Uważając d za, niesprecyzowaną na razie, funkcję IV:

(80) d = d (N )

możemy orzec:

p r a w d o p o d o b i e ń s t w o z a c h o d z e n i a n i e r ó w n o ś c i n a s t ę p u j ą c e j :

(81)

k—N

Z <Pa (f) d (IV) + 10 b2

-d (N ) 1I N k

n i e p r z e k r a c z a w i e l k o ś c i e

Aby stąd otrzymać „zaostrzone" prawo wielkich liczb wystarczy dobrać funkcję d (N ) w ten sposób by zapewnić zbieżność szeregu:

(82) OO

N ~ AZ

Zbieżność szeregu (82) zachodzi o wiście przy d (A) == Aß przy wszelkiem j nawet przy d (A) = (1 +-%) log A przy w kiem » > 0 ; nie precyzując jeszcze fui

jedynie zbieżność sze

_______ -X / 71/7 \

kiem » > 0 ; nie precyzując jeszcze fi d (A), zakładając jedynie zbieżność sz (82), oznaczam przez o (M) jego resztę kładę:

(83) ^{S W}

OO

N — M

Korzystając z rachunków § 5 [nierówność (31) ] możemy orzec co następuje:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1—2 8 (M) m a m y s p r a w d z a  n i e s i ę n i e r ó w n o ś c i n a s t ę p u j ą c e j : (84) I

II

kr^in

2

?* W k—1

d ( n )

6 / »

+

_{f n}¹⁰⁶

(11)

cl 1 a w s z e l k i e g o n M .

b oznacza tu dowolną wielkość dodatnią (niezależną lub zależną od n) spełniającą (warunki (22)) w istocie niekrępujące nie

równości następujące:

b / r__* b

\ n

(85) (1—pj5

p7 Prawa strona nierówności (84) osiąga (przy stałem n i dowolnie zmiennem b) swe mini

mum dla

(86; d (n) .

1 0 ’

przy wzroście d (n) wolniejszym niż n (co, oczywiście, zakładamy) poczynając od pewnej wartości n nierówności (85) zostają automa

tycznie spełnione, i, jak to łatwo sprawdzić w poniżej robionych zastosowaniach liczbo

wych, nie potrzebujemy się o nie troszczyć.

Dokonywując we wzorze (84) podstawie

nia (86), otrzymujemy (w analogji do wzoru (32) § 5) wynik następujący:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1-2 o {M) o r z e k a m y , s p r a w  d z a n i e s i ę p r z y w s z e l k i e m 11 >> M, n i e r ó w n o ś c i n a s t ę p u j ą c e j :

(87)

J k— «

i r Z W

k ~ l < 2

V L

1 ^{o d (n )}ⁿ

Przeprowadzając podstawienie (14) i pa

miętając, że p (1—■/)<■£, możemy w w yra

żeniu powyższem zastąpić nierówność (87) przez nierówność następującą:

(88) 1 ^k—M

„ k—l Ił* 0^{O - P}

V

^{1 0}^{d (M )}^M

C 1 ^ 10d(») 1 / M ' d (n)

y d (M ) n

Pozostaje nam przerachowanie liczbowe osiągniętego wyniku. Zadowalniając się naj- skromniejszemi z wymagań liczbowych sta

wianych w paragrafie poprzednim, t. j. żąda

jąc wartości p z dokładnością do 0,1 i wia- rogodnością ponad 0,9 kładziemy

(89) (90)

1

/

^Mi ^.—^{< 0,1}

00

2 o (M2) 2 Z e~d ("> < 0,1 ;

H= A f , =

rozwiązawszy związki (89) i (90) przyjmiemy na M większą z dwóch liczb i M 2.

By otrzymać jaknajmniejszą wartość na M 1 winniśmy zakładać j a k n a j p o w o l - n i e j s z y w z r o s t f u n k c j i d(%); by otrzy

mać jaknaj mniej sza wartość na M 2 musimy, przeciwnie, zapewnić jaknajszybszą zbieżność szeregu (82) a tern samem j a k n a j s z y b s z y

w z r o s t f u n k c j i d { n) . Kładziemy:

(91) (92)

d (n) = «ß

o C ß C 1

«ß

lo g n ał n

(93) t (n)

Mamy oczywiście:

(94) ^B—^{d ( n)}= ^c— wß = ^fi— ł ⁽ⁿ⁾ (95)

CO CO co

3 ( M ) = Z e - d ( n ) = Z n — t ( n ) < Z n - t ( M )

n— M co

n z M n—M

/ Al—i

x —t(M) dx _

t (M) — 1

Załóżmy, co jest, praktycznie biorąc, założe

niem niekrępującem:

(96) M 2 > 11 Wystarczy nam założyć

(97) t ( M 2) — i > 1 , 4

by otrzymać nietylko nierówność (po), lecz wynik mocniejszy:

(98) kładę

2 3 (M 2) < 2 ^{1 0 —1,4} M

I

14

(99) « (n) — A n: — log nał n ; (A > o, mamy

A z n z — 1

O)

n) = Ag nz—1 i

11 n

przy Ag = i i n > 1 mamy ^ (n) ponieważ zaś oczywiście ? (1) o o, więc: ę (n) ;> o dla « J> 1

mamy przeto dla wszelkiego o «>1

( 100) log nat n

n z

a

skąd [wobec określenia (98) ] otrzymujemy, dla wszelkiego ^g >> o

(101) t {n) 7> a 7?ß—3;

(12)

jednem z rozwiązań nierówności (97) będzie:

( 102)

a-tu dowolnie obrana wielkość zawarta między 0 i ß.

Przy podstawieniu (91) rozwiązanie równania (89) nie przedstawia trudności. Mamy*.

ß czyli

(103)

Kładąc

(104)

otrzymujemy

1 0 M¹

“ ^mT

ß = -

10^—2

10' -ß i

1 0

10

Äf2 = (24) 3 = 18284 - / 24 40000 M x — i o 5 = 100000

Otrzymujemy więc ostatecznie następu

jące sformułowanie liczbowe:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j a c e m ^ m o ż e m y o r z e c s p r a w d z a n i e s i ę p r z y w s z e l k i e m

n i e r ó w n o ś c i n a s t ę p u j ą c e j : (105) i

n

k ~ n

k=IZ

I

10

n 3

1 0 2

3_

Mio 10'

Mamy tu, jak w § 9, nietylko przybliżoną wartość />, ale i kry ter j urn przypadkowości oparte na dążeniu do zera przy % co prawej strony nierówności (105).

11. Nie zmieniając nawet zasady naszych rozumowań, przez samo wyszukanie opty

malnych wartości spółczynników liczbowych (do czego prowadzi droga przez rozwiązanie szeregu liczbowych równań typu „przestęp

nego“) możnaby dość znacznie polepszyć liczbowo osiągnięte tu wyniki.

Dalsze polepszenie dałoby się osiągnąć—

jeżeli nie przez poszukiwanie funkcyj opty

malnych (czysto matematyczna strona zagad

nienia prowadzi—jak to wykazał przed paru laty Chinczyn—do znalezieniajako optymalny rząd wielkości funkcji log logn; dowód chinczynowski (Fundamenta Mathematicae, tom 6) jest dość zawiły i, w swej obecnej postaci, nie nadaje się do opracowania licz

bowego na użytek statystyki) to przez wpro

wadzenie funkcyj ogólniejszych, niż użyte tu n?j i znowu poszukiwanie optymalnych war

tości spółczynników.

Ale wszystkie te ulepszenia nie rozwią

zują kwestji: j a k i e s ą n a j l e p s z e p o m y ś l a 1 a e o s z a c o w a n i a l i c z b o w e w z a k r e s i e l i c z b , nie dowolnie wielkich, lecz f a k t y c z n i e s p o t y k a n y c h w b a- d a n i a c h s t a t y c z n y c h . Do kwestji te j, postawionej konkretnie dla poszczególnych typów badań statystycznych, spodziewamy się wrócić w dalszych publikacjach.

(13)

AL EX A N D R E RAJ CHM AN

Sur quelques criteres du „par hasard“

(La loi d es grands nombres „ordinaire“ e t la loi d e s grands nombres „ f o r t e “ au point de vue sta tistiq u e )

„Le c rite re du hasard“ c’est le synonyme du „theoreme du Calcul des Probabilites“.

Tont theoreme du Calcul des Probabilites donne virtuellement une condition necessaire (le p e u p r o b a b l e etant assimile ä Pim- p o s s i b l e ) que doivent remplir certaines suites numeriques produites avec Pinterven- tion du hasard. Par consequent tout theoreme du Calcul des Probabilites contient—theori- quement au moins—une methode propre ä contröler les suites des donnees statistiques au point de vue de ce qu’il y doit 6tre d’aleatoire.

Dans ce petit memoire j ’etudie dans cet o r d r e d ’idees l a l o i d e s g r a n d s n o m b r e s

„ c l a s s i q u e “ et l a l o i d e s g r a n d s n o m b r e s „ f o r t e “.

Je commence par citer la demonstration classique de Tchebycheff de la loi des grands nombres „ordinaire“. Pour fixer les idees je ne la developpe numeriquement que dans le cas de Bernoulli. Je fais obser

ver que cette demonstration n ’exige nullement Pindependance absoluc de tous les evenements elementaires, mais seulement leur independance deux-ä-deux ce qui n’est pas la m6me chose. Je precise par un calcul numerique le fait bien connu, que les inega

lites auxquelles conduit la methode de Tchebycheff sont tres peu propres aux appli- cations numeriques dans la pratique statistique.

Pour ameliorer numeriquement la loi des grands nombres au prix de sa generalite, je me sers de la methode de M. Serge Bern

stein. (Theorie des Probabilites r (en russe) Moscou-Leningrade, Edition d’Etat, 1927).

On doit, eil employant cette methode, sup- poser Pindependance absolue des evenements;

on arrive ä la loi des grands nombres precisee par des inegalites p r a t i q u e m e n t u t i l i s a b l e s ; je precise ce fait par un calcul numerique.

Apres avoir etudie ainsi la loi des grands nombres ordinaire, je passe—et c’est cette partie du travail qui contient des resultats qui me paraissent nouveaux—ä la l o i d e s g r a n d s n o m b r e s f o r t e . Je demontre, que la l o i d e s g r a n d s n o m b r e s f o r t e e s t v a l a b l e m o y e n n a n t les m e m e s h y p o t h e s e s , q u e P o n a f ai t i ci d a n s l a d e m o n s t r a t i o n d e T c h e b y c h e f f d e l a l o i d e s g r a n d s n o m b r e s o r d i n a i r e 1;

la loi des grands nombres forte, comme la loi des grands nombres ordinaire, n ’exige que Pindependance deux ä deux des evene

ments elementaires et nullement leur inde

pendance absolue. Pour fixer les idees et rester autant pres que possible des applica- tions statistiques je ne developpe ici la demonstration que dans le cas Bernoulli—

Cantelli mais le fait est tout-ä-fait general et l’explicitation de la demonstration gene

rale est immediate.

Les inegalites auxquelles conduit la de

monstration en question ne sauraient 6tre meilleures que celles de Tchebycheff. Je fais le calcul numerique, qui montre qu’elles sont de beaucoup pires.

i C’est-ä-dire moyennant l ’hypothese des ecarts quadratiques moycns bornes.

(14)

L ’amelioration numerique des resultats au prix de leur generalite peut 6tre ici obtenue encore par un raisonnement tout analogue ä celui de M. Bernstein. En supposant l’independance absolue des evenements et en faisant un raisonnement calque sur celui, que je faisais clans le cas de la loi des grands

nombres ordinaire, j’arrive ä la loi des grands nombres forte precisee par des inegalites qui me paraissent pratiquement utilisables.

Je laisse ouverte la question si les ine

galites considerees sont les meilleures possi- bles. Cette question vaut la peine d’6tre

etiidiee et j ’espere y revenir.

(15)

JERZY NEYMAN

(Z Z ak ład u B io m e tr y c z n e g o In sty tu tu im . M. N e n c k ie g o , T. N. W.)

O korelacji pomiędzy ilorazami o wspólnym mianowniku.

Artykuł niniejszy ma na celu zwrócenie uwagi na pewne błędy metodyczne dość często spotykane w naszych pracach staty

stycznych, szczególnie często w pracach po święconych kwestjom ekonomiki gospodarstw wiejskich.

Nie mając zamiaru wdawać się w krytykę samych prac, tylko stosowanej w nich me

tody, będę rozważał jedno typowe zagad

nienie.

Polega ono na zbadaniu zależności pomię

dzy dochodem z gospodarstw, a rozmaitemi czynnikami na ten dochód wpływającemi, jak obszar, nakład, system gospodarowania i t. p.

Jasnem jest, że czynniki te są wszystkie związane ze sobą i rozplątanie skomplikowa

nych zależności stanowi trudne zadanie sta

tystyczne. Okoliczność ta jest ogólnie uzna

wana i omawiane wadliwe opracowanie ma

te rjał u statystycznego ma właśnie na celu usunięcie zakłócającego wpływu zmienności obszaru na zmienność innych czynników gos

podarczych, których współzależność chcieli

byśmy poznać. I tak, jeśli materjał staty

styczny zawiera dane o obszarze, nakładzie i dochodzie surowym z pewnej liczby gospo

darstw, przyczem obszar ich jest bardzo różny, to dla ustalenia związku pomiędzy nakładem a dochodem obliczenie korelacji pomiędzy temi zmiennemi jest słusznie uważane za za

bieg niewystarczający. Nie ulega bowiem wątpliwości, że śród tych gospodarstw, któ

re mają większy nakład (globalny), częściej spotykają się gospodarstwa o większych obszarach, wobec czego łatwe do skonstato

wania zwiększenie przeciętnego dochodu mo

że być związane całkowicie, lub chociaż tyl

ko częściowo z obszarem a nie z nakładem.

Wspomniana wyżej metoda usuwania tru

dności, którą należy traktować jako konku

rencyjną w stosunku do klasycznych metod

statystyki matematycznej, polega na przeli

czeniu tak nakładu gospodarczego, jak i do

chodu surowego na jednostkę obszaru gospo

darstwa i na następnem obliczeniu korelacji pomiędzy ilorazami.

Metoda ta stosuje się nietylko do badania za

leżności pomiędzy wy mienione mi zmiennemi, lecz do całej masy innych przykładów, jak (i) wydatki na pracę pieszą a (2) obszar pod okopowemi i t. d. W tym ostatnim przykła

dzie wartości obu zmiennych (1) i (2) dzieli się przez obszar gospodarstwa całkowity, względ

nie przez obszar użytków, później oblicza się korelację pomiędzy ilorazami.

Zobaczymy niżej, że stosowanie tej me

tody i wnioskowanie o istnieniu zależności pomiędzy np. nakładem a dochodem ze spół- czynnika korelacji pomiędzy ilorazami musi prowadzić do bardzo grubych błędów— zawsze z wyjątkiem niesłychanie rzadkich przy

padków.

Omówmy tu jeszcze użyte wyżej słowo

„zależność“. Słowo to i jego synonimy rozu

mieć będziemy w tym sensie, że ze zmianą np. nakładu w badanych gospodarstwach zmienia się przeciętny dochód. Może to za

chodzić dlatego, że zmiana nakładu jest p r z y c z y n ą zmiany dochodu, lub też dla

tego, że nakład jest związany z jakimś jeszcze innym czynnikiem, który dopiero wpływa na dochód. Oczywiście związek pomiędzy na

kładem a owym czynnikiem znów może nie posiadać charakteru przyczynowego.

Zdajmy sobie teraz sprawę z dokładnej treści zagadnienia o zależności np. pomiędzy nakładem a dochodem. Niewątpliwie intere

sującą jest tu kwestja, jakby się zmienił przeciętny dochód większej liczby gospo

darstw, gdyby nakład w tych gospodarstwach uległ zmianie w jakimkolwiek kierunku,