• Nie Znaleziono Wyników

Kwartalnik Statystyczny, 1931, T. 8, z. 4

N/A
N/A
Protected

Academic year: 2022

Share "Kwartalnik Statystyczny, 1931, T. 8, z. 4"

Copied!
280
0
0

Pełen tekst

(1)

K W A R T A L N I K S T A T Y S T Y C Z N Y

ROK 1931, TOM V I I I , ZE SZ Y T 4

REVUE TRIMESTRIELLE DE S T A T I S T I Q U E

ANNEE 1931, TOM E VIII, FASCICULE 4

AL. RAJ OHM AN

O niektórycli RryterjacH przypadkowości

(„Prawo wielkich lic z b “ i jego z a o s tr z e n ie w ujęciu staty sty ezn em )

U podstawy naszego badania leży do­

mniemanie, że rozważana cecha jest przy­

padkową, że pojawia się z pewnem s t a ł e m n i e w i a d o m e m p r a w d o p o d o b i e ń ­ s t w e m p.

Zakładamy wzajemną niezależność każdej pary obserwacyj, co nie oznacza zresztą by­

najmniej niezależności obserwacyj w ogóle (jeżeli naprzykład założymy, że prawdopo­

dobieństwo pojawienia się rozważanej cechy u indywiduum numer i jest w każdym razie p i podobnie u indywiduum numer 2, zaś u indywiduum numer 3 owo prawdopodo­

bieństwo wynosi: / , jeżeli wspomniana cecha istnieje i u numeru 1 i u n-ru 2, P (2-p) 1. U podstawy wszelkiego opracowania

materjału statystycznego leży pewne m i n i ­ m u m powziętych zgóry założeń teoretycz­

nych. Im bardziej świadome są te założenia, im jaśniej i dobitniej wysłowione—tern lepiej dla statystyka, który wszak zacząć musi od stwierdzenia: c z y e m p i r y c z n y m a- t e r j a ł n i e k ł ó c i s i ę z p o w z i ę t e m z g ó r y z a ł o ż e n i e m , czy dany schemat przypadkowości „pasuje“. Zarówno formalne opracowanie apriorycznych założeń statysty­

ka, jak i ich krytyka rachunkowa na podstawie empirycznego materjału statystycznego to właściwie już zakres pracy m a t e m a t y k a . Tradycyjne sformułowania klasyków, prze­

pisywane z podręcznika do podręcznika, nie zastąpią tu żywej pracy matematyka, który musi umieć przetłumaczyć na język statysty­

ki każdy postęp teorji prawdopodobieństwa, który musi umieć wyciągnąć sprawdzalne rachunkowo nierówności o praktycznie skoń­

czonej liczbie wyrazów z ogólnych tw ier­

dzeń o mniej czy więcej zawiłych przejściach do granicy.

2. Przyjrzyjmy się zbliska najprostszemu z zadań statystycznych: wyznaczaniu niewia­

domego stałego prawdopodobieństwa. Dla ustalenia uwagi przypuśćmy, że poszukujemy prawdopodobieństwa pewnej cechy, która może być tylko obecną, lub nieobecną, przy- czem nie stawiamy wcale sprawy ewentual­

nie różnego natężenia tej cechy. (Przykład:

stwierdzanie płci noworodka). Wyobraźmy sobie, żeśmy zbadali pewną liczbę indywi­

duów, które oznaczyliśmy numerami:

I, 2, 3, ... /V

każdemu z tych zbadanych indywiduów przy­

pisaliśmy spółczynnik liczbowy: z e r o lub j e d e n .

i By rzecz postawić ściśle na grancie rachunku prawdopodobieństwa, wystarczy założyć, że prawdopodobieństwo nierówności

(l <Z f <Z b mierzy się różnicą: b—a (lub pozornie mniej, że nierówności: M <Z t <Z b i C < Z t <C ^ są równie prawdopodobne wtedy i tylko w tedy, gdy b— O — dC).

2 ( I - / 9

przy nieobecności wspomnianej cechy u n-ru 1 i obecności u n-ru 2, takąż wartość przy obecności tej cechy u n-ru 1 i nieobecności u n-ru 2, wreszcie prawdopodobieństwo p jeżeli nic nie zakładać o indywiduach numery 1 i 2—w tych warunkach mamy niezależność cech indywiduum nr. 3 od cech indywiduów nr. 1 i 2 oddzielnie branych, lecz zależność od pary indywiduów 1 i 2.

W trącona przez nas uwaga nawiasowa nie jest istotna dla dalszego ciągu. Istotnym natomiast jest schemat aprioryczny, z którego korzystamy. Przystępujemy do zdefinjowania tego schematu.

3. Posiadanie, czy nie posiadanie rozwa­

żanej cechy przez każde z N zbadanych indywiduów uważamy za zjawisko przypad­

kowe. Matematycznie możemy to tak ująć:

z każdym ze wspomnianych N indywiduów kojarzymy pewną funkcję zmiennej rzeczy­

wistej t, określonej w przedziale (o— i ) 1.

Funkcję tę nazywamy <]>* (t) (dla k-go indy-

Kwąrtąlnik Statystyczny, l%t. 54

(2)

widuum); funkcja ta przybiera tylko wartości z e r o i j e d e n .

W arun ki stałego prawdopodobieństwa po­

jawiania się danej cechy i warunek nieza­

leżności pojawiania się rozważanej cechy u każdych dwóch różnych indywiduów wy­

rażają się wzorami następującemu

(1)

J

(t) dt = p (przy wszelkiem k)

O

I I I

(2)

J‘

ł* (t)tyi (t) d t - J * ( t ) d t . f 6i (ł)d t= p 2

O o o

(przy k /).

Ciąg empirycznie dany zer i jedynek (ciąg uwidoczniający, które ze zbadanych N indy­

widuów posiada cechę rozważaną, a które nie) uważamy za ciąg postaci

(3) * ł \ ( t ) , ^ ( t ) . - - ^ N ( t )

przy pewnej wartości zmiennej t.

Jeżeli t nie należy do pewnego zbioru wyjątkowego, t. j. jeżeli punkt o odciętej t nie należy do żadnego z pewnych odcinków wyjątkowych o łącznej długości bardzo małej, to ciąg typu (3) musi posiadać pewne wła­

sności liczbowe, stanowiące w danym razie

„kryterja przypadkowości“.

4. „ K r y t e r j a p r z y p a d k o w o ś c i " , o których tu mówimy, są w istocie sprecy- zowanemi wysłowieniami pewnych twierdzeń matematycznych. Sformułowania sprecyzo­

wane to znaczy—mimowoli—sformułowania nieco zamaskowane. Najlepiej więc będzie, jeżeli zaczniemy od podania zwykłych sfor­

mułowań twierdzeń, o które tu idzie, a na­

stępnie dopiero sformułowania te przekształ­

cimy odpowiednio do naszych potrzeb.

Owe twierdzenia to „zwykłe" i „zaostrzo­

n e “ prawa wielkich liczb—w najogólniejszym przypadku — jeżeli nie chcemy rozszerzać naszego minimum powziętych zgóry hypotez.

W najogólniejszym przypadku prawo wielkich liczb—to twierdzenia o układach ortogonalnych.

Niech

(4) tPi ( t ) » (p2 ( t )

będzie ciągiem unormowanych funkcyj orto­

gonalnych, t. j. funkcyj spełniających warunki:

i

(5) J yk (ł) cp7 (/; dt — o dla k ^ l

(6)

1

j yl(t) d ł — i dla wszelkiego k

Z w y k ł e prawo wielkich liczb jest bez­

pośrednim wnioskiem z niemal oczywistej tożsamości następującej:

(7)

skad

J ( i

<p* (t) dł — n

(8)

n

k — ti k — IZ

dt i

71

(9)

Do dalszych sformułowań potrzebne jest nam pojęcie m i a r y z b i o r u . Nie wpro­

wadzając żadnych nowych założeń, specjali­

zując jedynie—co nam wolno—użyte przez nas matematyczne odwzorowanie założeń (stałego prawdopodobieństwa i niezależności spostrze­

żeń parami) możemy założyć, że każda z funkcyj <p* (t) ma tylko conajwyżej skoń­

czoną liczbę punktów nieciągłości i że—dla każdej z funkcyj <p* (t)przedział wartości t (o—1) podzielony został na skończoną liczbę przedziałów, wewnątrz każdego, z których (p* (t) jest stałą.

Przy powyższych założeniach zbiór war­

tości t określony przez każdy ze związków poniższych:

(t)— a ; \<?k(t)I — a ; (p* (t)C a ; | yk (t) \<.a

<?k ( t ) > a; I cp* (t) \>a ; | (t) \< a ; | (t) \>a składa się oczywiście ze skończonej liczby przedziałów odcinka (o— 1) plus ewentualnie skończona liczba punktów. T o s a m o m o ż n a p o w i e d z i e ć o z w i ą z k a c h o g ó l n i e j ­ s z y c h , k t ó r e o t r z y m u j e m y z a s t ę ­ p u j ą c w (9) <?k (t) p r z e z „ k o m b i n a c j ę l i n j o w ą " w i e l k o ś c i cpA (t) t. j. p rz e z wyrażenia postaci następującej:

(10)

y x(t) + A 2 <?2(t) + . . .+ A k <p* (t) + .. Ar A n f(t) A l} A 2 . . . A n oznaczają tu jakiekolwiek stałe.

Możemy teraz zdefinjować pojęcie „ m i a ­ r a z b i o r u " . Miarą odcinka nazywamy jego długość, za miarę punktu oraz zbioru złożo­

nego ze skończonej liczby punktów uważamy z e r o . M i a r a z b i o r u s k ł a d a j ą c e g o s i ę z e s k o ń c z o n e j l i c z b y n i e z a c h o -

(3)

d z ą c y c h n a s i e b i e o d c i n k ó w p l u s e w e n t u a l n i e s k o ń c z o n a l i c z b a p u n k t ó w t o ł ą c z n a d ł u g o ś ć w s p o m ­ n i a n y c h o d c i n k ó w . Innych zbiorów, niż typu opisanego powyżej (t. j. innych, niż składające się z jednego lub kilku nie zacho­

dzących na siebie odcinków plus ewentualnie skończona liczba punktów) nie będziemy tu wcale rozważać (a tern mniej przypisywać im miarę).

Nazwijmy

Z (a, n)

zbiór wartości t spełniających nierówność następującą:

UD

k—r, n k ~ r

a

= )/ n

Z równości (8) wynika bezpośrednio nie­

równość następująca:

(12) — • miara Z ( a , n ) ^ —

n

Czyli

(13) miara Z (a, n) i

5. Zanim pójdziemy dalej (do „zaostrzo­

n ego“ prawa wielkich liczb) zużytkujmy sta­

tystycznie nierówność (13).

Kładę:

Związek (2) § 3-go przybierze postać:

i

f

(t) ©/ ( t ) d t = o dla k ^ l i oczywiście będzie

y \ ( t ) d i = 1 dla wszelkiego k

I

Założenia (5) i (6) § 4 są więc spełnione, spełniona jest przeto i wynikająca z nich teza ( i3).

Dla ustalenia uwagi kładę a = 100.

W terminach rachunku prawdopodobień­

stwa interpretuje się miarę Z (a,n) jako praw­

dopodobieństwo nierówności (11).

Uwzględniając więc wzory (11), ( i3) i (14) i nadając n największą możliwą wartość n — N ( N liczba indywiduów zbadanych, patrz

§ 2), otrzymujemy wynik następujący:

Nierówność:

(15) k-N

Tfc T / 1,■ ... /

V P (1 —P,) h—11

I OO

]/ N

ma prawdopodobieństwo nie większe niż

^ = 0,0001.

Z prawdopodobieństwem przekraczającem 1 — IO* 0,9999 orzekamy więc:

(16)

I k-N

Z tyk(t)— p k—i

100

) / p (i - p ) ]/~N

(gdyż oczywiście: p { i —p) 1

2 ' Ł- i ) .2

Jeżeli Wjest dostatecznie wielkie, jeżeli np.

so

]/ N

1

100

N > 25 000 000 = 25 • 106

nierówność (16) wskazuje nam, że średnia wartość (ł)t.]. stosunek liczby indywiduów posiadających daną cechę do ogólnej liczby indywiduów zbadanych, daje z dwoma zna­

kami dziesiętnemi i prawdopodobieństwem ponad 0,9999 szukane stałe prawdopodobień­

stwo poszukiwanej cechy.

5. Wynik osiągnięty powyżej na zasadzie bezpośredniego zastosowania klasycznego prawa wielkich liczb (nierówności Ć z e b y - s z e w a ) (12) i jej wniosku (16) przedstawia się bardzo skromnie z punktu widzenia praktycznego i teoretycznie da się istotnie pogłębić.

Kosztem zaostrzenia założeń przez zakła­

danie zupełnej niezależności wyników zna­

lezionych u poszczególnych indywiduów moż­

na polepszyć wynik z punktu widzenia licz­

bowego.

W rzeczy samej, jeżeli przypuścimy nie­

zależność obserwacyj będziemy mieli dla wszelkich funkcyj F i tp (dla których symbole użyte poniżej mają sens):

t

(17)

J

F ( $ k (t)) <p(4/ ( ł) ) d ł =

o

I I

J

F (Ąi (t))dt- J < ? ( i ; )

o O

dla l > k

ó* (t) oznacza tu jakąkolwiek wielkość za­

leżną od <5>* (funkcję funkcyj).

(4)

Symbol F(Jjk (t)) był tu nawet zbędny, można było wprost pisać: 6* (t), użyliśmy go jedynie ze względów symetrji.

Kładę:

(1 8) i

—P

=

q

i zachowuję oznaczenie (14).

Mamy oczywiście:

(19) Ceat k <V d t = p ea V 1 + qe~a V 7 ; O

wiadomo, że dla wszelkiego o < s < 3 e z < i z \ z 1 Ą-~ zz ez przeto:

(20)

. 1 , , 5 3

+ -7- 0? p ^ q — ^ e a V przy dostatecznie małem a mamy tai) „ y ? . .ł

nierówność (21) zachodzi napewno, gdy mamy równocześnie:

( 2 2 ) « < j / f i « < j / f + j / |

Związki (19), (20) i (21) dają

(23)

I

§ e a W d t < i + a> {± + ! L ) < e a\ i + ' j ) ; O

na zasadzie związku (17) mamy:

(24)

k = N

a Z yk (t)

e k—i dt =

1 1 1

f Jł...

0 0 o

Zestawiając związki (23) i (24) i kładąc a b

1/ N

otrzymujemy nierówność następującą:

(25)

1

J-

k = N

7n £ , f" (t>

b

l UL y ) iV

g vV V <7 /> /

(7 + 1 ) i, zastępując 6 przez—

(26) / ■

vw J , **w 4 / + 1 ) Gdy p~* o, lub o + 7 rośnie bez granic; dla wartości p bardzo małych, lub bardzo bliskich jedności prawe strony nie­

równości (25) i (26) stają się bardzo wielkie i nierówności same wskutek tego stają się iluzoryczne. Założymy więc, że p niezbyt zbliża się do zera i do jedności. Jest to do­

datkowe założenie aprioryczne, którego k ry ­ tykę może dać choćby rachunek grubych oszacowań podług nierówności Czebyszewa, jak to było wyłożone w § 4.

Założymy, dla ustalenia uwagi, i

1 0 10

10 ; nierówności (25)

(27) j

co da nam:

p_\S_

i (26) wzmocnimy więc zastępując w nich 9 7 + 7 - przez 10. Będziemy wnioskować a f o r t i o r i z tak wzmocnionych nierówności.

Niech d będzie stałą, na razie, dowolną.

Na zasadzie wzmocnionej nierówności (25) nierówność następująca:

(28)

może zachodzić tylko dla zbioru wartości t o mierze mniejszej niż: innemi s ło w y : prawdopodobieństwo sprawdzania się nie­

równości (28) nie przekracza wielkości:

e ~ d

Podobnie, na zasadzie nierówności (26), orzekamy, że prawdopodobieństwo nierów­

ności, którą otrzymuje się z (28) przez za­

mianę b n a — b, nie przekracza e~d \ przeto z prawdopodobieństwem przekraczającem (29) i — 2 e~~d

możemy orzec:

(30) J) /r=?M

Z (') C d-\- 10 b2

(5)

czyli

(31)

2 k ~ N

2

d io b

b ] / N ^ } / N

Nierówność powyższa (3i) zachodzi przy wszelkiej wartości dodatniej jej prawa stro­

na osiąga m i n i m u m przy b — ^ ; m i n i m u m to wynosi:

io d

~N

mamy więc z prawdopodobieństwem prze- kraczającem i — 2 e~d

(32) Z

kazi

V

~N~io d

Jeżeli chcemy osiągnąć wynik, jak przy nierównościach (15) i (16), z prawdopodo­

bieństwem przekraczającem 1 — ^ 4 musimy przyjąć

(33) 2 e~d < 1 o-4 ;

by uczynić zadość nierówności (33) wystar­

czy przyjąć:

d> 8,5 . Wykonywając podstawienie (14) i korzy­

stając z nierówności:

otrzymujemy z nierówności (32) przy pod­

stawieniu d = 8,5 nierówność następującą:

(34)

j k—N

J? I'h U)

-

P

k—l

2 \ f p ( ip )

V'i-V

N85

By otrzymać p z dwoma znakami dziesięt­

nymi z prawdopodobieństwem przekraczają­

cem 0,9999 wystarczy wziąć

czyli N > 850 000

Wartość na N jest tu mniejsza blisko 3o razy, niż wartość podana w końcu § 4.

Przy poprzestaniu na wiarogodności !> 0,9 i dokładności p do 0,1 znajdziemy na N niewielką wartość: 2000.

Myśl zasadnicza rachunku powyższego została wzięta od prof. B e r n s t e i n a (/s- czislenje wierojatiwstuiej\ Moskwa, Wydawnic­

two państwowe, 1927).

Rząd wielkości przybliżenia jaki tu otrzy­

mujemy jest co do istoty ten sam, jaki daje nam ostrzejsze „drugie twierdzenie graniczne“

L a p l a c e ’a. Przy stosowaniu wspomnianego twierdzenia ścisłe oszacowanie błędu jest dość kłopotliwe i przeważna liczba zastoso­

wań spotykanych w podręcznikach statystyki oparta jest na szacowaniach „milczących“, które w istocie nie są wcale ściśle uzasad­

niane.

6. W ynik podany w końcu § 4 jest skromny nietylko praktycznie, ale i teore­

tycznie. Daje on (przy bardzo wysokiej war­

tości N ze stosunkowo niewielką dokład­

nością—to jego p r a k t y c z n e słabe strony) przybliżoną wartość p, ale nie daje on bez­

pośrednio żadnych k r y t e r j ó w p r z y p a d ­ k o w o ś c i , nie daje bezpośrednio możności skrytykowania samych zasadniczych założeń przypadkowości.

Możnaby, takby się zdawało na pierwszy rzut oka, kontrolować założenie przypadko­

wości przez nadawanie N różnych wartości i badanie stałości otrzymywanych tak w różny sposób wartości p.

Przy bliższem wejrzeniu widzimy jednak,że:

12- procentowo nieznaczna zmiana A; nie zaważy znacznie na wartości stosunku

j krz N

y I ^ (*)

k ~ i

j a k a k o l w i e k byłaby natura ciągu zer i jedynek

<b(D> <k(0... ^N(t) ;

mogą więc wchodzić w rachubę tylko p r o ­ c e n t o w o z n a c z n e t. j. absolutnie bardzo znaczne zmiany N powyżej wysokiej granicy, wyznaczonej w § § 4 i 5.

22- zaprzeczeniu nierówności (16) czy (34) przy o k r e ś l o n e j w a r t o ś c i W przypisu­

jemy prawdopodobieństwo mniejsze niż i o —4;

zaprzeczeniu układowi m takich nierówności możemy przypisać jedynie prawdopodobień­

stwo mniejsze od m. io - 4 ;innemi słowy, roz­

ważając układ nierówności takich jak (16) czy (3ą) zamiast jednej nierówności, osłabia­

my przez to wiarogodność konkluzji.

Trudność poruszona ostatnio zostaje roz­

wiązana przez stosowanie t. zw. „zaostrzo­

nego prawa wielkich liczb“, o czem niżej.

7. Przy staniu na gruncie klasycznego (nie

„zaostrzonego") prawa wielkich liczb B e r - n u i l l e g o —C z e b y s z e w a pozostaje nam jako kryterjum przypadkowości k r y t e r j u m

(6)

„ d y s p e r s y j n e “ L e x i s a. Przypatrzmy się tu nieco zastosowaniu tego kryterjum, odkła­

dając szczegółową jego dyskusję do innej pracy.

Lexis poleca rozbić N obserwacji na s grup po k obserwacji w każdej.

Zgodnie z tern kładziemy:

p r (/) — p — 4 - 5 lp j { t ) — p] = % cpy {ł)

j —rk

, . U , „ w

k j = ( r — i ) £ - f - i « J — (*'— i ) Ä -J -I

i, podobnie, wobec wzoru (36)

’= N

(35)

(36)

A W

r —<?

j —rk

Z v w

j = ( r —i ) k + i

_ # -.-,-1 _ J——ks . J---H

p o ( 0 = 4 Z P r ( 0 = T i

Z

ł y ( 0 = 4 Z fc' ( 0

" j —\ j — i

A- y = i % W

wynika stąd (wzory (5) i (6) § 4-go) bezpo­

średnio:

'« ) J [ Pr(0 — P]* =

~~~~ r jPQ p (J

Mamy oczywiście, już przy założeniach J IA>(0 ^ ]2rf# = ^ = A . s

§ 4,

X I 1

(37)

f

p(0m A, (0 dt =

j

(0 * • / a . (0 <*

o 0 0

dla m ^ w i rn^po n ^ o 1

(38) j p n (/) dt — p przy wszelkiem O

I

(39) / p 0 (/) dt = p

o

Lexis rozważa:

„spółczynnik empiryczny“:

(40) A ( 0 = ^ 7 V [o i y ~ i a-(o - a. (o ]

D (/) = ^ ^ 1 M O I i „spółczynnik teoretyczny“

(41)

oraz „spółczynnik dyspersji“

(*2) 5 = ] / ^ -

Sprawdzianem przypadkowościmabyć,podług Lexisa, bliskość do jedności spółczynnika Q.

Mamy oczywiście:

Pj (/) — Po it) = [ A (/) —/ ] + [ p — po {t) ] [ pj [t) —p0 (/)]3 — [ a (/) — p f + [ a (/)—/*?

— 2 [ Po W — Al * [ / / W —Ä skąd, wobec definicji (36), otrzymujemy

(43)

(,__!) ;/(f) = - , [ A ( / ) - +

T

[A w - / ] * ;

r — 1

kładąc jak w (18) : q = 1 — p , mamy, po­

dług wzorów (14) i (35):

# k • s

Zestawiając wzory (ą3), (44) i (45) otrzymu­

jemy:

i

(46) (51) / V { f ) d t - = — ^- + S P£ = ^ ( s —l)

o

czyli:

i

(47) f V( 0 < / / = ^

O

Podręczniki statystyki zazwyczaj utożsa­

miają wartość V (/) z wartością jego „na­

dziei matematycznej “ i

/ f (/) O

i ze wzoru (47) wnioskują o małości róż­

nicy: | 0 — 1|

„V jest bliskie ~ jest również bliskie ^ , więc stosunek tych wielkości jest bliski jedności“.

Rozumowanie podobne zbyt pośpiesznie załatwia się ze sprawą zastosowania prawa wielkich liczb.

Przy 5 d o s t a t e c z n i e w i e l k i e m istotnie, z prawdopodobieństwem bliskiem 1,

można orzec, źe

r ~ s

W 7 £

r = x

mało różni się od i

(49) f [ p r ( t ) — p ] * d t = t e

(7)

Ale jak wielkie musi być s, by z praw ­ dopodobieństwem, powiedzmy > 0,99, można było orzec, że wielkości (48) i (49) różnią się mniej niż np. o 10%? Jak wielkich błędów są powodem „poprawkowe“ wyrazy wzoru (48)?

Rachunek analogiczny do podanego w

§§ 4 i 5 daje odpowiedź dość niezadowala­

jącą na te pytania \ gdyż otrzymane granice na 5 znacznie przekraczają wartości s uży­

wane w praktyce. Należałoby przedyskutować ściśle możność zaostrzenia odnośnych nie­

równości i dokładnie omówić sprawę względ­

nych odchyleń

1

[poW — p YOd /

Mimochodem mogliśmy tylko p o s t a w i ć pewne kwestje dotyczące kryterjum Lexisa.

Przedyskutujemy je ściśle w osobnej pracy.

8. Przechodzimy do „zaostrzonego“ prawa wielkich liczb i jego zastosowania do staty­

styki.

Wracając do funkcyj <?„ ( ł ) § 4, kładę

(50) k —H

s „ ( f ) = Z (ł) ; k—i

niech będzie “ > o i niech £ będzie dowolnie małą wielkością dodatnią.

Nazywam

f„(e)

zbiór wartości t przedziału (o—1) spełnia­

jących nierówność następującą:

(51)

* 7 + »

Mamy oczywiście (wzór (7) § 4-go) 1

(52)

J

s2m ( t ) d ł = 11

O skąd

(53)

J „7 + *

'dł tt

i 4-2»

» 3 1 n

1 2a Z samego określenia zbioru F„ (e) i z po­

wyższej nierówności (58) wynika bezpośre­

dnio nierówność następująca:

i i (54) £2. miara zbioru f w(£) 55 * n2a

Kładę n = m 2 ; mamy oczywiście [na zasadzie powyższej nierówności (58) ]

(55) miara zbioru r m* ( e ) Nazywam

m m 4“

^ («b y, o

zbiór wartości t przedziału (o—1) spełnia­

jących warunek następujący:

(56)

m 24- 2a

Całka z kwadratu lewej strony powyższej nierówności (56) wynosi oczywiście

m 3+ 4®

możemy więc napisać nierówność następującą:

e*. miara zbioru g(jE) S “ 3+4«

czyli:

(57) miara zbioru g (»n ,j, e) § ' m 3+4„

Możemy teraz bezpośrednio zaatakować zagadnienie, którego rozwiązanie stanowi właśnie „zaostrzone prawo wielkich liczb“:

poszukiwać będziemy miary zbioru, który się oznacza w Teorji Mnogości przez:

(58) 2 r*(:)

n ~ N

t. j. zbioru takich wartości /, dla których można dobrać przynajmniej jedno n > N spełniające nierówność (51).

Postanowiliśmy sobie, dla wyeliminowa­

nia trudności związanych z teorją miary i dla wygody czytelnika nie będącego matematy­

kiem, operować wyłącznie zbiorami składa- jącemi się ze skończonej liczby przedziałów (plus, ewentualnie skończona liczba punktów), musimy więc zamiast sumy nieskończonej (58) operować sumą skończoną następującą:

(59)

n—N

A oznacza tu stałą dowolną, większą od N G (A, A , z) to zbiór wartości t takich, dla których nierówność (51) spełnia się przy­

najmniej przy jednej wartości n spełniającej nierówność następującą:

i Założenia § 4 są tu niewystarczające nawet dla stosowania najprostszej, czebyszewow skiej, formy prawa wielkich liczb.

(8)

(60) N c n c A

Poszukujemy miary zbioru G (A, A , £).

Zwrócimy uwagę przedewszystkiem na okoliczność następującą:

w a r u n k i e m k o n i e c z n y m n a l e ż e n i a t d o r m2+7(e) j e s t n a l e ż e n i e t e j ż e w a r t o ś c i t d o e o n aj m n i e j j e d n e g o z d w ó c h z b i o r ó w p o n i ż s z y c h :

(61) m* 2£

(w rzeczy samej: przypuśćmy na chwilę, że / nie należy do żadnego z dwóch zbiorów po­

wyższych (6i), wówczas, jak to wynika bez­

pośrednio z definicji zbiorów (6i), t spełnia równocześnie dwie nierówności następujące:

(62)

(68)

S m 2 ( t ) 3 —I— 2 o.

W a

£ 2

2 <P,- ( f )

t—ro2+i

3 —I— 2 O.

m 2

skąd wnioskujemy bezpośrednio:

(64) S m 2-\~j ( t) 5 » + y (G

31— cc ( * * + 7) T

3 -42 cc W 2

m 2

S m 2 ( t )

S m 2 ( t ) I r= m * + j

3 —J— 2 O t _3_ —J - 2 c c a j C P / ( / )

m 2

w

+

i— m 2-\-j2 <p, ( / )

ł ' r r m 2+ i

-1-L1

2 1 2

« T + 2“

nierówność (64) stanowi zaprzeczenie nie­

równości (51) czyli oznacza nie—przynależ­

ność t do Yn (e) przy n — m 2Ą-j\ więc.nie—

przynależność t do żadnego ze zbiorów (61) pociaga za soban ie—przynależność do Y (0

c. b. d. d. '

Zajmijmy się teraz bliżej zbiorem:

G (m 2, m 2 2 n i , e ) ;

na zasadzie uwagi zrobionej przed chwilą możemy twierdzić, że każda wartość t nale­

żąca do G m 2 + 2 e ) należy równo­

cześnie do conajmniej jednego ze zbiorów następujących:

(65)

przeto:

(66)

miara G (m2, m 2 -j- 2m, e) ^ miara Ym* [ ^ j +

j — zm f

+ miara g ^ m , j ,

stosując do prawej strony powyższej nie­

równości (66) nierówności (55) i (57)) otrzy­

mujemy nierówność następującą:

(67) miara G (w2, ;?z2 -f- 2m, £) 4 + 4

jz=2m

m 3+ 4% t

mi + 4 a1 + 7/71

2 i+4oc

W

34-4a

+

ę2 yyi1 + 4«

J. J =

2m (27/7-f" i ) 1

2 J '

+

_ i

1

m 3 + 4 a J

Nadając w nierówności powyższej wiel­

kości m kolejno wartości następujące:

(68) A, A + 1, . . . A + a

i pamiętając, że miara zbioru—sumy (zbioru wartości t należących do chociażby jednego z danych „zbiorów—składników“) nie prze­

kracza sumy miar zbiorów składników, mo­

żemy, przez sumowanie, wyprowadzić nie­

równość następującą:

(69) miara G (A2, (A+ćz + i)2—1, £) <C

< ± 2 y — '--- l i y

= £< I tn — N , „ = n " ' l+ 4« - ,,, - ,v m 3 + t ó I co

8 /

£

% "*3+4%

CO

\ j d x 2 f dx

2 J

x I+4a

£2 J

x 3+ 4or

i

N — i

a e 2 l ^ 4a £ 2 ( l - | - 2 a ) ( A T — 1 ) 2 + 4 «

Kładę, dla krótkości, (70)

2 I , I I

Y) (£ , a , A ) • ( j V _ i ) 4 a ^ £2 ( i - f - 2 a j ' ( # —1)2+ 4«

Oczywiście, przy wszelkiem M > A2, mamy:

(71) miara G (M, (N + a - \ - i ) 2—i, e) <5

^ miara G (A2, (A+ćz+i)2—i, £) < ^ (£, «, A) Treść nierówności (69) (i nierówności wynikającej zeń na zasadzie (71) ) możemy tak wyrazić:

z b i ó r w a r t o ś c i /, p r z y k t ó r y c h n i e ­ r ó w n o ś ć n a s t ę p u j ą c a :

(72)

j —n

n 4

V ?/

(9)

z a w o d z i (czyli nie sprawdza się) c h o ­ c i a ż b y d l a j e d n e j w a r t o ś c i n zawar­

tej między M i dowolnie wielką liczbą.

( N + a + i)2— i

ma miarę nie przekraczającą tj (e, a, vV), gdzie N = [ \!M ] oznacza największą liczbę całko­

witą nie przekraczającą M.

Przechodząc z języka geometrycznego na język rachunku prawdopodobieństwa i po­

zwalając sobie na przejście graniczne przy a ->cc, możemy to samo tak wyrazić:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a ­ c z a j ą c e m i — ^ 0, «, m o ż n a t w i e r ­ d z i ć , że n i e r ó w n o ś ć (72) s p r a w d z a s i ę p r z y w s z e l k i e m n > 7V2.

Skoro do twierdzenia powyższego dodamy jeszcze stwierdzenie oczywistego faktu, że

przy stałym z i a mamy

(73) lim '<] 0, «, A') = o

Ar->oo

będziemy mieli jedno z uogólnionych sfor­

mułowań z a o s t r z o n e g o p r a w a w i e l ­ k i c h l i c z b 1.

9. Zwykła postać z a o s t r z o n e g o p r a ­ w a w i e l k i c h l i c z b i zwykłe zastosowa­

nia statystyczne każą zamiast lewej strony (72) rozważać wyrażenia takie, jak te, które występują w nierównościach (15)—(ió) i (31)—

(32). Nadamy więc nierówności (72) postać następującą (n > N 2):

(74

t j (*) « 4 -a

Ari~ 2a

/ A"2 U —a

U ) 4 Możemy twierdzić z prawdopodobień­

stwem przekraczaj ącem 1—''l (£> -W), że nie­

równość (74) zachodzi przy wszelkiem n N 1.

Założymy, że N jest dość wielkie by było:

(75)

( 7 6 )

A 4 « ( A — 1)4«

3_

2

( l+ 2 a ) (A —1)2 + 4« a A4«

Rozwiązanie nierówności (75) da nam (75 bis)

4« log nat [l + -y—i ] < log n a t = 0,405.

ponieważ przy o log nat (1 + s)

z

przeto nierówności (75 bis) i (75) będą speł­

nione dla wszelkiego N spełniającego waru­

nek następujący

(75 ter)

0 , 4 0 6

4 «

0, 10 2

a a

0.102 + I

Przy spełnieniu warunku (75), spełnienie nierówności (76) będzie zapewnione -skoro będzie:

(76 bis) czyli

(76 ter)

(!)

2 + 40C

(1 -f 2a) A2

N

1/ 1+ 2a

I + 2a

przy sprawdzaniu się nierówności (75 ter) i (76 ter) mamy:

(77) v] (e, a, A)

Eł a A4«

Przez podstawienie (14) i uwzględnienie nie­

równości:

p (1-/O i

wyprowadzamy z nierówności (74) nierów­

ność następującą:

(78)

zn

1 ty (t)—p 1

2

2 A2T^— - f - ) 4A.—2a v. n )

-a

o r z e k a m y z p r a w d o p o d o b i e ń s t w e m p r z e k r a c z a j ą c e m 1 — ^ (£> a> ^0, a w i ę c z p r a w d o p o d o b i e ń s t w e m p r z e k r a-

4 d

c z aj ą c e m 1 — e2a jy*a s p r a w d z a n i e s i ę p o w y ż s z e j n i e r ó w n o ś c i (78) p r z y w s z e l k i e m n Z> N 2.

Jeżeli w powyższym przyjmiemy « — i, odpowiednio do założeń liczbowych § 4,

1

4

- = 0,01

4 . 1 0 4

£2(7 A4« A otrzymamy N = 4.108

10—4

N 2 — 16.1016.

i Twierdzenie to zostało poraź pierw szy —implicite—wypowiedziane przez B o r e l a w r. 1908. W r. toió w ypow iedział je explicxte C a n t e 1 1 i. Nieco ogólniej wypowiedział je i dow iódł S. M a z u r k i e w i c z ( W iadom ości Aktuarjalne, zeszyt 1, Warszawa 1922) i następnie C h i n c z i n (Osnoivnyje zakony te o r ji w iero ja tn o stiej, Moskwa 1927). W postaci najogólniejszej wspomniane twierdzenie zostało podane po raz pierw szy przez A. K o ł m o g o r o w a ( Comptes Rendus Akademji Paryskiej, 17 listopada 1930).

(10)

Wartości n, przy których wzór (78) jest sto­

sowalny, są tu tak wielkie, że odbierają mu wszelką wartość praktyczno-statystyczną.

Nawet jeżeli się zadowolnić wiarogod-.

nością wyniku ponad 0,9 i przybliżeniem p do 0,1, czyli przyjąć:

4 - 0 , 1

— — o ,t ;

2 E%a A 4»

otrzymamy

^ = 0,1 czyli A = 4 000 N 2= 1 6 . i o G

t. j. wartości niemal nie do użycia w praktyce.

Zostawiając na razie otwartą kwestję po­

lepszenia z punktu widzenia praktyczno- liczbowego powyższych wyników (o czem niżej), zwrócimy uwagę na k r y t e r j u m p r z y p a d k o w o ś c i , które otrzymujemy kła­

dąc a c —.

4

Weźmy, dla ustalenia uwagi,

a i

T 1

2 N i -2 a

0,1

0,1

e 2cc N 4a

otrzymamy: A — 8.104 ; A 2 ===64.108 czyli znowu wartości liczbowe nie do p rak ­ tycznego użytku.

Zasadniczo jednak mamy tu nietylko wartóść przybliżoną />, ale i kryterjum przy­

padkowości. W rzeczy samej: z prawdopo­

dobieństwem przekraczającem 0,9 orzekamy tu nietylko sprawdzanie się (78) przy pewnej określonej wartości %, ale p r z y w s z e l k i e m n > A 2. Prawa strona (78), zawieraj a ca obok

n y d ą ż ą c y d o z e r a p r z y «->^0: ( " ) aiŚ

dąży do zera przy n -+ c o . Kryterjum przy­

padkowości będzie tu dążenie do określonej granicy wielkości

czynnika stałego: i ‘ 74 c z y n n i k z m i e ń -

(79)

T J H

j Z 4) » ^

n j = z i

Fakt dążenia do granicy da się przetłu­

maczyć na język skończonych nierówności niezawierających nieznanej wielkości p cho­

ciażby przez „kryterjum istnienia granicy"

(zwane niekiedy „określeniem istnienia gra­

nicy") Cauchy’ego.

Rozważania powyższe, jak dotąd, mają charakter czysto-teoretyczny, gdyż liczby wchodzące tu w rachubę są zbyt wielkie dla praktycznego użytku. Przejście od teorji do praktyki wymaga tu przede wszy stkiem licz­

bowego polepszenia osiągniętych wyników.

10. Metoda S. Bernsteina, którą rozwija­

liśmy w § 5 dla „zwykłego" prawa wielkich liczb, da nam możność polepszenia liczbo­

wych wyników i obecnie, przy prawie wiel­

kich liczb „zaostrzonem".

Wychodzimy z bardziej specjalnych, niż robione powyżej (zgodne z § 4) założeń § 5 i powtarzamy cały nasz rachunek § 5 do nierówności (28) włącznie.

Przy omawianiu nierówności (28) wcale nie jest poruszana sprawa zmienności wiel­

kości d\ n i c s i ę t u n i e z m i e n i j e ż e l i z a ł o ż y m y , ż e d j e s t j a k ą k o l w i e k f u n k c j ą A.

Uważając d za, niesprecyzowaną na razie, funkcję IV:

(80) d = d (N )

możemy orzec:

p r a w d o p o d o b i e ń s t w o z a c h o d z e n i a n i e r ó w n o ś c i n a s t ę p u j ą c e j :

(81)

k—N

Z <Pa (f) d (IV) + 10 b2

-d (N ) 1I N k

n i e p r z e k r a c z a w i e l k o ś c i e

Aby stąd otrzymać „zaostrzone" prawo wielkich liczb wystarczy dobrać funkcję d (N ) w ten sposób by zapewnić zbieżność szeregu:

(82) OO

N ~ AZ

Zbieżność szeregu (82) zachodzi o wiście przy d (A) == Aß przy wszelkiem j nawet przy d (A) = (1 +-%) log A przy w kiem » > 0 ; nie precyzując jeszcze fui

jedynie zbieżność sze

_______ -X / 71/7 \

kiem » > 0 ; nie precyzując jeszcze fi d (A), zakładając jedynie zbieżność sz (82), oznaczam przez o (M) jego resztę kładę:

(83) S W

OO

N — M

Korzystając z rachunków § 5 [nierówność (31) ] możemy orzec co następuje:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a ­ c z a j ą c e m 1—2 8 (M) m a m y s p r a w d z a ­ n i e s i ę n i e r ó w n o ś c i n a s t ę p u j ą c e j : (84) I

II

kr^in

2

?* W k—1

d ( n )

6 / »

+

f n106

(11)

cl 1 a w s z e l k i e g o n M .

b oznacza tu dowolną wielkość dodatnią (niezależną lub zależną od n) spełniającą (warunki (22)) w istocie niekrępujące nie­

równości następujące:

b / r__* b

\ n

(85) (1—pj5

p7 Prawa strona nierówności (84) osiąga (przy stałem n i dowolnie zmiennem b) swe mini­

mum dla

(86; d (n) .

1 0

przy wzroście d (n) wolniejszym niż n (co, oczywiście, zakładamy) poczynając od pewnej wartości n nierówności (85) zostają automa­

tycznie spełnione, i, jak to łatwo sprawdzić w poniżej robionych zastosowaniach liczbo­

wych, nie potrzebujemy się o nie troszczyć.

Dokonywując we wzorze (84) podstawie­

nia (86), otrzymujemy (w analogji do wzoru (32) § 5) wynik następujący:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a ­ c z a j ą c e m 1-2 o {M) o r z e k a m y , s p r a w ­ d z a n i e s i ę p r z y w s z e l k i e m 11 >> M, n i e r ó w n o ś c i n a s t ę p u j ą c e j :

(87)

J k— «

i r Z W

k ~ l < 2

V L

1 o d (n )n

Przeprowadzając podstawienie (14) i pa­

miętając, że p (1—■/)<■£, możemy w w yra­

żeniu powyższem zastąpić nierówność (87) przez nierówność następującą:

(88) 1 k—M

k—l Ił* 0O - P

V

1 0 d (M )M

C 1 ^ 10d(») 1 / M ' d (n)

y d (M ) n

Pozostaje nam przerachowanie liczbowe osiągniętego wyniku. Zadowalniając się naj- skromniejszemi z wymagań liczbowych sta­

wianych w paragrafie poprzednim, t. j. żąda­

jąc wartości p z dokładnością do 0,1 i wia- rogodnością ponad 0,9 kładziemy

(89) (90)

1

/

Mi .—< 0,1

00

2 o (M2) 2 Z e~d ("> < 0,1 ;

H= A f , =

rozwiązawszy związki (89) i (90) przyjmiemy na M większą z dwóch liczb i M 2.

By otrzymać jaknajmniejszą wartość na M 1 winniśmy zakładać j a k n a j p o w o l - n i e j s z y w z r o s t f u n k c j i d(%); by otrzy­

mać jaknaj mniej sza wartość na M 2 musimy, przeciwnie, zapewnić jaknajszybszą zbieżność szeregu (82) a tern samem j a k n a j s z y b s z y

w z r o s t f u n k c j i d { n) . Kładziemy:

(91) (92)

d (n) = «ß

o C ß C 1

«ß

lo g n ał n

(93) t (n)

Mamy oczywiście:

(94) Bd ( n) = c— wß = fi — ł (n) (95)

CO CO co

3 ( M ) = Z e - d ( n ) = Z n — t ( n ) < Z n - t ( M )

n— M co

n z M n—M

/ Al—i

x —t(M) dx _

t (M) — 1

Załóżmy, co jest, praktycznie biorąc, założe­

niem niekrępującem:

(96) M 2 > 11 Wystarczy nam założyć

(97) t ( M 2) — i > 1 , 4

by otrzymać nietylko nierówność (po), lecz wynik mocniejszy:

(98) kładę

2 3 (M 2) < 2 1 0 —1,4 M

I

14

(99) « (n) — A n: — log nał n ; (A > o, mamy

A z n z — 1

O)

n) = Ag nz—1 i

11 n

przy Ag = i i n > 1 mamy ^ (n) ponieważ zaś oczywiście ? (1) o o, więc: ę (n) ;> o dla « J> 1

mamy przeto dla wszelkiego o «>1

( 100) log nat n

n z

a

skąd [wobec określenia (98) ] otrzymujemy, dla wszelkiego g >> o

(101) t {n) 7> a 7?ß—3;

(12)

jednem z rozwiązań nierówności (97) będzie:

( 102)

a-tu dowolnie obrana wielkość zawarta między 0 i ß.

Przy podstawieniu (91) rozwiązanie równania (89) nie przedstawia trudności. Mamy*.

ß czyli

(103)

Kładąc

(104)

otrzymujemy

1 0 M1

mT

ß = -

10—2

10' -ß i

1 0

10

Äf2 = (24) 3 = 18284 - / 24 40000 M x — i o 5 = 100000

Otrzymujemy więc ostatecznie następu­

jące sformułowanie liczbowe:

z p r a w d o p o d o b i e ń s t w e m p r z e k r a ­ c z a j a c e m ^ m o ż e m y o r z e c s p r a w ­ d z a n i e s i ę p r z y w s z e l k i e m

n i e r ó w n o ś c i n a s t ę p u j ą c e j : (105) i

n

k ~ n

k=IZ

I

10

n 3

1 0 2

3_

Mio 10'

Mamy tu, jak w § 9, nietylko przybliżoną wartość />, ale i kry ter j urn przypadkowości oparte na dążeniu do zera przy % co prawej strony nierówności (105).

11. Nie zmieniając nawet zasady naszych rozumowań, przez samo wyszukanie opty­

malnych wartości spółczynników liczbowych (do czego prowadzi droga przez rozwiązanie szeregu liczbowych równań typu „przestęp­

nego“) możnaby dość znacznie polepszyć liczbowo osiągnięte tu wyniki.

Dalsze polepszenie dałoby się osiągnąć—

jeżeli nie przez poszukiwanie funkcyj opty­

malnych (czysto matematyczna strona zagad­

nienia prowadzi—jak to wykazał przed paru laty Chinczyn—do znalezieniajako optymalny rząd wielkości funkcji log logn; dowód chinczynowski (Fundamenta Mathematicae, tom 6) jest dość zawiły i, w swej obecnej postaci, nie nadaje się do opracowania licz­

bowego na użytek statystyki) to przez wpro­

wadzenie funkcyj ogólniejszych, niż użyte tu n?j i znowu poszukiwanie optymalnych war­

tości spółczynników.

Ale wszystkie te ulepszenia nie rozwią­

zują kwestji: j a k i e s ą n a j l e p s z e p o ­ m y ś l a 1 a e o s z a c o w a n i a l i c z b o w e w z a k r e s i e l i c z b , nie dowolnie wielkich, lecz f a k t y c z n i e s p o t y k a n y c h w b a- d a n i a c h s t a t y c z n y c h . Do kwestji te j, postawionej konkretnie dla poszczególnych typów badań statystycznych, spodziewamy się wrócić w dalszych publikacjach.

(13)

AL EX A N D R E RAJ CHM AN

Sur quelques criteres du „par hasard“

(La loi d es grands nombres „ordinaire“ e t la loi d e s grands nombres „ f o r t e “ au point de vue sta tistiq u e )

„Le c rite re du hasard“ c’est le synonyme du „theoreme du Calcul des Probabilites“.

Tont theoreme du Calcul des Probabilites donne virtuellement une condition necessaire (le p e u p r o b a b l e etant assimile ä Pim- p o s s i b l e ) que doivent remplir certaines suites numeriques produites avec Pinterven- tion du hasard. Par consequent tout theoreme du Calcul des Probabilites contient—theori- quement au moins—une methode propre ä contröler les suites des donnees statistiques au point de vue de ce qu’il y doit 6tre d’aleatoire.

Dans ce petit memoire j ’etudie dans cet o r d r e d ’idees l a l o i d e s g r a n d s n o m b r e s

„ c l a s s i q u e “ et l a l o i d e s g r a n d s n o m b r e s „ f o r t e “.

Je commence par citer la demonstra- tion classique de Tchebycheff de la loi des grands nombres „ordinaire“. Pour fixer les idees je ne la developpe numeriquement que dans le cas de Bernoulli. Je fais obser­

ver que cette demonstration n ’exige nulle- ment Pindependance absoluc de tous les evenements elementaires, mais seulement leur independance deux-ä-deux ce qui n’est pas la m6me chose. Je precise par un calcul numerique le fait bien connu, que les inega­

lites auxquelles conduit la methode de Tchebycheff sont tres peu propres aux appli- cations numeriques dans la pratique statistique.

Pour ameliorer numeriquement la loi des grands nombres au prix de sa generalite, je me sers de la methode de M. Serge Bern­

stein. (Theorie des Probabilites r (en russe) Moscou-Leningrade, Edition d’Etat, 1927).

On doit, eil employant cette methode, sup- poser Pindependance absolue des evenements;

on arrive ä la loi des grands nombres pre- cisee par des inegalites p r a t i q u e m e n t u t i l i s a b l e s ; je precise ce fait par un calcul numerique.

Apres avoir etudie ainsi la loi des grands nombres ordinaire, je passe—et c’est cette partie du travail qui contient des resultats qui me paraissent nouveaux—ä la l o i d e s g r a n d s n o m b r e s f o r t e . Je demontre, que la l o i d e s g r a n d s n o m b r e s f o r t e e s t v a l a b l e m o y e n n a n t les m e m e s h y p o t h e s e s , q u e P o n a f ai t i ci d a n s l a d e m o n s t r a t i o n d e T c h e b y c h e f f d e l a l o i d e s g r a n d s n o m b r e s o r d i n a i r e 1;

la loi des grands nombres forte, comme la loi des grands nombres ordinaire, n ’exige que Pindependance deux ä deux des evene­

ments elementaires et nullement leur inde­

pendance absolue. Pour fixer les idees et rester autant pres que possible des applica- tions statistiques je ne developpe ici la demonstration que dans le cas Bernoulli—

Cantelli mais le fait est tout-ä-fait general et l’explicitation de la demonstration gene­

rale est immediate.

Les inegalites auxquelles conduit la de­

monstration en question ne sauraient 6tre meilleures que celles de Tchebycheff. Je fais le calcul numerique, qui montre qu’elles sont de beaucoup pires.

i C’est-ä-dire moyennant l ’hypothese des ecarts quadratiques moycns bornes.

(14)

L ’amelioration numerique des resultats au prix de leur generalite peut 6tre ici obtenue encore par un raisonnement tout analogue ä celui de M. Bernstein. En supposant l’inde- pendance absolue des evenements et en faisant un raisonnement calque sur celui, que je faisais clans le cas de la loi des grands

nombres ordinaire, j’arrive ä la loi des grands nombres forte precisee par des inegalites qui me paraissent pratiquement utilisables.

Je laisse ouverte la question si les ine­

galites considerees sont les meilleures possi- bles. Cette question vaut la peine d’6tre

etiidiee et j ’espere y revenir.

(15)

JERZY NEYMAN

(Z Z ak ład u B io m e tr y c z n e g o In sty tu tu im . M. N e n c k ie g o , T. N. W.)

O korelacji pomiędzy ilorazami o wspólnym mianowniku.

Artykuł niniejszy ma na celu zwrócenie uwagi na pewne błędy metodyczne dość często spotykane w naszych pracach staty­

stycznych, szczególnie często w pracach po ­ święconych kwestjom ekonomiki gospodarstw wiejskich.

Nie mając zamiaru wdawać się w krytykę samych prac, tylko stosowanej w nich me­

tody, będę rozważał jedno typowe zagad­

nienie.

Polega ono na zbadaniu zależności pomię­

dzy dochodem z gospodarstw, a rozmaitemi czynnikami na ten dochód wpływającemi, jak obszar, nakład, system gospodarowania i t. p.

Jasnem jest, że czynniki te są wszystkie związane ze sobą i rozplątanie skomplikowa­

nych zależności stanowi trudne zadanie sta­

tystyczne. Okoliczność ta jest ogólnie uzna­

wana i omawiane wadliwe opracowanie ma­

te rjał u statystycznego ma właśnie na celu usunięcie zakłócającego wpływu zmienności obszaru na zmienność innych czynników gos­

podarczych, których współzależność chcieli­

byśmy poznać. I tak, jeśli materjał staty­

styczny zawiera dane o obszarze, nakładzie i dochodzie surowym z pewnej liczby gospo­

darstw, przyczem obszar ich jest bardzo różny, to dla ustalenia związku pomiędzy nakładem a dochodem obliczenie korelacji pomiędzy temi zmiennemi jest słusznie uważane za za­

bieg niewystarczający. Nie ulega bowiem wątpliwości, że śród tych gospodarstw, któ­

re mają większy nakład (globalny), częściej spotykają się gospodarstwa o większych obszarach, wobec czego łatwe do skonstato­

wania zwiększenie przeciętnego dochodu mo­

że być związane całkowicie, lub chociaż tyl­

ko częściowo z obszarem a nie z nakładem.

Wspomniana wyżej metoda usuwania tru­

dności, którą należy traktować jako konku­

rencyjną w stosunku do klasycznych metod

statystyki matematycznej, polega na przeli­

czeniu tak nakładu gospodarczego, jak i do­

chodu surowego na jednostkę obszaru gospo­

darstwa i na następnem obliczeniu korelacji pomiędzy ilorazami.

Metoda ta stosuje się nietylko do badania za­

leżności pomiędzy wy mienione mi zmiennemi, lecz do całej masy innych przykładów, jak (i) wydatki na pracę pieszą a (2) obszar pod okopowemi i t. d. W tym ostatnim przykła­

dzie wartości obu zmiennych (1) i (2) dzieli się przez obszar gospodarstwa całkowity, względ­

nie przez obszar użytków, później oblicza się korelację pomiędzy ilorazami.

Zobaczymy niżej, że stosowanie tej me­

tody i wnioskowanie o istnieniu zależności pomiędzy np. nakładem a dochodem ze spół- czynnika korelacji pomiędzy ilorazami musi prowadzić do bardzo grubych błędów— zawsze z wyjątkiem niesłychanie rzadkich przy­

padków.

Omówmy tu jeszcze użyte wyżej słowo

„zależność“. Słowo to i jego synonimy rozu­

mieć będziemy w tym sensie, że ze zmianą np. nakładu w badanych gospodarstwach zmienia się przeciętny dochód. Może to za­

chodzić dlatego, że zmiana nakładu jest p r z y c z y n ą zmiany dochodu, lub też dla­

tego, że nakład jest związany z jakimś jeszcze innym czynnikiem, który dopiero wpływa na dochód. Oczywiście związek pomiędzy na­

kładem a owym czynnikiem znów może nie posiadać charakteru przyczynowego.

Zdajmy sobie teraz sprawę z dokładnej treści zagadnienia o zależności np. pomiędzy nakładem a dochodem. Niewątpliwie intere­

sującą jest tu kwestja, jakby się zmienił przeciętny dochód większej liczby gospo­

darstw, gdyby nakład w tych gospodarstwach uległ zmianie w jakimkolwiek kierunku,

Cytaty

Powiązane dokumenty

ścią, dalej idą spółki firmowe, a na końcu spółki akcyjne. W roku 1928 po nowych przedsiębiorstwach, których odsetek jest wyższy, niż w roku ubiegłym i

W po­ szczególnych dzielnicach jednak, w woje­ wództwie Śląskiem oraz poznańskiem i po ­ ili 01 skiem mamy wzrost, w ostatnich nawet bardzo duży, i tylko w pozostałych

łomem w tern było założenie cykliczności w zjawiskach gospodarczych, jednakże po pierwsze charakter cykliczny właściwie w formie przyjętej obecnie odnosi się

Dla bliższego zaznajomienia się z tem, w jaki sposób statystyka ruchu naturalnego ludności jest opracowywana i publikowana przez poszczególne miasta, przejrzeliśmy

Oczywista, i spis przedsiębiorstw musi być do minimum ograniczony, sytuacja jest tu jednak o tyle odmienna aniżeli przy spisie gospodarstw wiejskich, że .0 ile ten ostatni może

powy klasyfikacji zawodów powinien być ściśle dostosowany do podziału klasyfikacji gałęzi pracy, z tern tylko odstępstwem, że tam gdzie liczba zawodów, zasługujących na

[r]

Dans la balance de 1925 une circonstance favorable pour la Pologne attire surtout notre attention: c ’est que, si l ’on ne tient pas compte de recettes et de dépenses à titre