• Nie Znaleziono Wyników

Analiza trafień w dużym lotto: szóstek, piątek, czwórek, trójek.

N/A
N/A
Protected

Academic year: 2021

Share " Analiza trafień w dużym lotto: szóstek, piątek, czwórek, trójek."

Copied!
18
0
0

Pełen tekst

(1)

Analiza trafień w dużym lotto: szóstek, piątek, czwórek, trójek.

Niech zmienne losowe Xk k 6,5,4,3 mają rozkład zero-jedynkowy z prawdopodobieństwem sukcesu pk :

dla k 6 prawdopodobieństwo trafienia szóstki w dużym lotto dla k 5 prawdopodobieństwo trafienia piątki w dużym lotto dla k 4 prawdopodobieństwo trafienia czwórki w dużym lotto dla k 3 prawdopodobieństwo trafienia trójki w dużym lotto.

Prawdopodobieństwa pk można łatwo obliczyć i są znane.

Przy skreśleniu sześciu liczb czyli po zawarciu jednego zakładu prostego w dużym lotto mamy prawdopodobieństwo trafienia szóstki, prątki, czwórki, trójki odpowiednio pk k 6,5,4,3. Wtedy P(Xk 1) pk P(Xk 0)1 pk k 6,5,4,3.

W dużym lotto tak jak w innych grach mogą zaistnieć nieprawidłowości i nadużycia. Gra jest uczciwa i zgodnie z regulaminem gdy losowanie liczb odbywa się zgodnie z rozkładem równomiernym a grający nie mają żadnych informacji jakie liczby zostaną wylosowane. Wtedy grający skreślają liczby w większości też zgodnie z rozkładem równomiernym. Nieprawidłowości przy zawieraniu zakładów to np. na wylosowanie liczby ma się wpływ i losuje się tak aby zmniejszyć prawdopodobieństwo trafienia szóstki dla pewnej grupy grających i mój podłożony kupon był jedynym wygranym, albo aby wszyscy nie trafili i robimy większą pulę. Nieprawidłowością też byłoby gdyby pewna grupa osób znała wylosowana liczbę. W tych wypadkach i podobnych innych prawdopodobieństwo trafienia odpowiednio szóstki, piątki, czwórki, trójki po zawarciu zakładów i po losowaniu byłoby inne niż odpowiednio pk k6,5,4,3. Oznaczmy te prawdopodobieństwa odpowiednio przez

3 , 4 , 5 , 6 k

k .

Stawiając hipotezę zerową H0:kpk można tą hipotezę zweryfikować na podstawie próby a w naszym przypadku na podstawie zawartych zakładów w losowaniu. Gdyby ona była prawdziwa to tą hipotezę nie można odrzucić na korzyść hipotezy alternatywnej H1:kpk ; H2:kpk ;

k

k p

H3:  tak aby z dużym prawdopodobieństwem hipoteza alternatywna była prawdziwa.

Twierdzenie graniczne Lindeberga-Levy’ego

Dla ciągu niezależnych zmiennych losowych

Xn

n1 o jednakowym rozkładzie, o wartości przeciętnej

m

i skończonej wariancji 2 0, ciąg

 

Fn n1 dystrybuant standardowych średnich arytmetycznych Xn albo standardowych sum

n k

Xi 1

n nm X n

m Y X

n k

i n n

 

 

1

Jest zbieżny do dystrybuanty

rozkładu N(0,1). Wniosek

Dla dużego

n

można stosować wzór przybliżony P(y1Yny2)(y2)(y1)

(2)

gdzie

oznacza dystrybuantę rozkładu N(0,1).

Z twierdzenia Lindeberga-Levy’ego dla ciągu niezależnych zmiennych losowych

 

Yn n1 gdzie YnXk nN kconst lub z twierdzenia Moivre’a-Laplace’a dla ciągu zmiennych losowych







 

1 n1 n k

k

n Y

S wynika, że statystką do weryfikacji hipotezy zerowej jest statystka:

w przypadku gdy npk 50 : k(1 k)

k k

k np p

np U M

 

w przypadku gdy npk 50 : p n

n

Uk (2arcsin Mk 2arcsin k) gdyż wtedy mamy

większe przybliżenie.

gdzie Mk k 6,5,4,3 liczba trafionych odpowiednio szóstek, piątek, czwórek, trójek.

n

- wielkość próby, czyli liczba zawartych zakładów. Rozkłady tych statystyk są w dużym przybliżeniu są rozkładami normalnymi standardowymi tzn. N(0,1).

Przykład I.

W losowaniu z dnia 13 – 02 – 2010r.

szóstka 0 0

piątka 56 5 467,60

czwórka 2753 298,8

trójka 50727 20

n

= 3189467 liczba zawartych zakładów czyli wielkość próby.

6 0

M ; M556 ; M4 2753 ; M350727 Wtedy

96 , 0 3189467 13983816)

arcsin 1 3189467 2

arcsin 0 2

6 (  

U

37 , 0 13983816) 1 258

13983816( 3189467 258

13983816 3189467 258

56 )

1

( 5

5 5 5

5 

 

 

p np

np U M

05 , 6 13983816)

13545 1

13983816( 13545 3189467

13983816 13545 3189467

2753 )

1

( 4

4 4

4 4 

 

 

p np

np U M

(3)

68 , 23 13983816)

246820 1

13983816( 246820 3189467

13983816 246820 3189467

50727 )

1

( 3

3 3 3

3 

 

 

p np

np U M

Z uzyskanych wartości statystyk na podstawie próby można stwierdzić, że nie ma podstaw do odrzucenia hipotezy zerowej w dwóch pierwszych przypadkach, a więc prawdopodobieństwa trafienia szóstki i piątki są równe podobieństwom teoretycznym. W dwóch następnych przypadkach z bardzo dużym prawdopodobieństwem hipotezę zerową odrzucamy na korzyść alternatywnej odpowiednio H2:4p4; H2:3p3 .

Taki efekt uzyskamy np. gdy utrudnia się trafienie szóstki, wylosowując liczby najrzadziej obstawiane przez grających, aby robić większą pulę. To wpływa szczególnie na niższe stopnie wygranych, wpływając nieznacząco na wyższe stopnie. Przyczyną może być gra za pomocą systemów za większe pieniądze.

Przykład II

Losowania można łączyć w jedną próbę składającą się z sumy zakładów pewnej ilości losowań.

Przy skreśleniu sześciu liczb czyli jednym zakładzie w dużym lotto mamy prawdopodobieństwo trafienia odpowiednio szóstki, prątki, czwórki, trójki odpowiednio pk k6,5,4,3 niezależnie w jakim losowaniu zawieramy zakład. Łącząc losowania otrzymamy próby związane z zmiennymi losowymi Xk k 6,5,4,3 pozwalające zweryfikować hipotezę zerową H0:kpk.

Utworzyłem zbiór danych istniejący w pliku ”Wygr_duzy_lotek” składający się z 40 kolejnych losowań z którego uzyskałem dane:

n

= 157216866 liczba zawartych zakładów czyli łączna wielkość próby w 40 losowaniach.

6 19

M ; M52815 ; M4 148776 ; M32736633

Dla tych danych otrzymano odpowiednio następujące wartości statystyk Uk k 6,5,4,3

2,012

6

U ; U5-1,59 ; U4 8,97 ; U3-23,09

Z których wnika, że z prawdopodobieństwem przynajmniej 0,9 a w niektórych przypadkach z prawdopodobieństwem znacznie większym są prawdziwe hipotezy alternatywne :

; : 6 6

6 p

H   H2:5p5 H2:4p4; H2:3p3

W przypadku statystyk związanych z analizą trafień czwórki i trójki daleko odbiegają od trafienia zgodnie z prawdopodobieństwem teoretycznym. Mogło to zaistnieć w przypadku brania regularnego pul, utrudniając trafienie pozostałym.

Szczegółowy opis tych weryfikacji znajduje się w pliku ” Hipotezy trafien w duzym lotek”

Przykład III.

W zbiorze danych istniejący w pliku ”Wyg_dl_II” składający się z 77 kolejnych losowań uzyskałem następujące dane:

n

= 297426865 liczba zawartych zakładów czyli łączna wielkość próby w 77 losowaniach.

(4)

6 20

M ; M55559 ; M4 286263 ; M35153094

Dla tych danych otrzymano odpowiednio następujące wartości statystyk Uk k 6,5,4,3

3 ,

6 0

U ; U50,013 ; U4 0,006 ; U3-42,54

Z których wnika, że w przypadku analizy trafień szóstki, piątki i czwórki hipotezy zerowe są prawdziwe i trafienia były zgodnie z prawdopodobieństwem teoretycznym a wartości statystyk były idealne jakby reżyserowane. W przypadku analizy trafienia trójki liczb to hipoteza alternatywna

: 3 3

2 p

H   z bardzo dużym prawdopodobieństwem jest prawdziwa.

Taka sytuacja może zaistnieć w przypadku ingerencji w wylosowane liczby, dbając aby poprawność statystyk związanych z analizą trafień szóstki, piątki i czwórki były poprawne i przy realizacji innych celów. Wtedy to może zdecydowanie odbić się na trafienia trójek. Nie można wszystkie cele realizować na raz.

Symulacja

Na podstawie przedstawionych przykładów można ogólnie sformułować ogólny wniosek, że w grze w dużym lotto zachodzą bliżej nieokreślone nieprawidłowości lub teoria związana z weryfikacją hipotez zawodzi w praktyce. Poniżej przedstawię symulację związaną z grą w dużego lotka zachowując podobną sytuację występującą w poszczególnych losowaniach. W symulacji łączę 70 kolejnych losowań zaczynając od ilości obstawień podobną jaka występuje w przypadku braku puli, następnie sukcesywnie wzrasta liczba obstawień wraz z wzrostem puli. Po zabraniu puli cykl powraca.

Symulację wykonał program napisany w języku Borland Pascal i losowane liczb do obstawień i losowanie liczb wygranych odbywa się za pomocą procedury n:=random(49)+1; która losuje liczby naturalne od 1 do 49 zgodnie z rozkładem równomiernym. Przy wyborze sześciu liczb jest zachowana zasada, że wśród nich nie może być dwóch takich samych. Wylosowanych zostaje pewna liczba obstawień a następnie losuje się liczby wygrane i oblicza się liczbę trafionych szóstek, piątek, czwórek i trójek. Następnie cykl ponawia się zachowując zasady o których powyżej pisałem. Takich cykli program wykonuje 70 czyli realizuje 70 losowań. Na koniec sumuje się wszystkie ilości obstawień w poszczególnych losowaniach oraz liczby poszczególnych trafień. Takich symulacji wykonałem 15 i otrzymałem następujące wyniki:

Wyniki w trzech pierwszych wierszach liczby dotyczą jednej symulacji związaną z 70 losowaniami.

W następnych wierszach oddzielonych pustym wierszem wyprowadzane są analogicznie wyniki związane z następną symulacją.

Liczby w jednej symulacji wyprowadzane są w następującej kolejności.

M6 M5 M4 M3

n

np6 np5 np4 np4 U6 U5 U4 U3

Liczby npk k6,5,4,3 określają teoretyczną liczbę trafień odpowiednio szóstek, piątek, czwórek, trójek w 70 losowaniach /w symulacji/, gdyż mamy do czynienie z schematem Bernoulliego czyli rozkładem dwumianowym o parametrach liczby doświadczeń

n

i

prawdopodobieństwem sukcesu pk . Jak widać uzyskiwane wartości statystyk są bardzo przyzwoite i w zdecydowanej większości na przyzwoitym poziomie nie ma podstaw do odrzucenia hipotezy zerowej, np. dla wartości statystyk z przedziału <-1,645 , 1,645 > . Dla wartości statystyk dla których odrzuca się hipotezę zerową zachodzi tzw. błąd pierwszego rodzaju: hipoteza zerowa jest prawdziwa a odrzucamy na korzyść hipotezy alternatywnej, która zachodzi z prawdopodobieństwem równym poziomowi istotności

. Na 60 testów na poziomie istotności np. 0,1 ma prawo wystąpić błąd pierwszego rodzaju około 606 razy. W naszym

(5)

przypadku ten błąd wystąpił 5 razy co jest bardzo przyzwoitą liczbą. Na poziomie istotności należałoby odrzucić hipotezę zerową 5–6 razy.

W przykładach I , II , III mieliśmy 12 testów istotności i odrzynaliśmy hipotezę zerową 6-7 razy co zdecydowanie różni się od liczby 121,2. Również w odrzucanych testach wartości statystyk w większości są zdecydowane na zewnątrz przedziału <-1,645 , 1,645 > co jest miarą dużej fałszywości hipotezy zerowej.

Przedstawiona symulacja pokazuje, że teoria związana z weryfikacją hipotez jest prawdziwa.

22 5044 269129 4915453 278200000 20 5133 269470 4910342

0.46 -1.24 -0.66 2.33

19 5389 286607 5206372 295000000 21 5443 285743 5206869

-0.47 -0.73 1.62 -0.22

19 6162 322393 5884346 333400000 24 6151 322938 5884645

-1.05 0.14 -0.96 -0.12

22 6196 330334 6030286 341800000 24 6306 331074 6032908

-0.51 -1.39 -1.29 -1.08

22 5311 279790 5125722 290200000 21 5354 281093 5122147

0.27 -0.59 -2.46 1.59

18 5601 284618 5185979 293800000 21 5421 284580 5185689

-0.68 2.45 0.07 0.13

24 5136 275180 5019675 284200000 20 5243 275282 5016245

0.78 -1.48 -0.19 1.55

19 6286 321463 5866319 332200000 24 6129 321775 5863464

-1.03 2.00 -0.55 1.19

24 4882 260262 4716790 267400000 19 4934 259009 4719718

1.05 -0.73 2.46 -1.36

19 5613 293467 5336445 302200000 22 5576 292717 5333952

-0.58 0.50 1.39 1.09

17 5838 311544 5676024 321400000 23 5930 311314 5672840

-1.34 -1.19 0.41 1.35

(6)

23 5540 291700 5315105 301000000 22 5553 291555 5312772

0.31 -0.18 0.27 1.02

19 5882 306783 5588978 316600000 23 5841 306665 5588118

-0.80 0.53 0.21 0.37

23 5488 283084 5165856 292600000 21 5398 283418 5164508

0.44 1.22 -0.63 0.60

24 4925 256314 4659690 263800000 19 4867 255522 4656177

1.11 0.83 1.57 1.64

Poniżej są przedstawione w wierszu liczby M6

M5

M4 M3

n

U6 U5 U4 U3

dotyczące jednego losowania z pierwszej symulacji 70 losowań. Jeden wiersz jedno losowanie.

0 29 1810 33555 1900000 -0.74 -1.02 -0.71 0.11 0 55 3016 54346 3100000 -0.94 -0.29 0.24 -1.60 0 73 4246 75651 4300000 -1.11 -0.71 1.25 -0.90 0 121 5219 97534 5500000 -1.25 1.94 -1.49 1.48 1 100 6465 117935 6700000 0.62 -2.12 -0.31 -0.95 0 27 1856 33536 1900000 -0.74 -1.36 0.36 0.00 0 64 3028 55341 3100000 -0.94 0.90 0.46 2.69 0 90 4268 75945 4300000 -1.11 1.20 1.60 0.18 2 105 5357 97178 5500000 1.57 0.35 0.41 0.33 0 37 1892 33579 1900000 -0.74 0.33 1.20 0.24 0 47 2999 54664 3100000 -0.94 -1.35 -0.07 -0.23 0 85 4213 76104 4300000 -1.11 0.64 0.74 0.76 1 99 5313 97675 5500000 0.75 -0.25 -0.20 1.94 0 41 1896 33777 1900000 -0.74 1.00 1.30 1.33 1 50 3023 54782 3100000 1.06 -0.95 0.37 0.28 0 44 1832 33552 1900000 -0.74 1.51 -0.20 0.09 0 46 3016 55086 3100000 -0.94 -1.48 0.24 1.59 0 74 4154 75965 4300000 -1.11 -0.60 -0.17 0.25 0 103 5473 96986 5500000 -1.25 0.15 2.00 -0.30 1 113 6508 118744 6700000 0.62 -0.95 0.23 1.43 0 43 1858 33396 1900000 -0.74 1.34 0.41 -0.77 1 56 3011 54526 3100000 1.06 -0.16 0.15 -0.82 0 30 1781 33488 1900000 -0.74 -0.85 -1.38 -0.26 0 59 2996 54948 3100000 -0.94 0.24 -0.12 1.00 1 93 4146 76229 4300000 0.89 1.53 -0.30 1.22 0 43 1807 33400 1900000 -0.74 1.34 -0.78 -0.75 0 48 3016 54639 3100000 -0.94 -1.22 0.24 -0.33 0 65 4177 75883 4300000 -1.11 -1.61 0.19 -0.05 1 93 5394 97261 5500000 0.75 -0.84 0.91 0.60

(7)

0 40 1843 33630 1900000 -0.74 0.84 0.06 0.52 1 54 3060 54779 3100000 1.06 -0.42 1.05 0.27 0 34 1832 33424 1900000 -0.74 -0.18 -0.20 -0.62 0 74 2897 54786 3100000 -0.94 2.22 -1.93 0.30 0 76 4106 76168 4300000 -1.11 -0.37 -0.92 0.99 0 88 5364 97761 5500000 -1.25 -1.34 0.50 2.21 0 128 6465 118720 6700000 -1.38 0.39 -0.31 1.36 2 149 7566 139468 7900000 1.33 0.27 -0.98 0.08 0 33 1805 33505 1900000 -0.74 -0.35 -0.83 -0.17 0 46 2972 54740 3100000 -0.94 -1.48 -0.56 0.10 0 72 4182 76151 4300000 -1.11 -0.82 0.26 0.93 0 105 5450 96596 5500000 -1.25 0.35 1.68 -1.56 2 113 6515 118453 6700000 1.44 -0.95 0.31 0.57 0 31 1821 33525 1900000 -0.74 -0.68 -0.45 -0.06 0 44 3022 54573 3100000 -0.94 -1.74 0.35 -0.62 0 78 4182 75797 4300000 -1.11 -0.15 0.26 -0.37 0 98 5296 96708 5500000 -1.25 -0.34 -0.43 -1.20 0 113 6559 118511 6700000 -1.38 -0.95 0.86 0.74 1 150 7624 139607 7900000 0.50 0.35 -0.32 0.46 0 41 1841 33235 1900000 -0.74 1.00 0.01 -1.66 0 51 2952 54517 3100000 -0.94 -0.82 -0.93 -0.86 0 74 4114 76152 4300000 -1.11 -0.60 -0.79 0.93 0 86 5328 97357 5500000 -1.25 -1.54 0.01 0.91 0 131 6421 118980 6700000 -1.38 0.66 -0.85 2.12 1 128 7584 139409 7900000 0.50 -1.47 -0.78 -0.08 0 32 1773 33488 1900000 -0.74 -0.52 -1.57 -0.26 0 51 2976 54834 3100000 -0.94 -0.82 -0.49 0.51 0 81 4105 75965 4300000 -1.11 0.19 -0.93 0.25 1 105 5337 97049 5500000 0.75 0.35 0.13 -0.09 0 52 1796 33505 1900000 -0.74 2.86 -1.03 -0.17 0 44 2989 54979 3100000 -0.94 -1.74 -0.25 1.13 1 80 4254 75793 4300000 0.89 0.07 1.38 -0.38 1 29 1704 33663 1900000 1.26 -1.02 -3.18 0.70 0 25 1825 33669 1900000 -0.74 -1.70 -0.36 0.73 0 60 2893 54804 3100000 -0.94 0.37 -2.00 0.38 0 72 4180 75760 4300000 -1.11 -0.82 0.23 -0.50 0 109 5311 97257 5500000 -1.25 0.75 -0.22 0.58 2 146 6348 118257 6700000 1.44 2.01 -1.76 -0.00 0 40 1810 33346 1900000 -0.74 0.84 -0.71 -1.05 0 60 3102 54769 3100000 -0.94 0.37 1.81 0.23 1 88 4155 76058 4300000 0.89 0.97 -0.16 0.59

Analiza wyników

Z przedstawionych wyników wynika, że istnieje istotna różnica między liczbą trafień występująca w rzeczywistym a teoretycznym przebiegu gry w dużym lotto. Prawdziwość teoretycznego przebiegu gry potwierdza przedstawiona powyżej symulacja. W teoretycznym przebiegu gry zakłada się, że:

a). Losowanie wygranych liczb powinno odbywać się zgodnie z rozkładem równomiernym i nie powinno się ingerować w wylosowane liczby. Ponieważ wylosowanych wygranych liczb / realizacji losowań / nie jest tak wielka to można zapewnić rozkład równomierny a przy okazji realizować pewne cele.

(8)

b). Ciąg zmiennych losowych

 

Yn n1 gdzie YnXk nN kconst związany z kolejnymi zawieranymi zakładami prostymi powinien być niezależny. Uzyskamy to w przypadku gdy przy zawieraniu prostego zakładu nie znamy jakie zostaną wylosowane liczby i nie wiemy jakie liczby skreślają inni oraz nie sugerujemy się zbytnio częstością wylosowywanych liczb w poprzednich losowaniach. To odbywa się na przykład przy zawieraniu prostych zakładów na chybił trafił.

Występuję prawie niezależność zmiennych w przypadku zawieraniu kilka i kilkanaście zakładów prostych przez jedną osobę. Istotne zakłócenie niezależności może wystąpić przy zawieraniu

zakładów za pomocą systemów skreślając w zakładzie więcej niż 6 liczb. Wtedy otrzymamy

)!6(!6

!

6  

 

k

kk

zakładów prostych gdzie k liczba skreślonych liczb. Z tymi zakładami prostymi odpowiadające zmienne losowe są zależne. Jak to wpływa na liczbę trafień. Z symulacji zawartych w plikach:

”Symulacja systemem skreslając 9 liczb”

”Symulacja systemem skreslając 8 liczb”

”Symulacja systemem skreslając 7 liczb”

Wynika, że wraz ze wzrostem skreślonych liczb rozrzut uzyskiwanych wartości statystyk jest większy z wartością oczekiwaną taką samą równą zeru. W tym przypadku pokazałem, że zmienne losowe

(9)

3 , 4 , 5 , 6 ) 1

( 

  l

p np

np U M

l l

l l

l mają rozkład asymptotycznie N(0, , gdzie na odchyleniel) standardowe  istnieją wzory zależne tylko od k /liczby skreślanych liczb w systemie/ i liczbyl

l . Tabela I.

k6k5k4k3k

6 1 1 1 1

7 0,999999

8 1,44670 1,7576 1,9865

8 0,999999

0 1,84882 2,6090 3,2386

9

0,999997

0 2,23053 3,5644 4,7863

10 0,999992

5 2,60071 4,6219 6,6428

11 0,999983

5 2,96350 5,7772 8,8143

12 0,999967

0 3,32109 7,0253 11,3028

13 0,999938

7 3,67471 8,3617 14,1071

14 0,999892

7 4,02501 9,7812 17,2240

15

0,999821

1 4,37233 11,2791 20,6479 16

0,999713

7 4,71678 12,8503 24,3714

17 0,999557

4 5,05827 14,4895 28,3851

18 0,999336

0 5,39659 16,1912 32,6778

19 0,999029

4 5,73139 17,9496 37,2362

20 0,998613

2 6,06223 19,7584 42,0453

21 0,998057

9 6,38855 21,6109 47,0877 22

0,997328

6 6,70966 23,5001 52,3442

23 0,996384

1 7,02480 25,4182 57,7932

24 0,995175

8 7,33304 27,3571 63,4106

25 0,993647

5 7,63338 29,3077 69,1701

26 0,991733

9 7,92464 31,2604 75,0421

27 0,989359

4 8,20552 33,2048 80,9946 28 0,986437 8,47455 35,1293 86,9917

(10)

5

29 0,982868

7 8,73007 37,0216 92,9944

30 0,978539

0 8,97023 38,8680 98,9592 31

0,973317

9 9,19295 40,6536

104,838 2 32

0,967055

9 9,39588 42,3617

110,578 2

33 0,959581

4 9,57636 43,9742 116,120

2

34 0,950696

8 9,73139 45,4704 121,397

8

35 0,940173

3 9,85753 46,8274 126,336

4

36 0,927745

1 9,95082 48,0191 130,851

7

37 0,913100

1 10,0066

5 49,0156 134,846

9 38

0,895868 5

10,0196

4 49,7822

138,210 0

39 0,875606

0 9,98335 50,2783 140,810

0

40 0,851770

4 9,88999 50,4551 142,490

2

41 0,823685

5 9,72994 50,2530 143,060

2

42 0,790485

5 9,49094 49,5972 142,281

9

43 0,751022

7 9,15686 48,3903 139,846

9

44 0,703703

4 8,70551 46,4996 135,338

3 45

0,646170

8 8,10427 43,7326

128,154 8

46 0,574601

8 7,30071 39,7828 117,347

1

47 0,481812

1 6,19719 34,0862 101,180

4

48 0,349927

1 4,55321 25,2684 75,4637

49 0 0 0 0

Z przedstawionych wyników wynika, że na liczbę trafionych szóstek, systemy prawie nie mają wpływu i zmienna lisowa 6(1 6)

6 6

6 np p

np U M

  ma rozkład prawie asymptotycznie normalny

standaryzowany. Dla dużej liczby obstawień

n

zawieranych dowolnym sposobem U6N(0,1) . W przypadku badaniu liczby trafienia szóstki

n

powinno być znacznie większe niż w przypadku badania liczby trafień niższych stopni. Dlatego w badaniu liczby trafionych szóstek należy łączyć losowania i na podstawie sumy trafionych szóstek i sumy zawartych zakładów oblicza się wartość statystyki . W badaniu liczby trafień niższych stopni liczba zawieranych zakładów w jednym losowaniu daje dostatecznie dobre przybliżenie statystyki w stosunku do rozkładu granicznego.

Wszystko to i uzyskane obliczenia, potwierdzają symulacje przez mnie przeprowadzone. Np.

(11)

badając liczbę trafionych szóstek łącząc 40 losowań, funkcja gęstości empiryczna z próby prawie pokrywają się z funkcją gęstości graniczną teoretyczną. To samo istnieje w innych badaniach, nawet ograniczając się do jednego losowania.

Np.

Rys 1.

Kolorem niebieskim - wykre funkcji gęstości empirycznej uzyskany na podstawie 1000 krotnej symulacji /1000 elementowej próby/ łącząc 40 losowań w badaniu liczby trafionych szóstek.

Zakłady są zawierane systemem skreślając 11 liczb.

Kolorem czerwonym - funkcja gęstości rozkładu N(0,1) . Np.

Rys 2.

Kolorem niebieskim - wykres funkcji gęstości empirycznej uzyskany na podstawie 1050 krotnej symulacji /1050 elementowej próby/ bez łączenia losowań /na podstawie jednego losowania jest obliczna wartość statystyki/, przy badaniu liczby trafionych czwórek. Zakłady są zawierane systemem skreślając 9 liczb.

Kolorem czerwonym - funkcja gęstości rozkładu N(0;3,6) .

Biorąc np. skrajną symulację, zawierając zakłady systemem skreślając 9 liczb, zawieramy 84 zakłady proste i z tymi zakładami zmienne losowe są istotnie zależnie. Natomiast zmienne losowe związane z zakładami prostymi występujące w różnych blokach systemów 9 liczbowych są już niezależne. Można utworzyć 84 podciągi niezależnych zmiennych losowych , rozłącznych , których

(12)

suma będzie odpowiadać ciągowi zmiennych losowych zawieranych prostych zakładów. Pozwala to wyznaczyć graniczny rozkład występujący w tym przypadku.

Ponieważ zakłady w dużym lotto są zawierane tylko za pomocą zakładów prostych skreślając 6 liczb lub za pomocą systemów skreślając k liczb gdzie k{6,7,8,9,10,11,12} /zgodnie z regulaminem/ to wartość statystyki 6,5,4,3

) 1

( 

  l

p np

np U M

l l

l l

l jest sumą wartości

niezależnych statystyk Ulk l6,5,4,3 k{6,7,8,9,10,11,12} przyjmujących wartości - liczbą trafień l liczb, zawierając zakłady systemem k liczbowym. Jeżeli

12 , 11 , 10 , 9 , 8 , 7 , 6 3 , 4 , 5 , 6

~  lim  



U l k

U lk

n k

l to jak pisałem powyżej /dowód tych faktów

posiadam/ U~ ~ N(0, lk) l 6,5,4,3 k6,7,8,9,10,11,12 k

l  gdzie na wartości odchyleń

standardowych lk istnieją precyzyjne wzory i te wartości zamieściłem w Tabeli I. Niestety zazwyczaj ~ 6,5,4,3

~ ....

~

~ U6U7 U12 l

Ul l l l i ~  lim 6,5,4,3



U l

U l

l n zależy od

procentowego udziału w zakładach, zakładów prostych zawieranych systemem k liczbowym.

Jeżeli ustalimy liczby nk100% - procentowe udziały obstawień zakładów prostych zawarte przez systemy skreślając k liczb w stosunku od liczby wszystkich zakładów prostych zawartych w losowaniu lub grupie losowań to wtedy istnieje również U~l

graniczny rozkład statystyki 3

, 4 , 5 , 6 ) 1

( 

  l

p np

np U M

l l

l l l

taki, że U~l ~ N(0,l) i

2 12 12 2 11 11 2 10 10 2 9 9 2 8 8 2 7 7 2 6

6( l ) ( l ) ( l) ( l) ( l ) ( l ) ( l )

l nnnnnnn

dla ustalonych

 12

6

1

1 , 0

k k

k n

n . A więc przy ustalonych wartościach nk k 6,7,8,9,10,11,12

istnieje jednoznacznie określony rozkład graniczny. W losowaniu lub w grupie losowań liczby 12

, 11 , 10 , 9 , 8 , 7 , 6 1 ,

0  

 k

nk są znane. Dla odpowiednio dużej liczby

n

zawartych

zakładów statystyki 6,5,4,3 )

1

( 

  l

p np

np U M

l l

l l

l mogą służyć do weryfikacji hipotez o prawidłowościach zachodzących w grze w dużym lotto. Z wzoru na odchylenie standardowe l

dla l 6 mamy, że 61 niezależnie od wartości liczb 12

, 11 , 10 , 9 , 8 , 7 , 6 1 ,

0  

 k

nk co oznacza, że systemy nie mają wpływu na liczbę trafionych szóstek. Oznacza to, że osoby grające za pomocą tylko zakładów prostych i osoby grające systemami ale zawierające tyle samo w sumie zakładów prostych mają jednakową możliwość trafienia szóstki.

Przykładowe wartości:

0,4 5 0,1

5 0,1 0 0,0

5 0,0 5 0,0

5 0,1

5 0,99999

36 1,94583

27 3,51702

08 5,33761 56

(13)

0,8 0 0,1

5 0,0 5 0,0

0 0,0 0 0,0

0 0,0

0 0,99999

99 1,13351

13 1,26637

98 1,38432 43 0,6

0 0,1 5 0,1

0 0,0 5 0,0

5 0,0 5 0,0

0 0,99999

85 1,51056

91 2,26190

39 3,07849 76 0,3

0 0,1 5 0,1

0 0,0 5 0,0

5 0,1 5 0,2

0 0,99999

03 2,25077

32 4,24556

02 6,51897 18 0,0

0 0,0 0 0,0

0 0,0 0 0,2

0 0,3 0 0,5

0 0,99997

71 3,08257

32 6,24200

48 9,79844 72 0,6

0 0,1 4 0,0

7 0,0 5 0,0

2 0,0 1 0,1

1 0,99999

58 1,67851

18 2,88690

89 4,32948 18

Rys.3

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 300 krotnej symulacji /300 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych szóstek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 15 , 0

; 05 , 0

; 05 , 0

; 05 , 0

; 10 , 0

; 15 , 0

; 45 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;1) .

Rys. 4

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 300 krotnej symulacji /300 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych piątek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 15 , 0

; 05 , 0

; 05 , 0

; 05 , 0

; 10 , 0

; 15 , 0

; 45 ,

0 7 8 9 10 11 12

6nnnnnn

n .

(14)

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;1,95) .

Rys. 5

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 300 krotnej symulacji /300 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych czwórek. Zakłady są zawierane sposobem mieszanym o stałym procentowym udziale systemów:

; 15 , 0

; 05 , 0

; 05 , 0

; 05 , 0

; 10 , 0

; 15 , 0

; 45 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;3,52) .

Rys. 6

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 300 krotnej symulacji /300 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych trójek.

Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 15 , 0

; 05 , 0

; 05 , 0

; 05 , 0

; 10 , 0

; 15 , 0

; 45 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;5,34) .

(15)

Rys. 7

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 12000 krotnej symulacji /12000 elementowej próby/ bez łączenia losowań /na podstawie jednego losowania jest obliczna wartość statystyki/, przy badaniu liczby trafionych trójek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 15 , 0

; 05 , 0

; 05 , 0

; 05 , 0

; 10 , 0

; 15 , 0

; 45 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;5,34) .

Analogiczne symulacje ale przy innym udzialie procentowym systemów i 1000 krotnej symulacji / 1000 elementowej próby/.

Rys. 8

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 1000 krotnej symulacji /1000 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych szóstek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 11 , 0

; 01 , 0

; 02 , 0

; 05 , 0

; 07 , 0

; 14 , 0

; 60 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;1) .

(16)

Rys. 9

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 1000 krotnej symulacji /1000 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych piątek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 11 , 0

; 01 , 0

; 02 , 0

; 05 , 0

; 07 , 0

; 14 , 0

; 60 ,

0 7 8 9 10 11 12

6nnnnnn

n

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;1,6785) .

Rys. 10

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 1000 krotnej symulacji /1000 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych czwórek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 11 , 0

; 01 , 0

; 02 , 0

; 05 , 0

; 07 , 0

; 14 , 0

; 60 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;2,8869) .

(17)

Rys. 11

Kolorem niebieskim - wykres funkcji gęstości empiryczny uzyskany na podstawie 1000 krotnej symulacji /1000 elementowej próby/ przy łączeniu 40 losowań, przy badaniu liczby trafionych trójek. Zakłady są zawierane w jednym losowaniu sposobem mieszanym o stałym procentowym udziale systemów:

; 11 , 0

; 01 , 0

; 02 , 0

; 05 , 0

; 07 , 0

; 14 , 0

; 60 ,

0 7 8 9 10 11 12

6nnnnnn

n .

Kolorem czerwonym - funkcja gęstości o rozkładzie N(0;4,329482) .

Wykresy Rys.3 - Rys.6 dla próby 300 elementowej i wykresy Rys.8 - Rys.11 dla próby 1000 elementowej potwierdzją fakt, że funkcje gęstości empirycznych oscylują wokół funkcji gęstości teoretycznych bliżej wraz ze wzrostem wielkości próby. Graniczna funkcja gęstości empirycznych pokrywa się z teoretyczną - wykres R ys.7. Odstęstwo najbardziej występuje w wierzchołku wykresu ale jest to związane z nie zawszwe najwłaścieszym doborem przedziałów klasowych które w symulacji są dobierane automatycznie. Taka własność występuje w większości przypadków i można to usunąć poprzez zagęszczenie przedziałw klasowych wokół wierzchołka.

Przedstawione powyżej wykresy absolutnie potwierdzają wyprowadzone przez mnie wzory i inne fakty takie jak np. możliwość łączenia losowań. Symulacja moim programem dla próby 1000 elementowej trwała 24 godziny. Wyprowadzne elementy w tej symulacji zamieszczone są w pliku

"Symulacja z procent udziale 60,14,7,5,2,1,11" zamieszczonego na stronie internetowej.

Podsumowując:

10 W badaniu liczby trafień szóstek do weryfikacji hipotezy H0:6p6 może służyć statystyka )

1

( 6

6 6 6

6 np p

np U M

  gdzie

p6 prawdopodobieństwo trafienia szóstki ,

n

wielkość próby czyli liczba zawartych zakładów w losowaniu czy w sumie łączonych losowaniach.

M6 liczba trafionych szóstek w zawartych

n

zakładach.

Statystyka ta ma rozkład N(0;1) pod warunkiem, że np68. W jednym losowaniu ten warunek zazwyczaj nie jest spełniony. Uzyskamy spełniony ten warunek gdy połączymy np. 40 lub więcej kolejnych losowań . Wartość tej statystyki nie zależy od sposobu zawierania zakładów tzn.

nie zależy od używanych systemów. Na wartość statystyki mogą wpłynąć tylko nieprawidłowości przeprowadzania zakładów.

W literaturze stosowanie tej statystyki zaleca się gdy spełniona jest nierówność np50. W przeciwnym przypadku zaleca się inną przedstawioną na początku statystykę. Jak pokazała

symulacja /patrz rys. 1 rys. 3/ statystyka określona tym wzorem daje bardzo dobre przybliżenie rozkładu N(0;1) .

W przykładzie II wartość statystyki U62,3 / wzorem zalecanym literaturą - U62,012/

(18)

A więc z prawdopodobieństwem przynajmniej 0,98 hipoteza alternatywna H2:6p6 jest prawdziwa. Jak wykazała analiza systemy nie mają wpływu na ten test gdy nie występują nieprawidłowości zawierania i realizacji zakładów. Mógł zajść błąd I rodzaju, że hipoteza

6 6

0: p

H   jest prawdziwa a przyjmujemy hipotezę alternatywną H2:6p6 . Ten błąd występuje z prawdopodobieństwem 1-0,98=0,02.

20 W badaniu liczby trafień piątek, czwórek, trójek do weryfikacji hipotezy Hl:lpl może służyć statystyka 5,4,3

) 1

( 

  l

p np

np U M

l l

l l

l gdzie

3 , 4 , 5 l

pl prawdopodobieństwo trafienia odpowiednio piątki, czwórki, trójki.

n

wielkość próby czyli liczba zawartych zakładów w losowaniu czy w sumie łączonych losowaniach.

3 , 4 , 5 l

Ml liczba trafionych odpowiednio piątek, czwórek, trójek w zawartych

n

zakładach.

Statystyka ta dla odpowiednio dużego

n

np. występująca w jednym losowaniu ma rozkład 3

, 4 , 5 ) , 0

( l

Nl . Odchylenie standardowe  zależy od procentu udziałów systemów w grzel

tzn. od liczb 0,1 6,7,8,9,10,11,12 12 1

6



i

i

k k n

n . Liczby te w zawartych zakładach

są znane. Np. dla

; 15 , 0

; 05 , 0

; 05 , 0

; 05 , 0

; 10 , 0

; 15 , 0

; 45 ,

0 7 8 9 10 11 12

6nnnnnn

n

mamy 51,94583274 3,51702083 5,3376156 Wtedy statystyki U l5,4,3

U

l l

l

 mają rozkład N(0;1) i wartości statystyk z przykładu II

mają odpowiednio wartości: U5-1,59 ; U4 8,97 ; U3-23,09 817

, 9458327 0 ,

1

56 , 1

5   

U

; U43,51702088,97 2,55

; U35,337615623,09-4,33

Z dużym prawdopodobieństwem hipotezy alternatywne H3:4p4 i H3:3p3

prawdziwe. W tym przykładzie nie znam wartości liczb nk 0,1 k6,7,8,9,10,11,12

dla tych danych i przyjąłem liczby fikcyjne. Aby uzyskać te liczby należy mieć wgląd do zawieranych zakładów. Program przyjmujący zakłady może te liczby na bieżąco obliczać.

Można uzyskać wzory uogólniające te zagadnienia , dla dowolnych liczb:

N - zakres losowanych liczb lub wielkość populacji (N 49)

r

- liczba wylosowanych wyróżnionych liczb lub liczba wyróżnionych elementów w populacji 1rN (r 6)

n

- liczba zakładów zawartych przez skreślenie

r

liczb z zakresu od 1 do N zawartych za pomocą zakładów prostych lub systemem k elementowym lub liczba

r

elementowych populacji uzyskanych k elementową próbą rkN. l - liczba trafionych wyróżnionych elementów w zakładzie prostym lub w populacji

} 3 , 4 , 5 , 6

{

l )

W nawiasie występują odpowiednie liczby związane z dużym lotto.

Podobne rozumowanie można zastosować w przypadku urządzania lasu gdzie próby uzyskuje się za pomocą wylosowanych poletek. Poletka mają odpowiednik systemów w dużym lotto i mogą wpłynąć na rozrzut odstępstw od wartości istniejących badanych elementów składu lasu.

(19)

Wykonał:

Michał Germaniuk.

Uniwersytet Warmińsko Mazurski Katedra Analizy Zespolonej german@uwm.edu.pl

Cytaty

Powiązane dokumenty

Zapewnienie w czasie przeprowadzania egzaminu obecności specjalisty z zakresu niepełnosprawności (członka zespołu nadzorującego), jeżeli jest to niezbędne dla uzyskania

• Funkcje kształtu są zawsze tak zbudowane, aby w węzłach których dotyczą ich wartości wynosiły „1”, a pozostałych węzłach przyjmowały wartość

Przechodząc od stanu początkowego do końcowego należy modelować kolejne stany czynności lub stany akcji. Jeśli operacja należy do klasy aktywnej (i tylko wtedy), należy

Przedział (−∞, 2⟩ jest zbiorem wartości

w sprawie formy, trybu i organizacji toku studiów pierwszego i drugiego stopnia prowadzonych na Wydziale Filologicznym Uniwersytetu Wrocławskiego zwracam się z prośbą o

w sprawie formy, trybu i organizacji toku studiów pierwszego i drugiego stopnia prowadzonych na Wydziale Filologicznym Uniwersytetu Wrocławskiego zwracam się z prośbą o

W przypadku elementów wzmacniających, których grubość jest niewielka, zaś gabaryt jest znaczący, należy dokonać podziału wypraski na mniejsze części z

Na bazie wyników przeprowadzonych symulacji numerycznych zidentyfikowano moduł Younga materiału beleczek kostnych oraz wyznaczono makroskopowe parametry materiałowe