1Zło ˙zono w klasietufte-handout, www.ctan.org/pkg/tufte-latex
Notatki z ´cwicze ´n z Probabilistyki 19/20
1Grzegorz Siudem & grupy T1, T2, T3 23 maja 2020
Notatki z ´cwicze ´n oraz inne materiały pomocne w rozwi ˛azywaniu prac domowych z Probabilistyki. Plik na bie ˙z ˛aco aktualizowany. Zgłoszenie ka ˙zdego bł ˛edu b ˛edzie bardzo mile widziane.
Spis tre´sci
C1: Wprowadzenie 2 C2: Rozkłady dyskretne 3 C3: Rozkłady ci ˛agłe 4
C4: Czy tego oczekiwali´smy? 6 C5: Po jednym warunkiem 15
C6: Porozmawiajmy o Centralnym 22 C7: O estymie estymatora. 30
C8: Teoretycznie tak. 43
C9: Znaj rozkłady, nie ma rady! 44 C10: Postawmy sobie hipotez˛e. 45 C11: Czasami trzeba si˛e dopasowa´c. 46
C12: Tyle o sobie wiemy ile nas sprawdzono. 47 Notacje i oznaczenia 48
Rozkłady dyskretne 49 Rozkłady ci ˛agłe 50 Dystrybuanta 50 Momenty 51
Twierdzenia graniczne 51
Centralne Twierdzenie Graniczne 52
Zwró´cmy uwag ˛e, ˙ze wszystkie te wy- niki nie zale ˙z ˛a od kolejno´sci losowania.
Mogliby´smy, co jest jednak bardziej wymagaj ˛ace rachunkowo, rozwa ˙zy´c analogicznie pi ˛atki uporz ˛adkowane.
Wa ˙zne, ˙zeby tych dwóch metod nie miesza´c.
Co interpretujemy nast ˛epuj ˛aco: mamy 13 mo ˙zliwo´sci wyboru rangi pary (od dwójek do asów), nast ˛epnie kart o wy- branej randze mamy 4, a potrzebujemy 2. Trzeci czynnik oznacza wybór trzech kart o ró ˙znych rangach (i ró ˙znych od naszej wyj´sciowej) o dowolnych kolorach ka ˙zda (ostatni czynnik).
Gdzie pierwszy czynnik to liczba mo ˙z- liwych rang naszej karety, a czynnik drugi liczba mo ˙zliwych wyborów pi ˛atej karty.
Najpierw wybieramy rang ˛e trójki, potem rang ˛e pary, potem kolory trójki i kolory pary.
C1: Wprowadzenie
Podczas ´cwicze ´n testowali´smy klasyczn ˛a (cz ˛esto´sciow ˛a) definicj ˛e prawdopodobie ´nstwa na przykładach rzutów monet ˛a, kostk ˛a i loso- wania kart.
P(A) = |A|
|Ω|,
gdzie A to zbiór realizacji sprzyjaj ˛acych analizowanemu zdarzeniu, aΩ zbiór wszystkich mo˙zliwych zdarze´n.
Uwaga!Powy ˙zszy wzór mo ˙zna stosowa´c pod warunkiem, ˙ze wszystkie zdarzenia elementarne s ˛a równoprawdopodobne (por. przy- kład z wykładu).
Policzmy z klasycznego wzoru prawdopodobie ´nstwo wyci ˛agni ˛ecia kilku wybranych układów pokerowych. Zakładamy, ˙ze losujemy 5 kart z talii o 52 kartach, a zatem przestrzeni ˛a stanów s ˛a zbiory 5- elementowe kart bez powtórze ´n, a zatem
|Ω| =52 5
= 52!
5!47!. Rozwa ˙zmy teraz kilka przykładowych układów u Para, układ P gdzie mamy dokładnie jedn ˛a par ˛e
|P| =13 1
4 2
12 3
4 1
3
.
u Kareta, czyli układ K, w których mamy cztery karty tej samej rangi
|K| =13 1
48 1
.
u Ful, czyli układy F składaj ˛acy si ˛e z trójki kart tej samej rangi i pary kart innej rangi
|F| =13 1
12 1
4 3
4 2
.
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 3
Dyskretny rozkład jednostajny.
Rozkład geometryczny.
Rozkład Poissona.
Rozkład Bernoulliego.
Dla uproszczenia stosujemy notacj ˛e, w której argumentami dystrybuanty s ˛a tylko liczby z dziedziny funkcji masy prawdopodobie ´nstwa, w ogólno´sci funkcja miałaby posta´c
F(t) =btc N I[1,N](t)
C2: Rozkłady dyskretne
Najwa ˙zniejsze wnioski z wykładu:
u Zadania domowe, spisane czytelnie i podpisane, oddajemy na jednej kartce formatu A4.
u Przypadkowy charakter zjawisk lub procesów mo ˙ze wymaga´c opi- su statystycznego lub probabilistycznego, które, cho´c powi ˛azane, nie s ˛a to ˙zsame.
u W rozkładach dyskretnych prawdopodobie ´nstwo zdarzenia jest proporcjonalne do liczby sprzyjaj ˛acych mu zdarze ´n.
Przyjmuj ˛ac, jak na poprzednich zaj ˛eciach, ˙ze dla rozkładów dys- kretnych mamy
P(X=k) = 1
|Ω||Xk| =C·pk.
Poszukujemy zatem warto´sci stałej C dla wybranych rozkładów:
u pk=1 dla k=1, . . . , N ⇒P(X=k) =1/N,
u pk= (1−q)kdla q∈ (0, 1), k∈N⇒P(X=k) =q(1−q)k, u pk=λk/k! dla λ>0, k∈N⇒P(X=k) =λke−λ/k!, u pk = (Nk)qk(1−q)−kdla q ∈ (0, 1), k = 0, . . . , N⇒
P(X=k) = (Nk)qk(1−q)N−k, oraz zwartych postaci ich dystrybuant
FX(t) =P(X6t), tam gdzie to mo ˙zliwe
u Dla rozkładu jednostajnego dyskretnego F(k) =k/N, u Dla rozkładu geometrycznego F(k) =1− (1−p)k.
W razie w ˛atpliwo´sci prosz ˛e sprawdzi´c opisy na stronie 50.
f(x) =
1
b−a dla x∈ ha, bi
0 dla x∈R\ ha, bi a, b∈R , b>a
1◦) x≤a =⇒ F(x) =0 2◦) x∈ (a, bi =⇒ F(x) =Rx
a f(ω)dω 3◦) x≥b =⇒ F(x) =1
f(x) =
0 dla x<0
λe−λx dla x≥0 λ>0
C3: Rozkłady ci ˛agłe
Najwa ˙zniejsze wnioski z wykładu:
u Intuicyjne zrozumienie czym s ˛a zmienne losowe i niezale ˙zno´s´c.
u Opis zmiennych ci ˛agłych – funkcja g ˛esto´sci prawdopodobie ´nstwa.
u Dystrybuanta (F(x) =P(X6 x)) jest wa ˙zn ˛a wielko´sci ˛a, pozwala tak ˙ze zdefiniowa´c kwantyle.
Sprawd´zmy normowanie do 1 i policzmy dystrybuant ˛e (gdzie to mo ˙zliwe) dla rozkładów
u jednostajnego ci ˛agłego, u wykładniczego, u Pareto,
Wyznaczmy kwantyle dla rozkładu prawdopodobie ´nstwa o g ˛esto-
´sci danej wzorem
f(x) =2xI[0,1](x).
u Sprawdzenie normowania rozkładu jednostajnie ci ˛agłego:
Z ∞
−∞f(x)dx= Z a
−∞0dx+ Z b
a
1 b−adx+
Z ∞ b 0dx=
Z b a
1 b−adx=
= 1 b−a·x
x=b
x=a
= b−a
b−a =1 X
u Obliczenie dystrybuanty rozkładu jednostajnie ci ˛agłego F(x):
Ad 2◦F(x) = Z x
a
1
b−adω= 1 b−a·ω
ω=x
ω=a
= 1
b−a(x−a) = x−a b−a
F(x) =
0 dla x≤a
x−a
b−a dla x∈ (a, bi 1 dla x>b
X
u Sprawdzenie normowania rozkładu wykładniczego:
Z ∞
−∞f(x)dx= Z 0
−∞0dx+ Z ∞
0 λe−λxdx= Z ∞
0 λe−λxdx=
=
−λx=u dx= −λdu
=
x=0 ⇒ u=0 x→∞ ⇒ u→ −∞
=λ Z −∞
0 eu· du
−λ =
= − [eu]|−0∞= −( lim
u→−∞[eu] −e0) = −(0−1) =1 X
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 5
f(x) =
( 0 dla x≤xm kxmk
xk+1 dla x>xm
x, x0∈R , k>0
u Obliczenie dystrybuanty rozkładu wykładniczego F(x):
F(x) = Z x
−∞ f(ψ)dψ= Z x
0 λe−λψdψ=
−λψ=u dψ= −λdu
=
ψ=0 ⇒ u=0 ψ=x ⇒ u= −λx
=
=λ Z −λx
0 eu· du
−λ = − [eu]|−λx0 = −he−λx−e0i
=1−e−λx X
u Sprawdzenie normowania rozkładu Pareto:
Z ∞
−∞f(x)dx= Z xm
−∞0dx+ Z ∞
xm
kxkm xk+1dx=
Z ∞ xm
kxkm xk+1dx=
=kxkm Z ∞
xm
x−(k+1)dx= kxkm· 1
−(k+1) +1x−(k+1)+1
x=∞
x=xm
=
= −xmk · (x−k)x=∞
x=xm
= −xkm·
x→lim∞
1 xk
− 1 xkm
= −xk0·−1
xkm =1 X u Obliczenie dystrybuanty rozkładu Pareto F(x):
F(x) = Z x
xm
kx0k
ηk+1dη=kxkm Z x
xm
η−(k+1)dη= kx
km
−(k+1) +1 h
η−(k+1)+1 i
η=x
η=xm
=
= kx
km
−k
x−k−x−km
=1−xm x
k
X
u Wyznaczenie kwantyli dla rozkładu prawdopodobie ´nstwa danego wzorem: f(x) =2xI[0,1](x):
F(x) =
0 dla x≤0
Rx
0 2ξ dξ dla x ∈ (0, 1i 1 dla x>1 Dla dlax∈ (0, 1i:
F(x) = Z x
0 2ξ dξ= 2ξ2 2
x
0
=x2
F(Qp) =p⇒F−1[F(Qp)] =F−1(p) =⇒Qp=F−1(p)
F−1[F(x)] =qF(x) =⇒Qp=√
p X
Je´sli to tylko nie utrudnia drastycz- nie rachunków proponuj ˛e liczy´c dla dowolnego n, a tam gdzie sprawa jest nieoczywista pozostaje nam sprawdza- nie dla n=1, 2, . . . .
Oba pliki dost ˛epne na stronie przed- miotu.
f(x) =λe−λx, x∈ [0,∞) ⇒ EXn= Z∞ 0
xnλe−λxdx
f(x) = 1
b−a, x∈ [a, b] ⇒ EXn= Zb
a
xn b−adx
korzystaj ˛ac ze wzoru skróconego mno ˙zenia
bm−am= (b−a)(bm−1+bm−2a+...+bam−2+am−1) Czy ten krok upraszcza wzór? Wr ˛ecz
przeciwnie, ale pozwala na usprawie- dliwienie intuicyjnego faktu: ´srednia EX1=b+2a.
Uwaga! Metoda momentów wykracza poza nasz ˛a aktualn ˛a wiedz ˛e z wykładu, poznamy j ˛a na pó´zniejszych zaj ˛eciach.
C4: Czy tego oczekiwali´smy?
Najwa ˙zniejsze wnioski z wykładu:
u Definicja i podstawowe własno´sci momentów zmiennej losowej.
u Czym s ˛a estymatory i dlaczego ich potrzebujemy?
u Prezentowanie danych – wykresy skrzynkowe i histogramy.
Zadania do wykonania:
u Nale ˙zy wyznaczy´c wybrane momenty (albo uzasadni´c, ˙ze to nie- mozliwe) dla rozkładów umieszczonych na stronach 49-50.
u Nale ˙zy narysowa´c histogram dla wyników rzutów ko´sci ˛a oraz wykres skrzynkowy dla przygotowanych do tego danych
u Momenty rozkładu ci ˛agłego wykładniczego: stosujemy podsta- wienie: u=λx, du=λdx
EXn= Z∞
0
u λ
n
e−udu= 1 λn
Z∞
0
une−udu= 1 λn
Z∞
0
u(n+1)−1e−udu.
Korzystamy z podstawowych własno´sci funkcjiΓ Eulera EXn = Γ(n+1)
λn = n!
λn.
u Momenty rozkładu ci ˛agłego jednostajnego: wykonujemy ele- mentarne całkowanie
EXn = 1 b−a
xn+1 n+1
b a
= b
n+1−an+1
(n+1)(b−a) (1) mo ˙zna równowa ˙znie zapisa´c (przypadek m=n+1):
EXn = 1 n+1
∑
n k=0bn−kak
Na podstawie wzoru (1) pierwsze trzy momenty tego rozkładu EX= a+b
2 , EX2= a
2+ab+b2
3 , EX3= (a+b) a2+b2
4 .
u Momenty rozkładu wykładniczego metod ˛a momentów: n-ty moment rozkładu jest n-t ˛a pochodn ˛a funkcji tworz ˛acej momenty po t w punkcie t=0
EXn = d
n
dtnM(t)
t=0.
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 7
dla t<λ.
x=σ
√2t+µ
dt=√1 2σdx
Zatem pierwszy moment rozkładu Pareto, o ile istnieje, przyjmuje posta´c
αxm
α−1, a drugiαxα−2m2.
p(X=0) =1−p, p(X=1) =p dla p∈ [0, 1]
f(x) = β
α
Γ(α)·xα·e−βx, gdzie gdzie α, β∈R+, aΓ to funkcja gamma Eulera.
Całkujemy od 0, bo dla rozkładu gamma I(0,inf)(x)
Funkcj ˛a tworz ˛ac ˛a momenty jest transformat ˛a Laplace’a funkcji rozkładu prawdopodobie ´nstwa, dla rozkładu wykładniczego:
M(t) = Z ∞
0 etxf(x)dx= Z ∞
0 etxλe−λxdx= Z ∞
0 λex(t−λ)dx
= λe
x(t−λ)
t−λ
∞
0 = −λ
−λ+t = λ λ−t Pierwszy moment rozkładu wykładniczego:
EX= d dtM(t)
t=0= d dt
λ λ−t
t=0 = λ
(λ−0)2 = 1 λ. Drugi moment rozkładu wykładniczego:
EX2= d
2
dt2M(t)
t=0 = 2λ
(λ−t)3
t=0 = 2 λ2. u Pierwszy moment rozkładu Gaussa:
EX= Z ∞
−∞
√x 2πσe
−(x−µ)2
2σ2 = √1
2πσ Z ∞
−∞x exp
−(x−µ)
√2σ
2
.
Wprowadza si ˛e now ˛a zmienn ˛a t = x−µ
σ
√
2, wówczas równanie spro- wadza si ˛e do postaci:
EX= √1 2πσ
Z ∞
−∞(√
2 σ t+µ)e−t2√ 2 σdt=
= √1 π
Z ∞
−∞µe−t2dt+√ 2σ
Z ∞
−∞te−t2dt
= √µ π
√
π+0=µ
u Rozkład Pareto: indykator ogranicza całkowanie, tak wi ˛ec:
EXn = Z ∞
xm
xnαxαm xα+1dx=
Z ∞ xm
xn−α−1αxαmdx= x
n−α
n−ααxαm|∞xm Je ˙zeli przyjmie si ˛e, ˙ze α>n to wynik całki mo ˙zna zapisa´c jako
EXn = x
n−αm
α−nαxαm= α α−nxnm
Je ˙zeli nie został spełniony warunek α> n to całka jest rozbie ˙zna i momenty nie istniej ˛a.
u Momenty rozkładu dwupunktowego:
EXn =
∑
k
xnkpk=0n· (1−p) +1n·p=p
u Momenty rozkładu gamma:
Korzystamy te ˙z z funkcjiΓ Eulera Γ(n) =
Z∞
0 vn−1·e−vdv
Rozkład Zipfa:
pk= 1
ksHs(n), Hs(n) =
∑N k=1
1 ks
Rozkład Poissona wyra ˙za si ˛e wzorem:
P(X=k) =e−λλk
k!, k∈N∪0 gdy ˙z∑∞l=0λl
l! =eλ.
Rozkład Bernoulliego wyra ˙za si ˛e wzorem:
P(X=k) =n k
pkqn−k, gdzie: k=0, 1, ..., n i q=1−p.
Poniewa ˙z suma po prawej stronie przedostatniej równo´sci jest równa (p+1−p)n−1=1.
EXn = Z ∞
0 xn· f(x)dx= Z ∞
0 xn· βα
Γ(α) ·xα·e−βxdx=
= Z ∞
0 xn+α−1· β
α
Γ(α)·e−βxdx=
= 1 Γ(α)
Z ∞
0 xn+α−1· β
n+α−1
βn−1 e−βxdx=
= 1
Γ(α) ·βn−1 Z ∞
0
(βx)n+α−1·e−βxdx.
Stosujemy podstawienie: u=βx, du= dxβ
EXn = 1 Γ(α) ·βn
Z ∞
0 un+α−1·e−udu= 1
βn · Γ(n+α) Γ(α) . u Momenty rozkładu Zipfa
Ex=
∑
N k=1k 1
ksHs(n) = 1 Hs(n)
∑
N k=1k−(s−1)= 1
Hs(n)Hs−1(n)
Ex2=
∑
N k=1k2 1
ksHs(n) = 1 Hs(n)
∑
N k=1k−(s−2)= 1
Hs(n)Hs−2(n) u Momenty rozkładu Poissona
EX=
∑
∞ k=0kλk
k!e−λ=λe−λ
∑
∞ k=1λk−1
(k−1)! =λe−λ
∑
∞ l=0λl l! =λ
EX2=
∑
∞ k=0k2λk k!e−λ =
∑
∞ k=1(k−1+1) λ
k−1
(k−1)!e−λ =
=λ2e−λ
∑
∞ k=2λk−2
(k−2)!+λe−λ
∑
∞ k=1λk−1
(k−1)! = (λ2+λ)e−λ
∑
∞ l=0λl l! =
=λ2+λ.
wi ˛ec wariancja rozkładu wynosi
D2(X) =EX2− (EX)2=λ2+λ−λ2=λ.
u Momenty rozkładu Bernoulliego EX =
∑
n k=0n k
pk(1−p)n−k =
∑
n k=1n!
k!(n−k)!pk(1−p)n−k =
=np
∑
n k=1(n−1)!
(k−1)!(n−1− (k−1))!pk−1(1−p)n−1−(k−1)=
=np
n−1
∑
l=0
(n−1)!
l!(n−1−l)!pl(1−p)n−1−l =np.
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 9
pk= (1−q)kq
∑∞ x=0
(1−q)x−2x(x−1) = ∑∞
x=0
d2
dq2(1−q)x= 2 q3.
EX2=
∑
n k=0k2n k
pk(1−p)n−k =
∑
n k=1k n!
(k−1)!(n−k)!pk(1−p)n−k =
=n(n−1)p2
∑
n k=2(n−2)!
(k−2)!(n−2− (k−2))!pk−2(1−p)n−2−(k−2)+ +np
∑
n k=1(n−1)!
(k−1)!(n−1− (k−1))!pk−1(1−p)n−1−(k−1)=
=n(n−1)p2
n−2
∑
l=0
n−2 l
pl(1−p)n−2−l+
+np
n−1
∑
l=0
n−1 l
pl(1−p)n−1−l =n(n−1)p2+np.
Uwzgl ˛edniaj ˛ac, ˙ze EX=np otrzymujemy:
D2(X) =EX2− (EX)2=n(n−1)p2+np− (np)2=np(1−p)
u Momenty rozkładu Cauchy’ego
EX= 1 π
Z +∞
−∞ x1 γ
1 1+ (x−x0
γ )2dx=
x−x0 γ =u
1
γdx=du x=γu+x0
=
= 1 π
Z +∞
−∞ (γu+x0) 1
1+u2du=
= γ
2πln(u2+1) + x0
πarctg(u)
u=+∞ u=−∞
−→∞
Dalsze momenty tak ˙ze s ˛a rozbie ˙zne (zawieraj ˛a te same wyra ˙zenia z dokładno´sci ˛a do stałej + kolejne pot ˛egi u). Momenty rozkładu Cauchy’ego nie istniej ˛a.
u Momenty rozkładu geometrycznego:
EX =
∑
∞ x=0x(1−q)xq=q(1−q)
∑
∞ x=0x(1−q)x−1=
=q(1−q)
∑
∞ x=0d dq
h− (1−q)xi= −q(1−q) d dq
1
q = 1−q q .
EX2=
∑
∞ x=0x2(1−q)xq=q(1−q)2
∑
∞ x=0x2(1−q)x−2=
=q(1−q)2
∑
∞ x=0(1−q)x−2x(x−1+1) =
=q(1−q)2
∑
∞ x=0(1−q)x−2x(x−1) +EX.
EX2=q(1−q)22
q3+1−q q = q
2−3q+2 q2 .
f(x) = 1 2(k/2)−1Γ(k/2) x
k−1e−x2/2I[0,∞)(x)
Podstawiamy x22=u, dx=√du
2u
Wykonano w Pythonie 3.8.1 przy u ˙zyciu biblioteki matplotlib 3.1.2
dla ’boxplot-1.csv’ oraz ’boxplot-2.csv’
u Momenty rozkładu zeta EXn =
∑
∞ x=0xn 1
xsζ(s) = 1 ζ(s)
∑
∞ x=01 xs−n
zmienna X posiada w takim razie n-ty moment tylko w przypadku kiedy n<s−1, moment wynosi wtedy:
EXn = ζ(s−n) ζ(s) u Momenty rozkładu χ2
EXn= Z ∞
0
1
2(k/2)−1Γ(k/2) x
k+n−1e−x2/2dx=
= Z ∞
0
1 2(k/2)−1Γ(k/2)
√
2uk+n−1e−u· √1 2udu=
= 2
(k/2)+(n/2)−(1/2)
2(k/2)−(1/2)
1 Γ(k/2)
Z ∞
0 u(k/2)+(n/2)−1e−udu=
=2n/2 1 Γ(k/2)
Z ∞
0 u(k/2)+(n/2)−1e−udu.
Z definicji Gammy Eulera:
EXn =2n/2Γ[(k+n)/2] Γ(k/2) .
u Histogram rzutów ko´s´cmi:pyplot, patrz Rys. 1 na stronie 11.
from m a t p l o t l i b import pyplot as p l t
from m a t p l o t l i b . t i c k e r import M u l t i p l e L o c a t o r with open ( " k o s t k i . csv " , " r " ) as f :
data = [ i n t ( l e t t e r ) f o r l e t t e r in f . read ( ) i f l e t t e r in " 123456 " ] b i n s = len ( s e t ( data ) )
_ , ax = p l t . s u b p l o t s ( )
p l t . g r i d ( which= ’ major ’ , l i n e s t y l e = ’−’ , l i n e w i d t h = ’ 0 . 5 ’ , c o l o r = ’ b l a c k ’ ) p l t . g r i d ( which= ’ minor ’ , l i n e s t y l e = ’ : ’ , l i n e w i d t h = ’ 0 . 5 ’ , c o l o r = ’ b l a c k ’ ) ax . s e t _ a x i s b e l o w ( True )
p l t . t i t l e ( f " Histogram { l e n ( data ) } rzutow koscmi " ) p l t . x l a b e l ( " Wynik " )
p l t . y l a b e l ( " L i c z b a wystapien " )
ax . y a x i s . s e t _ m a j o r _ l o c a t o r ( M u l t i p l e L o c a t o r ( 1 0 ) ) ax . y a x i s . s e t _ m i n o r _ l o c a t o r ( M u l t i p l e L o c a t o r ( 5 ) )
ax . h i s t ( data , bins , e d g e c o l o r = ’ b l a c k ’ , l i n e w i d t h = 1 . 2 ) p l t . show ( )
u Wykresy skrzynkowe:python, patrz Rys. 2 na stronie 11.
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 11
1 2 3 4 5 6
Wynik 0
10 20 30 40 50 60 70 80 90
Liczba wystpie
Histogram wyników 466 rzutów ko mi Rysunek 1:Histogram rzutów kostk ˛a narysowany w Pythonie.
Formuły podane s ˛a dla polskiej wersji j ˛ezykowej Excela pakietu Office 365 Utworzenie tablicy z fomułami:
import pandas as pd
from m a t p l o t l i b import pyplot as p l t import numpy as np
df = np . a r r a y ( pd . read_csv ( ’ boxplot−1. csv ’ , header=None ) ) p l t . f i g u r e ( f i g s i z e = ( 1 3 , 8 ) )
p l t . rcParams . update ( { ’ f o n t . s i z e ’ : 1 6 } ) p l t . b o x p l o t ( df )
p l t . g r i d ( True )
p l t . t i t l e ( ’ Wykres skrzynkowy d la danych \ ’ boxplot−1. csv \ ’ ’ )
p l t . g r i d ( c o l o r = ’ #95 a5a6 ’ , l i n e s t y l e = ’−−’ , l i n e w i d t h =2 , a x i s = ’ y ’ , alpha = 0 . 5 ) p l t . g r i d ( a x i s = ’ x ’ , alpha =0)
p l t . s a v e f i g ( ’ b o x l o t−1_ l o t n i c y . pdf ’ , bbox_inches= ’ t i g h t ’ , pad_inches = 0 . 2 )
1 2
1 0 1 2
Wykres skrzynkowy dla danych 'boxplot-1.csv'
1 60
40 20 0 20 40 60
Wykres skrzynkowy dla danych 'boxplot-2.csv' Rysunek 2:Wykresy skrzynkowe wykonane w Pythonie.
u Wykresy skrzynkowe:Excel
=MIN( dane ) [ B1 ]
=KWARTYL( dane , 1 ) [ B2 ]
=KWARTYL( dane , 2 ) [ B3 ]
=KWARTYL( dane , 3 ) [ B4 ]
=KWARTYL( dane , 4 ) [ B5 ]
=MAX( dane ) [ B6 ]
mi:
Utworzenie wykresu skumulowanego kolumnowego z danych C1:C4 i odwró- cenie danych/serii. Nast ˛epnie zamiana wypełnienia danych z najwy ˙zszej i najni ˙zszej serii na lini ˛e bł ˛edów.
Kod w dla wersji Python 3.7.4, po- winien działa´c dla ka ˙zdego powy ˙zej 3.
Typ wykresu to "Statystyczny", a pod- typ to "Pionowy wykres skrzynkowy".
Histogram powstał w WolframCloud
=B2−B1 [ C1 ]
=B3−B2 [ C2 ]
=B4−B3 [ C3 ]
=B5−B4 [ C4 ]
u Histogram kart:python, patrz Rys. 3 na stronie 12.
import m a t p l o t l i b . pyplot as p l t with open ( " k a r t y . t x t " , " r " ) as f :
r = f . read ( ) . s p l i t ( ’ , ’ )
k a r t y = [ ’ t r e f l ’ , ’ k i e r ’ , ’ karo ’ , ’ pik ’ ] c o u n t e r = [ 0 , 0 , 0 , 0 ]
f o r i in range ( len ( r ) ) : i f r [ i ] == k a r t y [ 0 ] :
c o u n t e r [ 0 ] += 1 i f r [ i ] == k a r t y [ 1 ] :
c o u n t e r [ 1 ] += 1 i f r [ i ] == k a r t y [ 2 ] :
c o u n t e r [ 2 ] += 1 i f r [ i ] == k a r t y [ 3 ] :
c o u n t e r [ 3 ] += 1
p l t . t i t l e ( " Histogram k a r c i a n y dl a 156 polozonych k a r t " ) p l t . x l a b e l ( " Karta " )
p l t . y l a b e l ( " L i c z b a t r a f i e n " ) p l t . bar ( karty , c o u n t e r ) p l t . show ( )
Rysunek 3:Histogram wylosowanych kart wykonany w j ˛ezyku Python.
u Histogram i boxplot:GNUMERIC, patrz Rys 4 na stronie 13.
u Histogram w j ˛ezykuWolfram, patrz Rys. 5 na stronie 13.
data = { . . . } ;
o = Count [ data , O ] ; r = Count [ data , R ] ; BarChart [ { { o , r } } ,
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 13
ORZEŁ RESZKA
100 110 120 130 140 150
Liczba rzutów
Histogram rzutów monetą
BoxPlot2 BoxPlot1
−80
−60
−40
−20 0 20 40 60 80
Porównanie dwóch wykresów skrzynkowych Rysunek 4:Histogram i wykres skrzyn-
kowy narysowane w ´srodowisku GNUMERIC. Umiej ˛etna ˙zonglerka dobranymi ze smakiem kolorami z niebanalnej palety barw zapewnia tak spójny jak i charakterystyczny sposób przedstawienia danych.
Wykonano w matlabie R2017a.
C h a r t L a b e l s −> { " ORZEL" , "RESZKA " } , L a b e l i n g F u n c t i o n−>Above ,
C h a r t S t y l e−>{Blue , Blue } ]
Rysunek 5:Histogram rzutow monet ˛a wykonany w chmurzeWolfram Cloud.
u Histogram w ´srodowiskumatlab, patrz Rys. 6 na stronie 14.
W tym celu najpierw zaimportowano dane z komputera, korzysta- j ˛ac z zakaładekHOME -> Import Data, wybrano ´scie ˙zk ˛e na kom- puterze prowadz ˛ac ˛a do plikukostki.csv, a w nast ˛epnej zakładce:
Importwybrano wOutput Type: Numeric Matrix, po czym zaim- portowano dane, które były widoczne w workspace jako: kostki (o warto´sci 1x466 double)
histogram ( k o s t k i )
t i t l e ( ’ Histogram rzutu kostka ’ )
x l a b e l ( ’ wyrzucona l i c z b a oczek na k o s t c e ’ ) y l a b e l ( ’ l i c z b a wyrzuconych k o s c i ’ )
u Wykresy skrzynkowe wMathematice, patrz Rys. 7 na stronie 14 b o x p l o t = Import [ " . . . \ boxplot−1. csv " ] ;
b o x p l o t 2 = Import [ " . . . \ boxplot−2. csv " ] ;
BoxWhiskerChart [ boxplot , P l o t L a b e l −> " Wykres skrzynkowy d la boxplot−1. csv " ] BoxWhiskerChart [ boxplot2 , P l o t L a b e l −> " Wykres skrzynkowy d la boxplot−2. csv " ]
Rysunek 6:Histogram rzutów kostk ˛a narysowany w ´srodowisku matlab.
-3 -2 -1 0 1 2 3
Wykres skrzynkowy dla danych: boxplot-1.csv
-60 -40 -20 0 20 40 60 80
Wykres skrzynkowy dla danych: boxplot-2.csv
Rysunek 7:Wykresy skrzynkowe narysowane w ´srodowisku Wolfram Mathematica.
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 15
Zach ˛ecam do rozwiazywania ka ˙zdego z zada ´n ró ˙znymi metodami: ropisuj ˛ac p- stwa, przez analiz ˛e drzewek, symulacje numeryczne etc.
Wybieraj ˛ac kart ˛e na pocz ˛atku mamy szans ˛e 2/3 na wygran ˛a. Odsłoni ˛ecie jednej z kart z nagrod ˛a nie ma wpływu na to pocz ˛atkowe prawdopodobie ´n- stwo. Prawdopodobie ´nstwo przypisane odsłoni ˛etej karcie jest równe 0 (nie ma szansy ˙zeby była tam te ˙z druga nagro- da), a suma prawdopodobie ´nstw musi by´c równa 1, wi ˛ec niewybrana nieod- słoni ˛eta karta ma szans ˛e na zawieranie nagrody 1/3.
Oscylator harmoniczny: (Komentarz w celu niedublowania rozwi ˛aza ´n) Nasze rozwi ˛azanie równie ˙z wykorzy- stuje drzewko stochastyczne, jednak uwzgl ˛ednia równie ˙z teoretyczny opis zagadnienia, jako sytuacj ˛e odwrotn ˛a do tzn. paradoksu Monty’ego Halla.
Prowadz ˛acy, odkrywaj ˛ac kart ˛e z wygra- n ˛a, zmniejsza szans ˛e na sukces z 2/3 do 1/3. (Spowodowane zmniejszeniem liczebno´sci zbioru kart wygranych).
Wniosek jest ten sam: nie opłaca si ˛e zmienia´c karty w sytuacji, podanej w zadaniu.
C5: Po jednym warunkiem
Najwa ˙zniejsze wnioski z wykładu:
u Prawdopodobie ´n´stwo warunkowe.
u Wzór Bayesa.
u Wnioskowanie Bayesowskie.
Zadania do wykonania:
u Rozwa ˙zmy gr ˛e, w której gracz wybiera jedn ˛a z trzech kart, dwie z znich skutkuj ˛a nagrod ˛a, a jedna nie. Gracz wybrał jedn ˛a z kart, po czym rozdaj ˛acy odsłania jedn ˛a z pozostałych dwóch, która kryje nagrod ˛e. Gracz mo ˙ze zmieni´c swój pierwotny wybór na drug ˛a nieodsłoni ˛et ˛a kart ˛e. Czy i o ile taka zmiana zwi ˛eksza szanse zwyci ˛estwa?
u Oba zadania to przyklady zagadki logicznej Monty’ego Hall’a.
Gdy losujemy ze zbioru 3-elemtnowego w którym jeden element jest inny niz dwa pozostale, mamy szanse 13na wylosowanie go.
Iluzja tutaj jest wyjecie ze zbioru jednego z dwoch takich samych elementów po tym jak ju ˙z wybrali´smy. W pierwszym zadaniu trafienie pierwszym strzałem wygranej wynosi 23. Je ˙zeli trafili´smy wygrana i zmienimy swój wybór - wybieraj ˛ac opcje inna (po od- słonieciu jednej nagrody zostaje nam tylko nagroda - nie-nagroda) czeka nas na pewno pora ˙zka. Zmieniaj ˛ac kart ˛e wygramy tylko w przypadku, kiedy pocz ˛atkowo wybierzemy przegrana kart ˛e (czyli prob. 13 ). Taka zmiana wiec zmniejsza nam szanse zwyci ˛estwa - z
2 3 do 13.
Metoda drzewa: oznaczenia: W-Winner, karta wygrywaj ˛aca, L- Looser, karta przegrywaj ˛aca. Z zało ˙zenia zadania wiemy, ˙ze druga karta jest kart ˛a wygran ˛a. Prawdopodobie ´nstwo wygranej bez zamiany karty:
P= 2
3 (2)
Prawdopodobie ´nstwo wygranej z zamian ˛a karty:
P= 1
3 ∗1∗1= 1
3 (3)
Wida´c, ˙ze wi ˛eksze prawdopodobie ´nstwo wygranej jest bez zamia- ny karty.
u Alicja, Barbara i Cezary po napisaniu egzaminu w pewien spo- sób dowiedzieli si ˛e, ˙ze zdało go tylko jedno z nich. Alicja pyta
Rysunek do zadania 2 (egzamin)
Alternatywnie: pocz ˛atkowo prawdo- podobie ´nstwo zdania egzaminu przez ka ˙zd ˛a z osób wynosi 1/3. Mo ˙zemy trój- k ˛e znajomych podzieli´c na dwie grupy:
Alicja (jest w tej grupie sama, praw- dopodobie ´nstwo zdania wynosi 1/3) oraz grup ˛e reszty znajomych (prawdo- podobie ´nstwo, ˙ze kto´s z tej grupy zdał wynosi 2/3, z czego po 1/3 na osob ˛e).
Dowiaduj ˛ac si ˛e, ˙ze Cezary nie zaliczył egzaminu, prawdopodobie ´nstwo zdania ka ˙zdej z grup si ˛e nie zmienia. Praw- dopodobie ´nstwo zmienia si ˛e jedynie wewn ˛atrz drugiej grupy, czyli w efek- cie Barbara ma 2/3 szans na zdanie a Alicja ci ˛agle 1/3. Alicja popełniła bł ˛ad, my´sl ˛ac, ˙ze prawdopodobie ´nstwo równo
"przejdzie" z Cezarego na ni ˛a i Barbar ˛e.
Zło´sliwego Wykładowc ˛e o to kim jest ta osoba, ale w odpowiedzi dostaje tylko informacj ˛e, ˙ze egzaminu na pewno nie zaliczył Ceza- ry, cieszy si ˛e wi ˛ec, oceniaj ˛ac, ˙ze jej szanse na zaliczenie wzrosły z 1/3 do 1/2. Gdzie popełnia bł ˛ad?
u Oba zadania to przyklady zagadki logicznej Monty’ego Hall’a.
Gdy losujemy ze zbioru 3-elemtnowego w którym jeden element jest inny niz dwa pozostale, mamy szanse 13na wylosowanie go.
Iluzja tutaj jest wyjecie ze zbioru jednego z dwoch takich samych elementów po tym jak ju ˙z wybrali´smy. W drugim zadaniu mamy do´s´c analogiczny problem. Szanse Alicji na zdanie zawsze wyno- siły 13. Wiedz ˛ac, ˙ze z prawdopodobie ´nstwem 23które´s z przyjaciół Alicji zdało, po odkryciu wyniku Cezarego wiemy z prawdopo- dobie ´nstwem 23 była to Barbara. Alicja popełnia bł ˛ad s ˛adz ˛ac, ˙ze ujawnienie niezdania którego´s z jej przyjaciół wpływa na prawdo- podobie ´nstwo jej zdania.
Rozwi ˛azanie z drzewkiem stochastycznym
Widzimy, i ˙z na pocz ˛atku, skoro mamy 3 osoby, to szansa Alicji wynosi
P(A) = 1
3 (4)
Szansa na zaliczenie pozostałych jest dopełnieniem do 1, czyli:
P(R) =2
3 (5)
Po informacji od prowadz ˛acego, Czarek wypadł z rozwa ˙za ´n, na- tomiast zauwa ˙zmy, i ˙z w ogólno´sci nie zwi ˛eksza to szans Alicji.
Dzieje si ˛e tak, poniewa ˙z dla całej trójki, prawdopodobie ´nstwo za- liczenia jest takie samo i nie zmienia si ˛e z faktem, i ˙z Czarek nie zaliczył (z punktu widzenia naszych rozwa ˙za ´n nadal reszta ma wi ˛eksze p-stwo ni ˙z Alicja, nieistotne te ˙z, czy Czarek wie o swoim niepowodzeniu). Jej szansa na zaliczenie nadal wynosi 1/3, myliła si ˛e.
u Rozwa ˙zmy n monet, z których k jest asymetrycznych i reszka wypada na nich ´srednio 2 razy cz ˛e´sciej ni ˙z orzeł. Wybieramy losowo monet ˛e i w wyniku rzutu widzimy orła. Jaka jest szansa,
˙ze była to moneta asymetryczna?
u Prawdopodobie ´nstwo wyrzucenia monety asymetrycznej:
P(asym) = k n
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9\20 17
Poni ˙zszy program napisano w Pythonie 3.8.1.
Monety asymetryczne przy losowym wyborze strony dwa razy cz ˛e´sciej zwaracj ˛a reszk ˛e.
Prawdopodobie ´nstwo wyrzucenia monety symetrycznej:
P(sym) = n−k n
Prawdopodobie ´nstwo wyrzucenia orła na monecie symetrycznej:
P(o|sym) = 1 2
Prawdopodobie ´nstwo wyrzucenia orła na monecie asymetrycznej:
P(o|asym) = 1 3 Prawdopodobie ´nstwo wyrzucenia orła:
P(o) = k n·1
3 +n−k n
1 2 = k
3n+n−k
2n = 3n−k 6n Szukane prawdopodobie ´nstwo na podstawie wzoru Bayesa:
P(asym|o) = P(o|asym)P(asym)
P(o) =
1 3·nk
3n−k 6n
= 2k 3n−k.
Mo ˙zna równie ˙z zbada´c zagadnienie numerycznie, komputerowo generuj ˛ac liczby pseudolosowe i porównuj ˛ac wynik z teori ˛a.
import random as rand t r y:
k = i n t ( input ( ’ Podaj l i c z b e asymetrycznych monet : ’ ) ) s = i n t ( input ( ’ Podaj l i c z b e symetrycznych monet : ’ ) ) n = k + s
p r i n t( f ’ Calkowita l i c z b a monet : { n } ’ ) t r i e s = i n t ( input ( ’ Podaj l i c z b e prob : ’ ) ) i f t r i e s <= 1 :
r a i s e ValueError e x c e p t ValueError :
p r i n t( ’ Podano nieprawidlowe dane . ’ ) e x i t ( )
sym = [ ’ r ’ , ’ o ’ ]
asym = [ ’ r ’ , ’ r ’ , ’ o ’ ] count_sym_o = 0
count_asym = 0 count_asym_o = 0
f o r _ in range ( t r i e s ) :
c o i n = rand . r a n d i n t ( 1 , n )
Wybierz losowy element z asymetrycz- nej monety - szansa na o=13
i f c o i n > k :
i f rand . c h o i c e ( sym ) == ’ o ’ : count_sym_o += 1
e l s e: pass e l s e:
count_asym += 1
i f rand . c h o i c e ( asym ) == ’ o ’ : count_asym_o += 1
e l s e: pass
p_a = count_asym / t r i e s
p_o = ( count_sym_o + count_asym_o ) / t r i e s p_oa = count_asym_o/count_asym
p r i n t( f ’ Przewidywane P (A ) : { k/n : . 4 f }\ tOtrzymane P (A ) : { p_a : . 4 f } ’ )
p r i n t( f ’ Przewidywane P (O ) : { ( 3 * n−k ) / ( 6 * n ) : . 4 f }\ tOtrzymane P (O) : { p_o : . 4 f } ’ ) p r i n t( f ’ Przewidywane P (O|A ) : { 1 / 3 : . 4 f }\ tOtrzymane P (O|A ) : { p_oa : . 4 f } ’ ) p r i n t( f ’ \nZe wz . Bayesa : P (A|O) = P (O|A) * P (A)/P (O) = ’ , end= ’ ’ )
p r i n t( f ’ { p_oa * p_a / p_o : . 6 f } ’ )
p r i n t( f ’ Przewidywane P (A|O) = 2k /(3n−k ) = { 2 * k /(3*n−k ) : . 6 f } ’ ) Przykładowy wynik działania tego programu:
Podaj l i c z b e asymetrycznych monet : 50 Podaj l i c z b e symetrycznych monet : 100 Calkowita l i c z b a monet : 150
Podaj l i c z b e prob : 100000
Przewidywane P (A ) : 0. 3 3 3 3 Otrzymane P (A ) : 0. 3 3 1 0 Przewidywane P (O ) : 0. 4 4 4 4 Otrzymane P (O ) : 0. 4 4 6 3 Przewidywane P (O|A ) : 0. 3 3 3 3 Otrzymane P (O|A ) :
0. 3 3 6 3
Ze wz . Bayesa : P (A|O) = P (O|A) * P (A)/P (O) = 0. 2 4 9 3 6 7 Przewidywane P (A|O) = 2k /(3n−k ) = 0. 2 5 0 0 0 0
Metoda drzewa: Oznaczenia: S-symetryczna, AS-asymetryczna, O-orzeł, R-reszka, A-wybrano monet ˛e asymetryczn ˛a, B-wyrzucono orła, A∩B -wybrano monet ˛e asymetryczn ˛a i wyrzucono orła
P(B) = n−k n ∗1
2+ k n∗1
3 = 3n−k
6n (6)
P(A∩B) = k
3n (7)
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9\20 19
Kontroler sprawdza jedn ˛a par ˛e z losowo wybranej paczki.
Łatwo zauwa ˙zy´c, ˙ze dla ka ˙zdego k, niezale ˙znie od x P(K) b ˛edzie takie samo
Ze wzoru na prawdopodobie ´nstwo warunkowe obliczono jakie jest prawdopodobie ´nstwo wybrania monetyy asymetrycznej pod warunkiem, ˙ze wyrzucono orła:
P(A|B) = P(A∩B) P(B) =
k 3n 3n−k
6n
= 2k
3n−k (8)
u W fabryce butów na 2n par k składa si ˛e z dwóch lewych butów, a pozostałe s ˛a dobre. Jak zapakowa´c te buty do dwóch paczek po n par ka ˙zda, ˙zeby szansa na wykrycie bł ˛edu przez kontrolera była jak najmniejsza?
u Do pierwszej paczki wkładamy a par lewych butów. Wtedy w drugiej paczce b ˛edzie k−a par lewych butów.
Wtedy szansa na wykrycie bł ˛edu w pierwszej paczce wynosi P(W1) = na, a w drugiej P(W2) = k−an .
Wi ˛ec ł ˛aczna szansa na wykrycie bł ˛edu wynosi P(W) = 12·P(W1) +
1
2·P(W2) = 2nk, wi ˛ec niezale ˙znie od podziału zawsze jest takie samo.
Prawdopodobie ´nstwo kontroli p(K) (pKontroli) wyra ˙za si ˛e su- m ˛a prawdopodobie ´nstwa wylosowania pierwszej paczki i z niej
„lewego” pudełka oraz wylosowania drugiej paczki i z niej „lewe- go” pudełka. Prawdopodobie ´nstwo wylosowania ka ˙zdej paczki jest jednakowe i wynosi 0.5. Prawdopodobie ´nstwo kontroli je´sli do jednej z paczek wło ˙zyli´smy x „lewych” pudełek (do drugiej odpowiednio k-x „lewych”) wynosi
P(K) =0.5∗x/n+0.5∗ (k−x)/n; (9) gdzie n to liczba pudełek w ka ˙zdej paczce, k liczba „lewych” pu- dełek w sumie, a x liczba „lewych” pudełek w jednej z paczek.
using namespace s t d ; i n t main ( )
{
i n t check = 1 ; i n t n = 1 0 0 ;
f l o a t p K o n t r o l i [ n ] [ n ] ; f o r( i n t k = 0 ; k<n ; k++) {
p K o n t r o l i [ k ] [ 0 ] = ( 0 . 5 * 0 / n ) + ( 0 . 5 * ( k−0)/n ) ; \
Dla zachowania jasno´sci rysunku dokładnie przedstawiona jest tylko jedna cz ˛e´s´c. Reszta jest analogiczna
f o r( i n t x = 1 ; x<k ; x ++) {
p K o n t r o l i [ k ] [ x ] = ( 0 . 5 * x/n ) + ( 0 . 5 * ( k−x )/n ) ; \ i f( p K o n t r o l i [ k ] [ x−1]!= p K o n t r o l i [ k ] [ x ] )
check = 0 ; }
}
cout <<check ; r e t u r n 0; }
u Po rzucie 3 kostkami k10 wiemy tylko, ˙ze na ka ˙zdej z nich wy- padła inna liczba oczek. Jakie s ˛a prawdopodobie ´nstwa, ˙ze: a) na
˙zadnej nie wypadła 9, b) na pewnej kostce wypadła 9?
u Zbiór wszystkich mo ˙zliwych zdarze ´n, w których na kostkach s ˛a ró ˙zne liczby oczek b ˛edzie miał liczno´s´c (kombinacje bez powtó- rze ´n)
|Ω| =10 3
= 10!
3!·7! = 8·9·10 6
Zakładamy dla ułatwienia, ˙ze kostki s ˛a nierozró ˙znialne (nie in- teresuje mnie kolejno´s´c rzutów). a) Zbiór mo ˙zliwych zdarze ´n, w których nie wypadła 9 to po prostu taka sama kombinacja, tylko bez jednej mo ˙zliwej cyfry.
|A| =9 3
= 9!
3!·6! = 7·8·9 6 Korzystaj ˛ac ze wzoru z pierwszych zaj ˛e´c:
P(A) = |A|
|Ω| = 7 10
b) Je´sli na jednej kostce wypadła 9, na dwóch pozostałych wypa- dło co´s dowolnego, innego od 9 i ró ˙znego:
|B| =1·9 2
= 9!
2!·7! = 9·8 2 Zatem
P(B) = |B|
|Ω| = 3 10
n o tat k i z ´c w i c z e ´n z p ro b a b i l i s t y k i 1 9/20 21
Bez warunku o ró ˙znej warto´sci oczek na ka ˙zdej z kostek widzimy,
˙ze ilo´s´c mo ˙zliwo´sci wynosi 1000 (10·10·10). Warunek ten przy rozwa ˙zaniu drugiego pi ˛etra drzewka odejmuje nam po jednej mo ˙zliwej gał ˛ezi (co skutkuje 10 gał ˛eziami na trzecim pi ˛etrze).
Natomiast na trzecim pi ˛etrze mamy o dwie gał ˛azki mniej.
Bior ˛ac to pod uwag ˛e mamy 10·9·8 =720 gał ˛ezi lub licz ˛ac inaczej 1000−10·10−10·9·2 =720 Jakie jest prawdopodobie ´nstwo, ˙ze na jednej z ko´sci wyst ˛api 9?
Wyst ˛apienie 9 na pi ˛etrze daje nam 9·8=72 wyst ˛apie ´n, na drugim pi ˛etrze daje nam 8 wyst ˛apie ´n, ale na 8 pi ˛etrze jest a ˙z dziewi ˛e´c dziewi ˛atek, czyli te ˙z 9·8 = 72 wyst ˛apie ´n. Na trzecim pi ˛etrze wyst ˛apienie 9 jest pojedyncze dla ka ˙zdej gał ˛ezi z pi ˛etra drugiego (oprócz tej gał ˛ezi id ˛acej od dziewi ˛atki) to znaczy, ˙ze 9 jest 1·8· 9 = 72 Daje to nam w sumie 216 jednakowo prawdopodobnych kombinacji gdzie wyst ˛epuje „9”.
P(”9”) = 216
720 =0.3 (10)
Prawdopodobie ´nstwo, ˙ze na ˙zadnej kostce nie wypadła „9” To 9 opcji na pierwszy pi ˛etrze drzewka,a dla ka ˙zdej opcji to 8 gał ˛azek na drugim, dla której ka ˙zdej to 7 na trzecim. Co daje w sumie 9·8·7=504 kombinacji bez „9”
P(bez”9”) =504
720 =0.7 (11)
Zbiór kombinacji z 9 i zbiór kombinacji bez 9 to dla rozł ˛aczne zbiory, wi ˛ec ich prawdopodobie ´nstwo powinno sumowa´c si ˛e do 1, co te ˙z si ˛e dzieje.
2Niewielka lecz kluczowa dla tego zadania ró ˙znica polega na dodaniu na ko ´ncu komendy TeXForm, która zamienia wyj´scie programu na jego LATEXow ˛a wersj ˛e.
C6: Porozmawiajmy o Centralnym
Najwa ˙zniejsze wnioski z wykładu:
u Opis testów diagnostycznych.
u Prawa wielkich liczb.
Zadania do wykonania:
u Napisz skrypt, który w automatyczny sposób wygeneruje LATEXow ˛a tablic ˛e warto´sci dystrybuanty wystandaryzowanego rozkładu nor- malnego.
u 2Skrypt ten jest zaczerpni ˛ety (gar´sciami) z wykładu numer 4 i został wykonany w Mathematice.
TableForm [
Table [ NumberForm [
CDF[ N o r m a l D i s t r i b u t i o n [ ] , a + b ] − 0. 5 , { 5 , 5 } ] , { a , 0 , 1 , 0. 1 } , { b , 0 , 0 . 1 , 0 . 0 1 } ] ,
TableHeadings −> { Table [ NumberForm [ # , { 3 , 3 } ] &@a , { a , 0 , 1 , 0 . 1 } ] , Table [ NumberForm [ # , { 3 , 3 } ] &@b , { b , 0 , 0 . 1 , 0 . 0 1 } ] } ] // TeXForm u Skrypt wPythonie do generowania LATEXowej tablicy warto´sci
dystrybuanty wystandaryzowanego rozkładu normalnego from math import e r f , s q r t
def phi ( x ) :
r e t u r n ( 1 . 0 + e r f ( x / s q r t ( 2 . 0 ) ) ) / 2 . 0
output = " \\begin { t a b u l a r } { c | c c c c c c c c c c }\n "
output += " \ t \\ h l i n e \n "
output += " \ t x "
f o r i in range ( 0 , 1 0 ) :
output += " & " + s t r ( i / 1 0 0 . 0 ) output += " \\\\\n\ t \\ h l i n e \n "
f o r x in range ( 4 0 ) :
output += " \ t " + s t r ( x / 1 0 . 0 ) f o r i in range ( 0 , 1 0 ) :
output += " & " + ’ { : . 4 f } ’ . format ( phi ( x / 1 0 . 0 + i / 1 0 0 . 0 ) ) output += " \\\\\n "
output += " \ t \\ h l i n e \n "
output += " \end { t a b u l a r }\n "
p r i n t( output )