Spis tre´sci
Spis tre´sci
1 Wst˛ep 1
1.1 Wst˛ep . . . 1
1.2 Literatura . . . 1
2 Elementy rachunku prawdopodobie ´nstwa 2 2.1 Podstawy . . . 2
2.2 Prawdopodobie´nstwo warunkowe . . . 3
2.3 Prawdopodobie´nstwo całkowite . . . 3
2.4 Niezale˙zno´s´c zdarze´n . . . 5
3 Wnioskowanie statystyczne 6 4 Podstawowe modele statystyczne 7 4.1 Model dwumianowy . . . 7
4.2 Model gaussowski . . . 8
5 Estymacja 11 5.1 Estymatory punktowe . . . 11
5.2 Przedziały ufno´sci . . . 12
5.3 Przedział ufno´sci dla ´sredniej . . . 13
5.4 Przedział ufno´sci dla wariancji . . . 15
5.5 Przedział ufno´sci dla frakcji . . . 15
1 Wst˛ep
1.1 Wst˛ep
STATYSTYKA
nauka po´swi˛econa metodom badania (analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilo´sciowych i jako´sciowych oraz przed- stawianiu wyników w postaci zestawie´n tabelarycznych, wykresów, itp.; posłu- guje si˛e rachunkiem prawdopodobie´nstwa.
STATYSTYKA MATEMATYCZNA
dział matematyki stosowanej oparty na rachunku prawdopodobie´nstwa; zajmuje si˛e badaniem zbiorów na podstawie znajomo´sci własno´sci ich cz˛e´sci.
1.2 Literatura
Literatura
1. Feller W., Wst˛ep do rachunku prawdopodobie´nstwa, T. 1. PWN, Warszawa 1966
2. Feller W., Wst˛ep do rachunku prawdopodobie´nstwa, T. 2. PWN, Warszawa 1969
3. Fisz M., Rachunek prawdopodobie´nstwa i statystyka matematyczna, PWN, Warszawa 1958
4. Jasiulewicz H., Kordecki W., Rachunek prawdopodobie´nstwa i statystyka matematyczna, przykłady i zadania, Oficyna Wydawnicza GiS, Wrocław 2002
5. Jakubowski J., Sztencel R., Wst˛ep do teorii prawdopodobie´nstwa, SCRIPT, Warszawa 2001
Literatura
6. Jakubowski J., Sztencel R., Rachunek prawdopodobie´nstwa dla (prawie) ka˙zdego,SCRIPT, Warszawa 2002
7. Krysicki W. (i inni), Rachunek prawdopodobie´nstwa i statystyka matema- tyczna w zadaniach, cz˛e´s´c I Rachunek prawdopodobie´nstwa,PWN 1995 8. Krzy´sko M., Wykłady z teorii prawdopodobie´nstwa, UAM, Pozna´n 1997 9. Niemiro W., Rachunek prawdopodobie´nstwa i statystyka matematyczna,
Szkoła Nauk ´Scisłych, Warszawa 1999
10. Pluci ´nska A., Pluci ´nski E., Probabilistyka, WNT, Warszawa 2000
2 Elementy rachunku prawdopodobie ´nstwa
2.1 Podstawy
Przestrze ´n zdarze ´n elementarnych
Poj˛eciem pierwotnym w rachunku prawdopodobie´nstwa jest przestrze ´n zdarze ´n elementarnych Ω.
Zdarzenie losowe
Podzbiory zbioru Ω nazywamy zdarzeniami losowymi Prawdopodobie ´nstwo
Definicja
Dowoln ˛a funkcj˛e okre´slon ˛a na zdarzeniach losowych tak ˛a, ˙ze
• Dla ka˙zdego zdarzenia A zachodzi P (A) ≥ 0
• P (Ω) = 1
• Je´sli A i B s ˛a takimi zdarzeniami, ˙ze A ∩ B = ∅ dla i 6= j, to P (A ∪ B) = P (A) + P (B)
2.2 Prawdopodobie ´nstwo warunkowe
Prawdopodobie ´nstwo warunkowe Definicja
Prawdopodobie´nstwem warunkowym zaj´scia zdarzenia A pod warunkiem zaj´scia zdarzenia B, gdzie P (B) > 0, nazywamy liczb˛e
P (A|B) = P (A ∩ B) P (B)
2.3 Prawdopodobie ´nstwo całkowite
Prawdopodobie ´nstwo całkowite Prawdopodobie ´nstwo całkowite
Je˙zeli B1, . . . , Bns ˛a takimi zdarzeniami losowymi, ˙ze
• P (Bi) > 0 dla i = 1, . . . , n,
• B1∪ · · · ∪ Bn= Ω,
• Bi∩ Bj dla i 6= j,
to dla dowolnego zdarzenia A zachodzi
P (A) = P (A|B1)P (B1) + · · · + P (A|Bn)P (Bn)
Prawdopodobie ´nstwo całkowite - przykład Zadanie
Przedsi˛ebiorstwo zawarło umowy z zakładami Z1, Z2oraz Z3 na dostaw˛e podze- społów. Zakład Z1 dostarcza 50%, zakład Z2 dostarcza 35% natomiast zakład Z3 dostarcza 15% potrzebnych podzespołów. Wiadomo, ˙ze 95% dostaw zakładu Z1, 80% dostaw zakładu Z2 oraz 85% dostaw zakładu Z3 odpowiada wymaganiom technicznym. Jakie jest prawdopodobie´nstwo, ˙ze jeden wylosowany podzespół odpowiada wymaganiom technicznym?
Prawdopodobie ´nstwo całkowite - przykład Rozwi ˛azanie
B1 - zdarzenie polegaj ˛ace na wylosowaniu podzespołu wyprodukowanego w za- kładzie Z1.
B2 - zdarzenie polegaj ˛ace na wylosowaniu podzespołu wyprodukowanego w zakładzie Z2.
B3 - zdarzenie polegaj ˛ace na wylosowaniu podzespołu wyprodukowanego w zakładzie Z3.
A - zdarzenie polegaj ˛ace na wylosowaniu podzespołu odpowiadaj ˛acemu wy- mogom technicznym.
Prawdopodobie ´nstwo całkowite - przykład Rozwi ˛azanie
P (A|B1) = 0.95 P (B1) = 0.50 P (A|B2) = 0.80 P (B2) = 0.35
P (A|B3) = 0.85 P (B3) = 0.15
P (A) = P (A|B1)P (B1) + P (A|B2)P (B2) + P (A|B3)P (B3)
= 0.8825
Prawdopodobie ´nstwo całkowite Wzór Bayesa
Je˙zeli B1, . . . , Bns ˛a takimi zdarzeniami losowymi, ˙ze
• P (Bi) > 0 dla i = 1, . . . , n,
• B1∪ · · · ∪ Bn= Ω,
• Bi∩ Bj dla i 6= j,
oraz niech P (A) > 0. Wówczas dla dowolnego j ∈ {1, . . . , n} mamy P (Bj|A) = P (A|Bj)P (Bj)
P (A)
Prawdopodobie ´nstwo całkowite - przykład cd Zadanie
Do punktu serwisowego zgłasza si˛e klient z urz ˛adzeniem, w którym uszkodzony jest podzespół. Jakie jest prawdopodobie´nstwo, ˙ze producentem zepsutego pod- zespołu był zakład Z1?
Prawdopodobie ´nstwo całkowite - przykład cd Rozwi ˛azanie
P (B1|A) = P (A|B1)P (B1)
P (A) = 0.5382
2.4 Niezale˙zno´s´c zdarze ´n
Niezale˙zno´s´c zdarze ´n Definicja
Zdarzenia A oraz B nazywamy niezale˙znymi, gdy P (B|A) = P (B), P (A) > 0.
Zdarzenia A oraz B s ˛a niezale˙zne, gdy
P (A ∩ B) = P (A)P (B)
3 Wnioskowanie statystyczne
Idea wnioskowania statystycznego
Poj˛ecia Populacja
Zbiór obiektów z wyró˙znion ˛a cech ˛a (cechami) Próba
Wybrana cz˛e´s´c populacji podlegaj ˛aca badaniu Cecha
Wielko´s´c losowa charakteryzuj ˛aca obiekty danej populacji
Poj˛ecia
Cecha jako´sciowa
Cecha przyjmuj ˛aca warto´sci nie b˛ed ˛ace liczbami (np. kolor, płe´c, smakowito´s´c) Cecha skokowa (dyskretna)
Cecha przyjmuj ˛aca pewne warto´sci liczbowe i nie przyjmuj ˛aca warto´sci po´sred- nich (np. liczba bakterii, liczba pracowników, liczba pasa˙zerów).
Cecha ci ˛agła
Cecha przyjmuj ˛aca warto´sci z pewnego przedziału liczbowego (np. wzrost, waga, plon)
4 Podstawowe modele statystyczne
4.1 Model dwumianowy
Do´swiadczenie Bernoulliego Okre´slenie
Wykonujemy dwuwynikowe do´swiadczenie. Wyniki nazywane s ˛a umownie suk- cesoraz pora˙zka. Prawdopodobie´nstwo sukcesu wynosi p (pora˙zki: 1 − p).
Zmienna losowa
Zmienn ˛a losow ˛a X jest uzyskanie sukcesu.
Schemat Bernoulliego Okre´slenie
Do´swiadczenie Bernoulliego wykonujemy n krotnie w sposób niezale˙zny. Zmienn ˛a losow ˛a X jest liczba sukcesów.
Rozkład dwumianowy
Zmienna losowa X ma rozkład B(n, p):
Pn,p{X = k} =n k
pk(1 − p)n−k, k = 0, 1, . . . , n.
Schemat Bernoulliego Przykład
Wadliwo´s´c procesu produkcyjnego wynosi 10%. Obliczy´c prawdopodobie´nstwo,
˙ze na osiem wylosowanych produktów b˛ed ˛a co najwy˙zej dwa złe.
Schemat Bernoulliego Rozwi ˛azanie
Do´swiadczenie Bernoulliego: wylosowanie jednego elementu.
Sukces: element wadliwy Pora˙zka: element dobry
Prawdopodobie´nstwo sukcesu: 0.1 Prawdopodobie´nstwo pora˙zki: 0.9 Schemat Bernoulliego
Rozwi ˛azanie
Schemat Bernoulliego: wylosowanie dziesi˛eciu elementów.
Prawdopodobie´nstwo wylosowania co najwy˙zej dwóch złych=
prawdopodobie´nstwo wylosowania ˙zadnego złego+
prawdopodobie´nstwo wylosowania jednego złego+
prawdopodobie´nstwo wylosowania dwóch złych.
10 0
0.100.910+10 1
0.110.99+10 2
0.120.98
4.2 Model gaussowski
Rozkład normalny Okre´slenie
Zmienna losowa X ma rozkład normalny N (µ, σ2):
fµ,σ2(x) = 1 σ√
2πe−12(x−µσ )2, −∞ < x < ∞.
EX = µ D2X = σ2.
Rozkład normalny
Rozkład normalny
Rozkład normalny UWAGA
Oznaczenie rozkładu normalnego
N (warto´s´c ´srednia, wariancja)
lub
N (warto´s´c ´srednia, odchylenie standardowe)
Rozkład normalny UWAGA
Nasze oznaczenie rozkładu normalnego
N (warto´s´c ´srednia, wariancja)
Rozkład normalny Prawo trzech sigm
P {|X − µ| < σ} = 0.68268 ≈ 0.68 P {|X − µ| < 2σ} = 0.95450 ≈ 0.95 P {|X − µ| < 3σ} = 0.99730 ≈ 0.997
Rozkład normalny
Rozkład normalny Przykład
Przyjmuj ˛ac, ˙ze waga (w kilogramach) noworodka jest zmienn ˛a losow ˛a o rozkła- dzie N (3, 0.25) okre´sli´c procent noworodków o wadze:
• z przedziału (3, 3.25),
• z przedziału (2.5, 3.5).
Rozkład normalny Rozwi ˛azanie
Niech X oznacza wag˛e (w kilogramach) noworodka. Jest to zmienna losowa o warto´sci ´sredniej 3 i o odchyleniu standardowym 0.5.
Mamy obliczy´c:
• P {X ∈ (3, 3.25)},
• P {X ∈ (2.5, 3.5)}.
Rozkład normalny Rozwi ˛azanie
P {X ∈ (3, 3.25)} =
ROZKŁAD.NORMALNY(3.25; 3; 0.5; 1)−
ROZKŁAD.NORMALNY(3; 3; 0.5; 1) = 0.1915.
Odpowied´z: nieco ponad 19% noworodków ma wag˛e mi˛edzy 3 a 3.25 kilograma Rozkład normalny
Rozwi ˛azanie
P {X ∈ (2.5, 3.5)} =
P {X ∈ (´srednia − odchylenie, ´srednia + odchylenie)} = 0.6827.
Odpowied´z: prawie 68.3% noworodków ma wag˛e mi˛edzy 2.5 a 3.5 kilograma
5 Estymacja
5.1 Estymatory punktowe
Estymatory punktowe Okre´slenie
Estymujemy parametr θ rozkładu cechy X Próba: X1, X2, . . . , Xn
Estymator (punktowy) jest funkcj ˛a próby θ = ˆˆ θ(X1, X2, . . . , Xn) przybli˙zaj ˛ac ˛a warto´s´c parametru θ
Estymatory punktowe Rozkład normalny N (µ, σ2)
Estymator ´sredniej µ - ´srednia arytmetyczna X =¯ 1
n
n
X
i=1
Xi = X1+ · · · + Xn n
Estymatory punktowe Rozkład normalny N (µ, σ2)
Estymator wariancji σ2 - wariancja próbkowa
S2 = 1 n − 1
n
X
i=1
(Xi− ¯X)2
Suma kwadratów odchyle ´n od ´sredniej
varX =
n
X
i=1
(Xi− ¯X)2 =
n
X
i=1
Xi2 − n ¯X2 =
n
X
i=1
Xi2− 1 n
n
X
i=1
Xi
!2
Estymatory punktowe Rozkład normalny N (µ, σ2)
Estymator odchylenia standardowego σ S =√
S2
Estymatory punktowe
Rozkład dwumianowy B(n, p)
k - liczba sukcesów w próbie n elementowej Estymator punktowy:
ˆ p = k
n
5.2 Przedziały ufno´sci
Przedział ufno´sci Okre´slenie
Przedziałem ufno´sci nazywamy przedział o ko´ncach zale˙znych od próby, który z pewnym z góry zadanym prawdopodobie´nstwem pokrywa nieznan ˛a warto´s´c pa- rametru θ
P {θ ∈ (θ(X1, . . . , Xn), θ(X1, . . . , Xn))} = 1 − α Poziom ufno´sci: prawdopodobie´nstwo 1 − α
Przedział ufno´sci Długo´s´c przedziału d
• Liczno´s´c próby (n %=⇒ d &)
• Poziom ufno´sci (1 − α %=⇒ d %)
• Wariancja cechy (σ2 &=⇒ d &)
5.3 Przedział ufno´sci dla ´sredniej
Przedział ufno´sci dla warto´sci ´sredniej Rozkład normalny N (µ, σ2)
Wariancja σ2jest nieznana Poziom ufno´sci: 1 − α
X − t(α; n − 1)¯ S
√n , ¯X + t(α; n − 1) S
√n
t(α; ν): warto´s´c krytyczna rozkładu t (Studenta) z ν stopniami swobody Długo´s´c przedziału: d = 2t(α; n − 1) S
√n
Przedział ufno´sci dla warto´sci ´sredniej Przykład - tre´s´c
Oszacowa´c przeci˛etn ˛a ilo´s´c punktów uzyskiwanych na klasówce.
n = 300 X
xi = 176.566 X
x2i = 107.845302
Przedział ufno´sci dla warto´sci ´sredniej Przykład - rozwi ˛azanie
Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ilo´s´c punktów zdobytych na klasówce Zało˙zenie: cecha X ma rozkład normalny N (µ, σ2) Zadanie: oszacowa´c parametr µ
Technika statystyczna: przedział ufno´sci dla ´sredniej poziom ufno´sci 1 − α = 0.95
Przedział ufno´sci dla warto´sci ´sredniej Przykład - rozwi ˛azanie
Obliczenia
¯ x = 1
n
Xxi = 176.566
300 = 0.589 varX =X
x2i − 1 n
Xxi2
= 107.845302 − 176.5662
300 = 3.92679 s2 = 3.92679
300 − 1 = 0.01313, s =√
s2 = 0.11460
Przedział ufno´sci dla warto´sci ´sredniej Przykład - rozwi ˛azanie
Obliczenia cd
t(0.05; 299) ≈ 1.96 t(0.05; 299) s
√n = 1.960.11460
√300 = 0.01297 (0.589 − 0.013, 0.589 + 0.013) = (0.576, 0.602) Przedział ufno´sci dla warto´sci ´sredniej
Przykład - rozwi ˛azanie
Odpowied´z: µ ∈ (0.576, 0.602)
Wniosek. Przeci˛etna ilo´s´c punktów zdobywana na klasówce jest liczb ˛a z prze- działu (0.576, 0.602). Zaufanie do tego wniosku wynosi 95%.
Jednostronny przedział ufno´sci dla warto´sci ´sredniej Rozkład normalny N (µ, σ2)
Wariancja σ2jest nieznana Poziom ufno´sci: 1 − α
(−∞, X + t(2α; n − 1)¯ S
√n)
( ¯X − t(2α; n − 1) S
√n, ∞)
5.4 Przedział ufno´sci dla wariancji
Przedział ufno´sci dla wariancji Rozkład normalny N (µ, σ2) Warto´s´c ´srednia µ jest nieznana
Poziom ufno´sci: 1 − α varX χ2 α2; n − 1 ,
varX χ2 1 −α2; n − 1
!
χ2(α; ν) jest stablicowan ˛a warto´sci ˛a krytyczn ˛a rozkładu chi–kwadrat z ν stop- niami swobody
5.5 Przedział ufno´sci dla frakcji
Przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Rozkład dwumianowy B(n, p)
k - liczba sukcesów w próbie n elementowej Poziom ufno´sci: 1 − α
Dokładny przedział ufno´sci
p1
1 −α
2; k, n − k
, 1 − p1 1 − α
2; n − k, k
Przybli˙zony przedział ufno´sci ˆ
p − u1−α/2
rp(1 − ˆˆ p)
n , ˆp + u1−α/2
rp(1 − ˆˆ p) n
!
uα jest kwantylem rz˛edu α rozkładu N (0, 1).
Przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Przykład - tre´s´c
Oszacowa´c odsetek ocen dostatecznych otrzymywanych na klasówce.
n = 300 k = 88
Przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Przykład - rozwi ˛azanie
Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ocena dostateczna/inna z klasówki
Zało˙zenie: cecha X ma rozkład dwupunktowy D(p) Zadanie: oszacowa´c parametr p
Technika statystyczna: przybli˙zony przedział ufno´sci dla prawdopodobie´n- stwa p
poziom ufno´sci 1 − α = 0.95
Przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Przykład - rozwi ˛azanie
Obliczenia
p =b 88
300 = 0.29 u1−α/2 = u0.975 = 1.96 0.29 − 1.96
r0.29(1 − 0.29)
300 = 0.2387 0.29 + 1.96
r0.29(1 − 0.29)
300 = 0.3413 Przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Przykład - rozwi ˛azanie
Odpowied´z: p ∈ (0.2387, 0.3413)
Wniosek. Odsetek ocen dostatecznych zdobywanych na klasówce jest liczb ˛a z przedziału (23.87%, 34.13%). Zaufanie do tego wniosku wynosi 95%.
Jednostronny przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Rozkład dwumianowy B(n, p)
k - liczba sukcesów w próbie n elementowej Poziom ufno´sci: 1 − α
Dokładne jednostronne przedziały ufno´sci
(0 , 1 − p1(1 − α; n − k, k)) (p1(1 − α; k, n − k) , 1)
Jednostronny przedział ufno´sci dla prawdopodobie ´nstwa sukcesu Rozkład dwumianowy B(n, p)
k - liczba sukcesów w próbie n elementowej Poziom ufno´sci: 1 − α
Przybli˙zone jednostronne przedziały ufno´sci
0, ˆp + u1−α
rp(1 − ˆˆ p) n
!
ˆ
p − u1−α
rp(1 − ˆˆ p) n , 1
!