Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
Estymacja przedziałowa
W prezentacji:
• przedział ufności dla średniej
• przedział ufności dla dyspersji
• przedział ufności dla frakcji
Estymacja przedziałowa
- przedział ufności
dla średniej
(1)
Dla n-elementowej próby (małej, n<30) z populacji normalnej i dla poziomu ufności
α
α
α
α
połowa szerokości przedziału ufności (niepewność oceny wartości średniej) wyraża się wzorem:
n
s
t
n
s
t
x
ˆ
1
α α=
−
=
∆
gdzie s i
sˆ
są estymatorami dyspersji,zaś tαααα jest kwantylem rzędu q = (1 +
α
α
α
α
) / 2 zmiennej t Studenta, dla r = n – 1 stopni swobodyPrawdopodobieństwo i Statystyka Matematyczna dr Jan Malinowski
α
α α=
−
−
⋅
+
<
<
−
⋅
−
1
1
1
n
s
t
x
m
n
s
t
x
P
α
α α=
−
⋅
+
<
<
⋅
−
ˆ
ˆ
1
n
s
t
x
m
n
s
t
x
P
Estymacja przedziałowa - przedział ufności dla średniej (1)
to samo co na slajdzie poprzednim – inaczej przedstawione
Przy dużej próbie (dla niezbyt asymetrycznych, jednomaksimowych rozkładów zwykle wystarcza n>30)
dla dowolnego rozkładu x przedział ufności określony jest przez
n
s
u
n
s
u
x
ˆ
1
α α=
−
=
∆
gdzie uαααα jest kwantylem rzędu q = (1 +
α
α
α
α
) / 2 rozkładu N(0, 1)Estymacja przedziałowa
- przedział ufności
dla średniej
(2)
α
σ
σ
α α=
−
⋅
+
<
<
⋅
−
1
n
u
x
m
n
u
x
P
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Estymacja przedziałowa - przedział ufności dla średniej
Zadanie:
Dla oszacowania nieznanej średniej m wytrzymałości pewnego materiału budowlanego dokonano 5-ciu pomiarów. Wyniki pomiarów (w kG/cm2):
20.4, 19.6, 22.1, 20.8, 21.1
Przyjmując współczynnik ufności 1-
α
α
α
α
= 0.99 zbudować przedział ufności dla średniej wytrzymałości tego materiału.Rozwiązanie:
Obliczamy: <x>=20.8 kG/cm2 s=0.82 kG/cm2
z rozkładu t-Studenta dla 1-
α
α
α
α
= 0.99 (tj. dlaα
α
α
α
= 0.01), dla n = 5-1 stopni swobody mamy tα
α
α
α
= 4.604Ze wzoru na przedział ufności mamy
∆
∆
∆
∆
x = 1.9( 20.8 – 1.9 ) < m < ( 20.8 + 1.9 )
Estymacja przedziałowa - przedział ufności dla średniej
Zadanie do rozwiązania:
Chcemy oszacować średni staż pracy pracowników w Firmie. Z "populacji pracowników" wylosowano n=100 osób. Oto wyniki:
staż (w latach) liczba pracowników
0 – 2 4
2 – 4 10
4 – 6 55
6 – 8 25
8 – 10 6
Przyjmując współczynnik ufności 1 –
α
α
α
α
= 0.90 zbudować przedział ufności dla średniego stażu pracy badanej populacji.∑
==
r j j jn
x
n
x
11
&
∑
(
)
=−
=
r j j jn
x
x
n
s
1 21
r
&
Dla przypomnienia: gdzie nJ– liczebność klasy,a jej środek oznaczono jako xz kropką;
r – liczba klas
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Estymacja przedziałowa
- przedział ufności
dla dyspersji
(*1)(1)
(*1)– tutaj pojęcie 'dyspersja'
użyte jest dla określenia 'odchylenia standardowego'
Dla n-elementowej próby z populacji normalnej, niesymetryczny przedział ufności budujemy wokół (obciążonej) dyspersji z próby, s :
α
σ
=
<
<
1 2z
n
s
z
n
s
P
gdzie z1111 jest kwantylem rzędu (1 –
α
α
α
α
) / 2, zaś z2 – rzędu (1 +α
α
α
α
) / 2rozkładu
χ
χ
χ
χ
2 o n – 1 stopniach swobody.Dla wariancji granice przedziału podnosimy do kwadratu.
Prawdopodobieństwo i Statystyka Matematyczna dr Jan Malinowski
(
χ
)
α
2
1
1 2=
< z
P
(
χ
)
α
2
1
2 2=
≥ z
P
gdzie z1 i z2 są wartościami χ2 wyznaczonymi z tablic dla n-1 stopni swobody i współczynnika ufności 1-α tak, aby
Estymacja przedziałowa
- przedział ufności
dla dyspersji
(2)
Przy dużej próbie, n>30, z rozkładu bliskiego normalnemu, stosuje się przybliżony wzór:
α
σ
α α=
−
<
<
+
n
u
s
n
u
s
P
2
1
2
1
gdzie uαααα jest kwantylem rzędu (1 +
α
α
α
α
) / 2 rozkładu N(0, 1)W obu przypadkach prawdopodobieństwa tego, że przedział znajdzie się w całości na prawo i w całości na lewo od prawdziwej wartości
σ
σ
σ
σ
, są sobie równe.Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Estymacja przedziałowa - przedział ufności dla dyspersji
Zadanie:
Mierząc wytrzymałość elementu konstrukcyjnego, dla n = 4 niezależnych pomiarów, otrzymano wyniki:
120, 102, 135, 115
Zbudować przedział ufności dla wariancji wytrzymałości tego elementu przyjmując 1 –
α
α
α
α
= 0.96Rozwiązanie:
Mamy małą próbę.
Najpierw liczymy wartość ns2 = 558 ( <x> = 118 )
Z tablicy rozkładu
χ
χ
χ
χ
2 dla n – 1 = 3 stopni swobody,dla 1 –
α
α
α
α
/ 2 = 0.98 wartość z1 = 0.185 oraz dlaα
α
α
α
/ 2 = 0.02 wartość z2 = 9.837 stąd 56.7 < s2 < 3016Zadanie do rozwiązania:
W budżetach wylosowanych 632 gospodarstw domowych średnie miesięczne wydatki na żywność wyniosły 1570 zł, a ich odchylenie standardowe 224 zł. Przyjmując współczynnik ufności 1 –
α
α
α
α
= 0.90 zbudować przedział ufności dla odchylenia standardowego wydatków na żywność.Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Estymacja przedziałowa- przedział ufności
dla frakcji
(czasem mówi się, dla wskaźnika struktury lub procentu)Mamy n1 elementów wyróżnionych w próbie n-elementowej (*2).
Estymatorem frakcji,
ω
ω
ω
ω
z próby jest p = n1 / n,zaś przedział ufności przy poziomie ufności
α
α
α
α
będzie miał– w granicy, przy dużych n1 i n2 = n – n1 – połowę szerokości
−
=
∆
n
n
n
n
u
p
11
1 αgdzie uαααα jest kwantylem rzędu (1 +
α
α
α
α
) / 2, (podobnie jak dla testu średniej). (*2) Zależność tę, wynikającą ze zbieżności rozkładu dwumianowego do normalnego stosuje w praktyce już od n1≥
≥
≥
≥
10 i n2≥
≥
≥
≥
10Jeśli warunki te nie są spełnione,
Estymacja przedziałowa- przedział ufności dla frakcji
ten sam wzór przedstawiony inaczej
Mamy n1 elementów wyróżnionych w próbie n – elementowej Estymatorem frakcji,
ω
ω
ω
ω
z próby jest p = n1 / n,zaś przedział ufności przy poziomie ufności
α
α
α
α
będzie miał– w granicy, przy dużych n1 i n2 = n – n1 – połowę szerokości
−
=
∆
n
n
n
n
u
p
11
1 αα
α α=
−
−
⋅
+
<
<
−
⋅
−
1
1
1
1 1 1 1 1 1n
n
n
n
n
u
n
n
p
n
n
n
n
n
u
n
n
P
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Estymacja przedziałowa
- przedział ufności
dla frakcji
(*2) – n1 w n-elementowej próbie;
pozostałe n2 = n – n1 elementów zostało w ten sposób również wyróżnione.
Wyróżnienie jest wyłącznie sprawą umowy
Zadanie:
Chcemy oszacować, jaki procent studentów jada obiady w stołówkach.
Z pośród wylosowanych n = 900 osób – m = 300 osób je obiady w stołówce. Dla współczynnika ufności 1 –
α
α
α
α
= 0.95 zbudować przedział ufności dla procentu badanej kategorii.Rozwiązanie:
Szacowana frakcja pracowników p = m / n = 300 / 900 = 0.333
Dla rozkładu N(0, 1) – duża próba – dla
α
α
α
α
= 0.05 mamy uα
α
α
α
= 1.96Z wzoru otrzymujemy przybliżony przedział ufności
∆
∆
∆
∆
p = 0.0160.333 – 1.96 ⋅ 0.016 < p < 0.333 + 1.96 ⋅ 0.016 czyli 0.302 < p < 0.364
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Wyznaczanie niezbędnej liczby pomiarów do próby
Model I:
Populacja generalna ma rozkład N( m, σ );
wariancja – znana;
m – nieznane, do oszacowania.
Dla ustalonego poziomu ufności (1 – α)
oraz ustalonego błędu d , (połowa przedziału ufności) wzmaganą liczebność próby wyznaczamy ze wzoru:
2 2 2
d
u
n
=
ασ
Wyznaczanie niezbędnej liczby pomiarów do próby
Model II:
Populacja generalna ma rozkład N( m, σ );
wariancja – znamy estymator s2,
na podstawie próby wstępnej o liczebności n0 ;
m – nieznane, do oszacowania.
Dla ustalonego poziomu ufności (1 – α
oraz ustalonego błędu d , (połowa przedziału ufności) wzmaganą liczebność próby wyznaczamy ze wzoru:
2 2 2
d
s
t
n
)
α=
∑
(
)
=−
−
=
0 1 2 0 21
1
n i ix
x
n
s
)
v
gdziePrawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Wyznaczanie niezbędnej liczby pomiarów do próby
Model III:
Populacja generalna ma rozkład dwupunktowy z parametrem p (p – frakcja elementów wyróżnionych)
Aby dla ustalonego poziomu ufności (1 – α)
błąd szacunku wskaźnika struktury nie przekroczył danej z góry wartości d liczebność próby wyznaczamy ze wzoru:
2 2
d
pq
u
n
=
α znamy rząd wielkości p: (q = 1 – p)nieznamy rzędu wielkości p:
przyjmujemy pq jako maksymalny, (pq = 1/4)
2 2
4
d
u
Wyznaczanie niezbędnej liczby pomiarów do próby
zadanie (53-JM):
Ile osób należy wylosować do próby,
aby oszacować, p – procent wyborców partii X
z maksymalnym błędem 3%, przy współczynniku ufności 95%
a) oczekuje się wartości p około 50% (błąd maksymalnie 3%); b) oczekuje się wartości p około 5% (błąd maksymalnie 3%); c) oczekuje się wartości p około 5% (błąd maksymalnie 1%);
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Wyznaczanie niezbędnej liczby pomiarów do próby
zadanie (53-JM):
Ile osób należy wylosować do próby,
aby oszacować, p – procent wyborców partii X
z maksymalnym błędem 3%, przy współczynniku ufności 95%
a) oczekuje się wartości p około 50% (błąd maksymalnie 3%); n = 1,962 / (4 0,032) = 1067
b) oczekuje się wartości p około 5% (błąd maksymalnie 3%); n = ( 1,962 0,05 0,95 ) / 0.032 = 203
c) oczekuje się wartości p około 5% (błąd maksymalnie 1%);
n = ( 1,962 0,05 0,95 ) / 0.012 = 1825 rozwiązanie
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski
Prawdopodobieństwo i Statystyka Matematyczna
dr Jan Malinowski