7.2. Estymacja jako metoda indukcyjnego wnioskowania statystycznego
7.2.3. Estymacja przedziałowa
Estym acja przedziałow a polega na skonstruow aniu przedziału nazywanego p rze działem ufności, który z zadanym z góry praw dopodobieństw em bliskim jedności rów nym 1 - a pokrywa w artość p aram etru Q. Praw dopodobieństw o to nazywamy w sp ó ł czynnikiem (poziom em ) ufności. Przedział ufności jest przedziałem losowym. Musimy się liczyć z istnieniem przedziałów , k tóre nie pokryw ają w artości param etru . Przyj m ując współczynnik ufności, określam y, jak a będzie częstość przedziałów pokryw a jących w artość p aram etru w długiej serii niezależnych prób. Z e wszystkich przedzia łów wybieramy ten, który przy danym 1 - a m a możliwie najm niejszą długość. Przedział ufności konstruujem y na podstaw ie rozkładu odpow iedniej statystyki z próby (esty m atora). M ogą to być rozkłady dokładne lub graniczne (por. pun kt 7.1).
Zasady estymacji przedziałow ej przedstaw im y na przykładach 7.8 do 7.14.
P rz y k ła d 7.8
Podjęto badania m ające na celu określenie średnich wydatków na opiekę zdro w otną w gospodarstw ach domowych em erytów i rencistów. W iadom o, że wydatki te są zm ienną losową o rozkładzie norm alnym , którego w artość średnia fj. jest nieznana. Z nane jest natom iast odchylenie standardow e a = 20 [zł]. Jak o estym atora użyjemy średniej arytm etycznej danej w zorem (7.3), który w tym miejscu podajem y dla przy pom nienia:
E stym ator ten m a rozkład N([x:—j= ) . Aby skonstruow ać przedział ufności, przyj-mujemy współczynnik ufności 1 - a = 0,95. O znacza to, że w serii złożonej ze 100 niezależnych prób uzyskamy 95 przedziałów pokrywających średnie wydatki na op ie kę zdrow otną w populacji generalnej w gospodarstw ach dom owych em erytów i re n cistów. Poszukujem y granic przedziału:
Po prostych przekształceniach otrzymujemy:
p \ x - u a - ^ = < [ Ł < X + ua - ^ = l - a . (7 .2 2 )
l v « V»J
W artość u a odczytujemy z tablic rozkładu norm alnego dla zadanego współczyn nika ufności 1 - a (por. tabl. 7.1), w taki sposób, aby P ( \ U \ < u a) = 1 - a .
D la przedziałow ego oszacow ania średnich wydatków na ochronę zdrowia wylo sow ano 16 gospodarstw dom owych em erytów i rencistów. Z aobserw ow ano następu jące wydatki (x, w zł):
100 180 300 500 120 200 380 600 160 200 400 650 180 240 430 320
Po wykonaniu obliczeń dla tej zbiorowości otrzym ano średnie wydatki równe: _ 4960 „ , nr „
x = ---= 310 [ził.
16
W artości u aodczytujemy z tablic dystrybuanty rozkładu norm alnego, której frag m ent p o d an o w tablicy 7.1.
Tablica 7.1. Fragment dystrybuanty rozkładu normalnego
Ua -0,01 -0,03 -0,04 -0,05 -0,06 -1,9 0,0281 0,0268 0,0262 0,0256 0,0250 -1,6 0,0537 0,0516 0,0505 0,0495 0,0485 «„ 0,01 0,03 0,04 0,05 0,06 1,6 0,9463 0,9484 0,9406 0,9505 0,9515 1,9 0,9719 0,9732 0,9686 0,9744 0,9750
Źródło: opracowanie własne.
Po podstaw ieniu odpow iednich w artości do wzoru (7.21) mamy:
3 1 0 -1 ,9 6 --j= = < |x < 3 1 0 + l, 9 6 -- j= = j = {310-1,96-5 < ^ < 3 1 0 + 1,96-5}
{310 - 9,8 < (a < 310 + 9,8}.
Jest to jed en z losowych przedziałów, które z praw dopodobieństw em 0,95 pokry wają średnie wydatki na opiekę zdrow otną w gospodarstw ach domowych em erytów i rencistów.
P rz y k ła d 7.9
W celu pod jęcia decyzji w zakresie z a rzą d zan ia p erso n elem p rz ep ro w a d zo no analizę fluktuacji zatrudnienia w firm ie G. Z wykazu pracowników wylosowano w sposób niezależny 26 osób i zebrano d an e dotyczące stażu pracy. C echa ta jest zm ienną losową o rozkładzie norm alnym , k tórego p aram etry są nieznane. Należy oszacować średni staż pracy wszystkich zatrudnionych w firm ie G.
W artość odchylenia standardow ego w populacji generalnej jest nieznana i d la te go musimy w prowadzić jego punktow e oszacow anie uzyskane w edług wzorów (7.18) lub (7.19). W przypadku estymacji przedziałow ej nie m a znaczenia, czy wybierzemy estym ator obciążony, czy nieobciążony. W obydwu przypadkach otrzym am y id en tyczne wyniki.
W celu skonstruow ania przedziału ufności m usimy wykorzystać funkcję /-S tu denta zdefiniow aną w zorem (7.15). Poszukujem y granic przedziału ufności danego odpowiednio:
• dla estym atora obciążonego:
■fn- 1
W rezultacie odpow iednich przekształceń otrzym ujem y następujące przedziały ufności:
(7 .2 3 )
• dla estym atora nieobciążonego:
(7 -2 4 )
P \ X - t a ~ < \ i < X + ta - ^ \ = l - a .
V/7
(7 .2 5 )
W arto ść t odczytujem y z tablic ro zkładu S tu d e n ta dla n - 1 stopni swobody i współczynnika ufności 1 - a w taki sposób, aby P( | T | < fa) = 1 - a . Tablice rozkła du S tu d en ta są tak skonstruow ane, że w artość statystyki ta odczytujemy dla poziomu. W ybrane w artości statystyki t - S tudenta p o d an o w tablicy 7.2.
Tablica 7.2. Fragment tablicy rozkładu Studenta
n - 1 a 0,01 0,05 0,09 0,1 5 4,032 2,571 2,098 2,015 8 3,355 2,306 1,928 1,860 9 3,250 2,262 1,899 1,833 10 3,169 2,228 1,877 1,812 15 2,947 2,131 1,812 1,753 20 2,845 2,086 1,782 1,725 25 2,787 2,060 1,764 1,708 30 2,750 2,042 1,752 1,697 Źródło: opracowanie własne.
D o oszacow ania średniego stażu pracy zeb ran o dan e dotyczące wybranych do próby 26 pracow ników (x, staż pracy w latach):
1 7 14 18 28 2 7 14 20 30 3 7 15 22 33 5 10 17 25 35 5 12 18 27 35 25 Po w ykonaniu obliczeń otrzym ano:
435
• średni staż pracy równy: x = --- = 17,4 [lata], 26
282$ 76
• w ariancja stażu pracy jest równa: s 2 --- -— = 113,1504 [lata2], 26
• odchylenie standardow e równe: 5 = -^/l 13.1504 = 10,64[lata].
Przyjm ujem y w spółczynnik ufności 1 - a = 0,9, którem u przy 25 stopniach swo body odpow iada w artość ta = 1,708 (por. tab. 7.2). Podstaw iam y do wzoru (7.25) i otrzym ujem y:
3 59 3 59 18 -1.708 • _ ! = . < ja < 18 +1.708 '
V25 V25 r
Jest to jed en z losowych przedziałów, k tóre z praw dopodobieństw em 0,90 pokry wają średnie zatrudnienie w firm ie G. W tym przypadku wielkościam i losowymi są zarówno końce przedziału, jak i jego długość wynosząca S ■ ta.
P rz y k ła d 7.10
W budżecie czasu studentów powinien się znaleźć czas poświęcony n a lekturę literatury pięknej. P rzeprow adzając b ad an ia m eto d ą reprezentacyjną, zeb rano dane dotyczące czytelnictwa w śród wybranych losowo 100 studentów pewnej uczelni. Czas poświęcony na lekturę jest zm ienną losową o nieznanym rozkładzie. Należy oszaco wać m etod ą przedziałow ą średni czas poświęcony na lekturę literatu ry pięknej przez wszystkich studentów uczelni, przyjm ując w spółczynnik ufności 1 - a = 0,90.
Gdy postać rozkładu zm iennej w populacji generalnej nie jest znana, a dysponu jemy dużą próbą statystyczną, to dla skonstruow ania przedziału ufności wykorzysta my statystykę dan ą w zorem (7.16):
U =X - V L
Poszukujem y zatem końców przedziału:
X - \ i
■Jn
Po prostych przekształceniach otrzym ujem y:
= l - a . (7 .2 6 )
P \ X - u a - —r= < \ x < X + ua -
-4=j-
= 1 - a. V « J(7 .2 7 )
Tablica 7.3. Rozkład liczebności studentów pewnej uczelni według czasu poświęcanego tygodniowo na czytanie literatury pięknej
Xi f, */, fi ■ x- f i ( x ' - x y 0 -2 17 1 17 242,90 2-4 24 3 72 76,04 4-6 27 5 135 1,31 6-8 17 7 119 83,78 8 -10 15 9 135 261,U Suma 100 X 478 671,16
D la wylosowanej próby skonstruow ano szereg rozdzielczy podany w tablicy 7.3. Po w ykonaniu odpow iednich obliczeń otrzym ano:
• średni tygodniowy czas czytania literatury pięknej:
• w ariancję tygodniowego czasu czytania literatury pięknej:
• odchylenie standardow e tygodniowego czasu czytania: s = = 2,59 [godz.].
O dczytana z tablic w artość ua = 1,65. P odstaw iając do wzoru, otrzymujemy:
O stateczn a postać przedziału ufności jest następująca: {4,25 < n < 5,21}.
Jest to jed en z losowych przedziałów , k tóre z praw dopodobieństw em 0,90 pokry wają średni czas tygodniowo poświęcany przez studentów pewnej uczelni na czytanie literatu ry pięknej.
Zastanow im y się teraz, jak liczna pow inna być próba, aby z zadanym z góry współ czynnikiem ufności zapew nić dokładność oszacow ania wartości przeciętnej z błędem nie przekraczającym ustalonej wielkości d. Jak o maksym alny dopuszczalny błąd (d o kładność oszacow ania) przyjm iemy połow ę długości przedziału ufności.
P rz y k ła d 7.11
D la sytuacji rozważanej w przykładzie 7.7 ustalim y liczebność próby pozwalają cą oszacow ać śred nie wydatki na opiekę zdrow otną w gospodarstw ach domowych em erytów i rencistów z błędem nie większym niż 4,50 zł. Połow a długości przedziału ufności przyjm ow ana jak o błąd oszacow ania jest d an a wzorem:
Poniew aż poszukujem y liczebności próby n, to przekształcam y odpow iednio wzór 52 = 6 J 1 [godz.2]. [godz2.],
{4,78 - 0,43 < (o. < 4,78 + 0,43}.
(7 .2 8 )
(7.28).
Podstawiając będące do dyspozycji dane, otrzymujemy:
„ = 4 0 0 4 9 £ 7jŁ
25.25
Aby zapewnić zadaną dokładność oszacowania, należy dysponować próbą o liczeb ności n = 76 obserwacji. W ielkość próby ustalamy, zaokrąglając do najm niejszej liczby całkowitej przekraczającej uzyskany wynik. Należałoby więc dolosować 76 - 16 = 50 gospodarstw domowych.
W rozważanym przykładzie znana była a priori w artość odchylenia standardow ego w populacji generalnej. W praktyce trudno jest spotkać taki przypadek. Najczęściej wartość a jest nieznana. Postępujem y wówczas tak, jak w podanym niżej przykładzie.
P rzy k ład 7.12
Przygotowywane są reprezentacyjne b adania czasu pozostaw ania bezrobotnym przez absolwentów wyższych uczelni. Jednym z szacowanych param etró w jest średni czas pozostaw ania bezrobotnym . Należy ustalić wielkość próby, k tó ra przy w spół czynniku ufności 1 - a = 0,99, da oszacow anie tego p aram etru z b łęd em m aksym al nym d = 0,5 [miesiąca]. Zakładam y, że czas przebyw ania absolw entów w stanie bez robocia jest zm ienną losową o rozkładzie norm alnym , którego p aram etry są nieznane. Najpierw znajdziem y w zór podający za daną dokładność oszacow ania, czyli ustalimy połowę długości przedziału ufności danego w zorem (7.25). Jest on a równa:
Po przekształceniu otrzym ujemy:
t 2 - s 2 n =
-Dla ustalenia wielkości n m usim y znać w artość estym atora Ś 2. W tym celu prze prowadzam y badanie pilotażowe. Losujem y m ałą prób ę statystyczną o liczebności
n {| < 30. Obliczam y w artość estym atora S 2 (wzór (7.22)). U stalam y niezbędną w iel
kość próby n według w zoru (7.31).
Jeśli okaże się, że n > n0, to musimy dolosow ać brakujące n - n 0 elem entów . Jeśli natom iast n < n (), to dalszą analizę przeprow adzam y na podstaw ie próby pilotażo wej, ponieważ jej liczebność zapew nia większą od założonej dokładność oszacow a nia.
D o w stępnego oszacow ania w ariancji czasu pozostaw ania bezrobotnych spośród absolw entów wyższej uczelni wylosowano 9 osób. O trzym ano następujące realizacje bad an ej zm iennej (x, w m iesiącach).
Tablica 7.4. Czas pozostawania bezrobotnym po ukończeniu uczelni wyższej
5 6 6 7 9 12 13 14 18
( * , - * ) 2 16 25 16 9 1 4 9 16 64 Źródło: dane umowne.
N a podstaw ie tych danych ustalamy:
s 2 = = 20 [miesięcy2 ].
D la n - 1 = 8 stopni swobody i dla 1 - a = 0,99, to znaczy dla cx = 0,01 z tablic rozkładu t - S tudenta (por. tabl. 7.2) odczytujem y ta = 3,355. Podstaw iając do wzoru, mamy:
t ^ s2
n = —---- (3,335)2 -20 66,7
d 2 (0,25)2 0,25 = 889,778.
Z godnie z zasadą zaokrąglania do najm niejszej liczby całkowitej przekraczającej uzyskany wynik, stwierdzam y, że dla zapew nienia oszacowania, z zadaną dokładno ścią średniego czasu, jaki absolwenci uczelni wyższych pozostają bezrobotnym i nale ży dysponow ać próbą licząca n = 890 [osoby]. W obec tego należy dolosować n - n {)- = 790 - 9 = 781 [osoby].
Z ajm iem y się teraz konstruow aniem przedziału ufności dla wariancji i odchyle nia standardow ego.
P rz y k ła d 7.13
Przeprow adzam y analizę zróżnicow ania plac zasadniczych pracowników firmy M. Z akładam y, że cecha ta jest zm ienną losową o rozkładzie norm alnym , którego p aram etry są nieznane. Jak o m iarę zróżnicow ania przyjęto w ariancję. D la jej oszaco w ania z listy płac wylosowano 8 pracowników.
W rozważanym przypadku wiemy, że cecha w populacji generalnej m a rozkład norm alny o nieznanych p aram etrach . Z populacji tej wylosowano m ałą próbę staty styczną. D o skonstruow ania przedziału ufności użyjemy więc statystyki z próby zdefi niow anej jako:
%~=-n - S 2
C T
-(7.32)
P \ c x <n - S 2
a po przekształceniach otrzym ujem y przedział ufności: n l n - S 2 o n - S 2 ( P { --- < ct- < ---} = 1 - a , C~f Ci (7 .3 3 ) (7 .3 4 ) gdzie:
S 2 jest estym atorem wariancji w populacji generalnej zdefiniowany w zorem (7.19),
c, oraz c2 oznaczają w artości zm iennej losowej odczytane z tablic rozkładu %2 dla
n - 1 stopni swobody i poziom u istotności 1 - a odpow iednio jako:
C1= X- m-1;1--CC, c 2 = r , a -A7—1,—
2
Jeśli posłużymy się estym atorem nieobciążonym , który jest zdefiniow ane wzo rem (7.20), to przedział ufności przyjm ie postać:
( n - l - S * , (/? -1 ) ■
--- < CT“ < - --- --- = 1-GC. (7 .3 5 )
W sposób najbardziej ogólny przedział ufności dla w ariancji przedstaw iam y jako:
■ <ct“ < —--- )- = l - a . (7 .3 6 ) Z ( x , - x ) 2
/=!______
Na podstaw ie wylosowanej próby należy skonstruow ać przedział ufności, przyj mując współczynnik ufności 1 - a = 0,95. Z eb ran e w tym celu inform acje po d an o w tablicy 7.5.
Tablica 7.5. Płace zasadnicze pracowników firmy M
1000 1200 1280 1300 1400 1570 1700 1700
( x , - x ) 2 155039,1 37539,1 12939,1 8789,1 39,1 31064,1 93789,1 93789,1 Źródło: dane umowne.
Po w ykonaniu odpow iednich obliczeń otrzym ano:
• średnią płacę zasadniczą: x = * * ^ = 1393.75 [zł],
432987 5
T eraz należy znaleźć wartości c, o ra z c 2. W tym celu ustalamy: a = 0,05; — = 0,025 ;
n - 1 = 7. ’ 2
W tablicy 7.6 pod an o fragm ent rozkładu y \
Tablica 7.6. Fragment tablicy rozkładu ■/} Stopnie swobody n - 1 Poziom istotności a 0,025 0,05 0,01 0,975 0,95 0,99 5 12,832 11,070 15,086 0,831 1,145 0,554 6 14,449 12,592 16,812 1,237 1,635 0,872 7 16,013 14,067 18,475 1,690 2,167 1,239 8 17,535 15,507 20,090 2,180 2,733 1,647 9 19,023 16,919 21,666 2,700 3,325 2,088 10 20,483 18,307 23,209 3,247 3,940 2,558 Źródło: opracowanie własne.
O dczytane w artości są następujące:
C1 = 7-7:0.975 = 1,690. c2 = X 7:0,025 = 16,01 3. Po podstaw ieniu d o w zoru (7.35) otrzymujem y:
[8-54123,44 , 8-54123.441 . . . . . , , . . - , .
J.---— < er < --- :— h a po wykonaniu obliczeń przedział ufności ma
1 16,013 1,690 J postać:
{27039,75 < a 2 < 160128.50}.
Jest to je d e n z losowych przedziałów , k tó re z praw dopodobieństw em 0,95 pokry wają w ariancję płac zasadniczych pracow ników firmy M.
Jeśli interesuje nas przedziałow e oszacow anie odchylenia standardow ego plac zasadniczych pracow ników firmy M, to wystarczy obliczyć pierw iastki kwadratowe z końców przedziału dla wariancji. O trzym ujem y w rezultacie:
{^27039,75 <ct<V1 60128,
5o),
{164,44 < o < 400,16}.Jest to jed en z losowych przedziałów , k tó re z praw dopodobieństw em 0,95 pokry w ają odchylenie standardow e plac zasadniczych pracowników firmy M.
P rzy k ład 7.14
W celu uspraw nienia obsługi klientów pew nego banku przeprow adzono analizę czasu ich oczekiwania na obsługę przy okienku kasowym. C echa ta jest zm ienną lo sową, której rozkład jest nieznany. Należy oszacować odchylenie standardow e czasu oczekiwania. W tym celu w ybrano w sposób losowy p ró b ę o liczebności n = 100 klientów. R ozw ażana tutaj sytuacja różni się od poprzedniej, a mianowicie: nie jest znany rozkład i dysponujem y dużą p ró b ą statystyczną.
Przedziałowe oszacowanie odchylenia standardow ego otrzym ujem y jako:
S < a < -1 + - j 2 - n 1 -S • J l - n = 1 - a . ( 7 .3 7 )
Po wykonaniu odpow iednich przekształceń otrzym ujem y rów now ażną po stać wzoru (7.37):
P \ S - u a • < a < S + ua ■ — S> = I - a . V 2 -n \ 2 - n j
(7 .3 8 )
Dla wybranej losowo próby otrzym ano rozkład liczebności w edług czasu oczeki w ania na obsługę podany w tablicy 7.7.
Tablica 7.7. Rozkład liczebności klientów według czasu oczekiwania na obsługę w banku
fi x; L x; f ( X i ’ - x y 4-8 15 6 90 693,6 8-12 25 10 250 196,0 12-16 40 14 560 57,6 16-20 15 18 270 405,6 20-24 5 22 110 423,2 100 X 1280 1776
Źródło: dane umowne.
D la tej próby obliczono:
1280
• średni czas oczekiwania na obsługę: 3r = -y—- = 12.80 [min], 177^
• w ariancję czasu oczekiwania na obsługę: v2 = --- = 17 76 fmin 21
100
S konstruow ano przedział ufności dla odchylenia standardow ego czasu oczekiwa nia na obsługę, przyjm ując współczynnik ufności 1 - a = 0,95. M a on postać:
4.21 _ _ 4,2 J 1,96 <C T<, 1.96 [’ 1 + •- — — 1 —
V 2- 100 V 2 - 10 0 .
i ostatecznie {3,69 < a < 4,89}.
Jest to jed en z losowych przedziałów , k tóre z praw dopodobieństw em 0,95 pokry w ają odchylenie standardow e czasu oczekiw ania na obsługę w banku.
Jeśli konieczne jest oszacow anie wariancji rozpatryw anej zm iennej, to wystarczy podnieść do kw adratu końce przedziału ufności dla odchylenia standardowego. Otrzy mujemy:
{13,67 < a 2 < 23,89}.
Jest to je d e n z losowych przedziałów , k tóre z praw dopodobieństw em 0,95 pokry w ają w ariancję czasu oczekiwania na obsługę w banku.
Po w prow adzeniu zarysu zasad estymacji w artości wybranych param etrów w p o pulacji generalnej, zajm iem y się teraz drugą m eto d ą wnioskowania statystycznego, k tó rą jest weryfikacja hipotez.