Estymacja przedziałowa - Estymacja jako metoda indukcyjnego wnioskowania statystycznego

7.2. Estymacja jako metoda indukcyjnego wnioskowania statystycznego

7.2.3. Estymacja przedziałowa

Estym acja przedziałow a polega na skonstruow aniu przedziału nazywanego p rze działem ufności, który z zadanym z góry praw dopodobieństw em bliskim jedności rów nym 1 - a pokrywa w artość p aram etru Q. Praw dopodobieństw o to nazywamy w sp ó ł czynnikiem (poziom em ) ufności. Przedział ufności jest przedziałem losowym. Musimy się liczyć z istnieniem przedziałów , k tóre nie pokryw ają w artości param etru . Przyj m ując współczynnik ufności, określam y, jak a będzie częstość przedziałów pokryw a jących w artość p aram etru w długiej serii niezależnych prób. Z e wszystkich przedzia łów wybieramy ten, który przy danym 1 - a m a możliwie najm niejszą długość. Przedział ufności konstruujem y na podstaw ie rozkładu odpow iedniej statystyki z próby (esty m atora). M ogą to być rozkłady dokładne lub graniczne (por. pun kt 7.1).

Zasady estymacji przedziałow ej przedstaw im y na przykładach 7.8 do 7.14.

P rz y k ła d 7.8

Podjęto badania m ające na celu określenie średnich wydatków na opiekę zdro w otną w gospodarstw ach domowych em erytów i rencistów. W iadom o, że wydatki te są zm ienną losową o rozkładzie norm alnym , którego w artość średnia fj. jest nieznana. Z nane jest natom iast odchylenie standardow e a = 20 [zł]. Jak o estym atora użyjemy średniej arytm etycznej danej w zorem (7.3), który w tym miejscu podajem y dla przy pom nienia:

E stym ator ten m a rozkład N([x:—j= ) . Aby skonstruow ać przedział ufności, przyj-mujemy współczynnik ufności 1 - a = 0,95. O znacza to, że w serii złożonej ze 100 niezależnych prób uzyskamy 95 przedziałów pokrywających średnie wydatki na op ie kę zdrow otną w populacji generalnej w gospodarstw ach dom owych em erytów i re n cistów. Poszukujem y granic przedziału:

Po prostych przekształceniach otrzymujemy:

p \ x - u a - ^ = < [ Ł < X + ua - ^ = l - a . (7 .2 2 )

l v « V»J

W artość u a odczytujemy z tablic rozkładu norm alnego dla zadanego współczyn nika ufności 1 - a (por. tabl. 7.1), w taki sposób, aby P ( \ U \ < u a) = 1 - a .

D la przedziałow ego oszacow ania średnich wydatków na ochronę zdrowia wylo sow ano 16 gospodarstw dom owych em erytów i rencistów. Z aobserw ow ano następu jące wydatki (x, w zł):

100 180 300 500 120 200 380 600 160 200 400 650 180 240 430 320

Po wykonaniu obliczeń dla tej zbiorowości otrzym ano średnie wydatki równe: _ 4960 „ , nr „

x = ---= 310 [ził.

W artości u aodczytujemy z tablic dystrybuanty rozkładu norm alnego, której frag m ent p o d an o w tablicy 7.1.

Tablica 7.1. Fragment dystrybuanty rozkładu normalnego

Ua -0,01 -0,03 -0,04 -0,05 -0,06 -1,9 0,0281 0,0268 0,0262 0,0256 0,0250 -1,6 0,0537 0,0516 0,0505 0,0495 0,0485 «„ ^0,01 ^0,03 ^0,04 ^0,05 ^0,06 1,6 0,9463 0,9484 0,9406 0,9505 0,9515 1,9 0,9719 0,9732 0,9686 0,9744 0,9750

Źródło: opracowanie własne.

Po podstaw ieniu odpow iednich w artości do wzoru (7.21) mamy:

3 1 0 -1 ,9 6 --j= = < |x < 3 1 0 + l, 9 6 -- j= = j = {310-1,96-5 < ^ < 3 1 0 + 1,96-5}

{310 - 9,8 < (a < 310 + 9,8}.

Jest to jed en z losowych przedziałów, które z praw dopodobieństw em 0,95 pokry wają średnie wydatki na opiekę zdrow otną w gospodarstw ach domowych em erytów i rencistów.

P rz y k ła d 7.9

W celu pod jęcia decyzji w zakresie z a rzą d zan ia p erso n elem p rz ep ro w a d zo no analizę fluktuacji zatrudnienia w firm ie G. Z wykazu pracowników wylosowano w sposób niezależny 26 osób i zebrano d an e dotyczące stażu pracy. C echa ta jest zm ienną losową o rozkładzie norm alnym , k tórego p aram etry są nieznane. Należy oszacować średni staż pracy wszystkich zatrudnionych w firm ie G.

W artość odchylenia standardow ego w populacji generalnej jest nieznana i d la te go musimy w prowadzić jego punktow e oszacow anie uzyskane w edług wzorów (7.18) lub (7.19). W przypadku estymacji przedziałow ej nie m a znaczenia, czy wybierzemy estym ator obciążony, czy nieobciążony. W obydwu przypadkach otrzym am y id en tyczne wyniki.

W celu skonstruow ania przedziału ufności m usimy wykorzystać funkcję /-S tu denta zdefiniow aną w zorem (7.15). Poszukujem y granic przedziału ufności danego odpowiednio:

• dla estym atora obciążonego:

■fn- 1

W rezultacie odpow iednich przekształceń otrzym ujem y następujące przedziały ufności:

(7 .2 3 )

• dla estym atora nieobciążonego:

(7 -2 4 )

P \ X - t a ~ < \ i < X + ta - ^ \ = l - a .

V/7

(7 .2 5 )

W arto ść t odczytujem y z tablic ro zkładu S tu d e n ta dla n - 1 stopni swobody i współczynnika ufności 1 - a w taki sposób, aby P( | T | < fa) = 1 - a . Tablice rozkła du S tu d en ta są tak skonstruow ane, że w artość statystyki ta odczytujemy dla poziomu. W ybrane w artości statystyki t - S tudenta p o d an o w tablicy 7.2.

Tablica 7.2. Fragment tablicy rozkładu Studenta

n - 1 a 0,01 0,05 0,09 0,1 5 4,032 2,571 2,098 2,015 8 3,355 2,306 1,928 1,860 9 3,250 2,262 1,899 1,833 10 3,169 2,228 1,877 1,812 15 2,947 2,131 1,812 1,753 20 2,845 2,086 1,782 1,725 25 2,787 2,060 1,764 1,708 30 2,750 2,042 1,752 1,697 Źródło: opracowanie własne.

D o oszacow ania średniego stażu pracy zeb ran o dan e dotyczące wybranych do próby 26 pracow ników (x, staż pracy w latach):

1 7 14 18 28 2 7 14 20 30 3 7 15 22 33 5 10 17 25 35 5 12 18 27 35 25 Po w ykonaniu obliczeń otrzym ano:

435

• średni staż pracy równy: x = --- = 17,4 [lata], 26

282$ 76

• w ariancja stażu pracy jest równa: s 2 --- -— = 113,1504 [lata2], 26

• odchylenie standardow e równe: 5 = -^/l 13.1504 = 10,64[lata].

Przyjm ujem y w spółczynnik ufności 1 - a = 0,9, którem u przy 25 stopniach swo body odpow iada w artość ta = 1,708 (por. tab. 7.2). Podstaw iam y do wzoru (7.25) i otrzym ujem y:

3 59 3 59 18 -1.708 • _ ! = . < ja < 18 +1.708 '

V25 V25 r

Jest to jed en z losowych przedziałów, k tóre z praw dopodobieństw em 0,90 pokry wają średnie zatrudnienie w firm ie G. W tym przypadku wielkościam i losowymi są zarówno końce przedziału, jak i jego długość wynosząca S ■ ta.

P rz y k ła d 7.10

W budżecie czasu studentów powinien się znaleźć czas poświęcony n a lekturę literatury pięknej. P rzeprow adzając b ad an ia m eto d ą reprezentacyjną, zeb rano dane dotyczące czytelnictwa w śród wybranych losowo 100 studentów pewnej uczelni. Czas poświęcony na lekturę jest zm ienną losową o nieznanym rozkładzie. Należy oszaco wać m etod ą przedziałow ą średni czas poświęcony na lekturę literatu ry pięknej przez wszystkich studentów uczelni, przyjm ując w spółczynnik ufności 1 - a = 0,90.

Gdy postać rozkładu zm iennej w populacji generalnej nie jest znana, a dysponu jemy dużą próbą statystyczną, to dla skonstruow ania przedziału ufności wykorzysta my statystykę dan ą w zorem (7.16):

U =^{X - V L}

Poszukujem y zatem końców przedziału:

X - \ i

■Jn

Po prostych przekształceniach otrzym ujem y:

= l - a . (7 .2 6 )

P \ X - u a - —r= < \ x < X + ua -

-4=j-

= 1 - a. V « J

(7 .2 7 )

Tablica 7.3. Rozkład liczebności studentów pewnej uczelni według czasu poświęcanego tygodniowo na czytanie literatury pięknej

Xi f, */, fi ■ x- ^{f i ( x ' - x y} 0 -2 17 1 17 242,90 2-4 24 3 72 76,04 4-6 27 5 135 1,31 6-8 17 7 119 83,78 8 -10 15 9 135 261,U Suma 100 X ₄₇₈ _671,16

D la wylosowanej próby skonstruow ano szereg rozdzielczy podany w tablicy 7.3. Po w ykonaniu odpow iednich obliczeń otrzym ano:

• średni tygodniowy czas czytania literatury pięknej:

• w ariancję tygodniowego czasu czytania literatury pięknej:

• odchylenie standardow e tygodniowego czasu czytania: s = = 2,59 [godz.].

O dczytana z tablic w artość ua = 1,65. P odstaw iając do wzoru, otrzymujemy:

O stateczn a postać przedziału ufności jest następująca: {4,25 < n < 5,21}.

Jest to jed en z losowych przedziałów , k tóre z praw dopodobieństw em 0,90 pokry wają średni czas tygodniowo poświęcany przez studentów pewnej uczelni na czytanie literatu ry pięknej.

Zastanow im y się teraz, jak liczna pow inna być próba, aby z zadanym z góry współ czynnikiem ufności zapew nić dokładność oszacow ania wartości przeciętnej z błędem nie przekraczającym ustalonej wielkości d. Jak o maksym alny dopuszczalny błąd (d o kładność oszacow ania) przyjm iemy połow ę długości przedziału ufności.

P rz y k ła d 7.11

D la sytuacji rozważanej w przykładzie 7.7 ustalim y liczebność próby pozwalają cą oszacow ać śred nie wydatki na opiekę zdrow otną w gospodarstw ach domowych em erytów i rencistów z błędem nie większym niż 4,50 zł. Połow a długości przedziału ufności przyjm ow ana jak o błąd oszacow ania jest d an a wzorem:

Poniew aż poszukujem y liczebności próby n, to przekształcam y odpow iednio wzór 52 = 6 J 1 [godz.2]. [godz2.],

{4,78 - 0,43 < (o. < 4,78 + 0,43}.

(7 .2 8 )

(7.28).

Podstawiając będące do dyspozycji dane, otrzymujemy:

„ = 4 0 0 4 9 £ 7jŁ

25.25

Aby zapewnić zadaną dokładność oszacowania, należy dysponować próbą o liczeb ności n = 76 obserwacji. W ielkość próby ustalamy, zaokrąglając do najm niejszej liczby całkowitej przekraczającej uzyskany wynik. Należałoby więc dolosować 76 - 16 = 50 gospodarstw domowych.

W rozważanym przykładzie znana była a priori w artość odchylenia standardow ego w populacji generalnej. W praktyce trudno jest spotkać taki przypadek. Najczęściej wartość a jest nieznana. Postępujem y wówczas tak, jak w podanym niżej przykładzie.

P rzy k ład 7.12

Przygotowywane są reprezentacyjne b adania czasu pozostaw ania bezrobotnym przez absolwentów wyższych uczelni. Jednym z szacowanych param etró w jest średni czas pozostaw ania bezrobotnym . Należy ustalić wielkość próby, k tó ra przy w spół czynniku ufności 1 - a = 0,99, da oszacow anie tego p aram etru z b łęd em m aksym al nym d = 0,5 [miesiąca]. Zakładam y, że czas przebyw ania absolw entów w stanie bez robocia jest zm ienną losową o rozkładzie norm alnym , którego p aram etry są nieznane. Najpierw znajdziem y w zór podający za daną dokładność oszacow ania, czyli ustalimy połowę długości przedziału ufności danego w zorem (7.25). Jest on a równa:

Po przekształceniu otrzym ujemy:

t 2 - s 2 n =

-Dla ustalenia wielkości n m usim y znać w artość estym atora Ś 2. W tym celu prze prowadzam y badanie pilotażowe. Losujem y m ałą prób ę statystyczną o liczebności

n {| < 30. Obliczam y w artość estym atora S 2 (wzór (7.22)). U stalam y niezbędną w iel

kość próby n według w zoru (7.31).

Jeśli okaże się, że n > n0, to musimy dolosow ać brakujące n - n 0 elem entów . Jeśli natom iast n < n (), to dalszą analizę przeprow adzam y na podstaw ie próby pilotażo wej, ponieważ jej liczebność zapew nia większą od założonej dokładność oszacow a nia.

D o w stępnego oszacow ania w ariancji czasu pozostaw ania bezrobotnych spośród absolw entów wyższej uczelni wylosowano 9 osób. O trzym ano następujące realizacje bad an ej zm iennej (x, w m iesiącach).

Tablica 7.4. Czas pozostawania bezrobotnym po ukończeniu uczelni wyższej

5 6 6 7 9 12 13 14 18

( * , - * ) 2 ¹⁶ ²⁵ ¹⁶ ⁹ ¹ ⁴ ⁹ ¹⁶ ⁶⁴ Źródło: dane umowne.

N a podstaw ie tych danych ustalamy:

s 2 = = 20 [miesięcy2 ].

D la n - 1 = 8 stopni swobody i dla 1 - a = 0,99, to znaczy dla cx = 0,01 z tablic rozkładu t - S tudenta (por. tabl. 7.2) odczytujem y ta = 3,355. Podstaw iając do wzoru, mamy:

t ^ s2

n = —---- ^{(3,335)2 -20} ^66,7

d 2 _(0,25)2 0,25 ^{= 889,778.}

Z godnie z zasadą zaokrąglania do najm niejszej liczby całkowitej przekraczającej uzyskany wynik, stwierdzam y, że dla zapew nienia oszacowania, z zadaną dokładno ścią średniego czasu, jaki absolwenci uczelni wyższych pozostają bezrobotnym i nale ży dysponow ać próbą licząca n = 890 [osoby]. W obec tego należy dolosować n - n {)- = 790 - 9 = 781 [osoby].

Z ajm iem y się teraz konstruow aniem przedziału ufności dla wariancji i odchyle nia standardow ego.

P rz y k ła d 7.13

Przeprow adzam y analizę zróżnicow ania plac zasadniczych pracowników firmy M. Z akładam y, że cecha ta jest zm ienną losową o rozkładzie norm alnym , którego p aram etry są nieznane. Jak o m iarę zróżnicow ania przyjęto w ariancję. D la jej oszaco w ania z listy płac wylosowano 8 pracowników.

W rozważanym przypadku wiemy, że cecha w populacji generalnej m a rozkład norm alny o nieznanych p aram etrach . Z populacji tej wylosowano m ałą próbę staty styczną. D o skonstruow ania przedziału ufności użyjemy więc statystyki z próby zdefi niow anej jako:

%~=-^{n - S 2}

C T

-(7.32)

P \ c x <n - S 2

a po przekształceniach otrzym ujem y przedział ufności: n l n - S 2 o n - S 2 ( P { --- < ct- < ---} = 1 - a , C~f Ci (7 .3 3 ) (7 .3 4 ) gdzie:

S 2 jest estym atorem wariancji w populacji generalnej zdefiniowany w zorem (7.19),

c, oraz c2 oznaczają w artości zm iennej losowej odczytane z tablic rozkładu %2 dla

n - 1 stopni swobody i poziom u istotności 1 - a odpow iednio jako:

C1= X- _m-1;1--CC, c 2 = r , a -_A₇_—₁_,—

Jeśli posłużymy się estym atorem nieobciążonym , który jest zdefiniow ane wzo rem (7.20), to przedział ufności przyjm ie postać:

( n - l - S * , (/? -1 ) ■

--- < CT“ < - --- --- = 1-GC. _{(7 .3 5 )}

W sposób najbardziej ogólny przedział ufności dla w ariancji przedstaw iam y jako:

■ <ct“ < —--- )- = l - a . (7 .3 6 ) Z ( x , - x ) 2

/=!______

Na podstaw ie wylosowanej próby należy skonstruow ać przedział ufności, przyj mując współczynnik ufności 1 - a = 0,95. Z eb ran e w tym celu inform acje po d an o w tablicy 7.5.

Tablica 7.5. Płace zasadnicze pracowników firmy M

1000 1200 1280 1300 1400 1570 1700 1700

( x , - x ) 2 155039,1 37539,1 12939,1 8789,1 39,1 31064,1 93789,1 93789,1 Źródło: dane umowne.

Po w ykonaniu odpow iednich obliczeń otrzym ano:

• średnią płacę zasadniczą: x = * * ^ = 1393.75 [zł],

432987 5

T eraz należy znaleźć wartości c, o ra z c 2. W tym celu ustalamy: a = 0,05; — = 0,025 ;

n - 1 = 7. ’ 2

W tablicy 7.6 pod an o fragm ent rozkładu y \

Tablica 7.6. Fragment tablicy rozkładu ■/} Stopnie swobody n - 1 Poziom istotności a 0,025 0,05 0,01 0,975 0,95 0,99 5 12,832 11,070 15,086 0,831 1,145 0,554 6 14,449 12,592 16,812 1,237 1,635 0,872 7 16,013 14,067 18,475 1,690 2,167 1,239 8 17,535 15,507 20,090 2,180 2,733 1,647 9 19,023 16,919 21,666 2,700 3,325 2,088 10 20,483 18,307 23,209 3,247 3,940 2,558 Źródło: opracowanie własne.

O dczytane w artości są następujące:

C1 = 7-7:0.975 = 1,690. c2 = X 7:0,025 = 16,01 3. Po podstaw ieniu d o w zoru (7.35) otrzymujem y:

[8-54123,44 , 8-54123.441 . . . . . , , . . - , .

J.---— < er < --- :— h a po wykonaniu obliczeń przedział ufności ma

1 16,013 1,690 J postać:

{27039,75 < a 2 < 160128.50}.

Jest to je d e n z losowych przedziałów , k tó re z praw dopodobieństw em 0,95 pokry wają w ariancję płac zasadniczych pracow ników firmy M.

Jeśli interesuje nas przedziałow e oszacow anie odchylenia standardow ego plac zasadniczych pracow ników firmy M, to wystarczy obliczyć pierw iastki kwadratowe z końców przedziału dla wariancji. O trzym ujem y w rezultacie:

{^27039,75 <ct<V1 60128,

5o),

{164,44 < o < 400,16}.

Jest to jed en z losowych przedziałów , k tó re z praw dopodobieństw em 0,95 pokry w ają odchylenie standardow e plac zasadniczych pracowników firmy M.

P rzy k ład 7.14

W celu uspraw nienia obsługi klientów pew nego banku przeprow adzono analizę czasu ich oczekiwania na obsługę przy okienku kasowym. C echa ta jest zm ienną lo sową, której rozkład jest nieznany. Należy oszacować odchylenie standardow e czasu oczekiwania. W tym celu w ybrano w sposób losowy p ró b ę o liczebności n = 100 klientów. R ozw ażana tutaj sytuacja różni się od poprzedniej, a mianowicie: nie jest znany rozkład i dysponujem y dużą p ró b ą statystyczną.

Przedziałowe oszacowanie odchylenia standardow ego otrzym ujem y jako:

S < a < -1 + - j 2 - n 1 -S • J l - n = 1 - a . ( 7 .3 7 )

Po wykonaniu odpow iednich przekształceń otrzym ujem y rów now ażną po stać wzoru (7.37):

P \ S - u a • < a < S + ua ■ — S> = I - a . V 2 -n \ 2 - n j

(7 .3 8 )

Dla wybranej losowo próby otrzym ano rozkład liczebności w edług czasu oczeki w ania na obsługę podany w tablicy 7.7.

Tablica 7.7. Rozkład liczebności klientów według czasu oczekiwania na obsługę w banku

fi x; L x; f ( X i ’ - x y 4-8 15 6 90 693,6 8-12 25 10 250 196,0 12-16 40 14 560 57,6 16-20 15 18 270 405,6 20-24 5 22 110 423,2 100 X 1280 1776

Źródło: dane umowne.

D la tej próby obliczono:

1280

• średni czas oczekiwania na obsługę: 3r = -y—- = 12.80 [min], 177^

• w ariancję czasu oczekiwania na obsługę: v2 = --- = 17 76 fmin 21

100

S konstruow ano przedział ufności dla odchylenia standardow ego czasu oczekiwa nia na obsługę, przyjm ując współczynnik ufności 1 - a = 0,95. M a on postać:

4.21 _ _ 4,2 J 1,96 <C T<, 1.96 [’ 1 + •- — — 1 —

V 2- 100 V 2 - 10 0 .

i ostatecznie {3,69 < a < 4,89}.

Jest to jed en z losowych przedziałów , k tóre z praw dopodobieństw em 0,95 pokry w ają odchylenie standardow e czasu oczekiw ania na obsługę w banku.

Jeśli konieczne jest oszacow anie wariancji rozpatryw anej zm iennej, to wystarczy podnieść do kw adratu końce przedziału ufności dla odchylenia standardowego. Otrzy mujemy:

{13,67 < a 2 < 23,89}.

Jest to je d e n z losowych przedziałów , k tóre z praw dopodobieństw em 0,95 pokry w ają w ariancję czasu oczekiwania na obsługę w banku.

Po w prow adzeniu zarysu zasad estymacji w artości wybranych param etrów w p o pulacji generalnej, zajm iem y się teraz drugą m eto d ą wnioskowania statystycznego, k tó rą jest weryfikacja hipotez.

W dokumencie Podstawy statystyki (Stron 175-186)