Elementy wnioskowania statystycznego; Wykład 13; 10.01.07

20  Download (0)

Pełen tekst

(1)

Elementy wnioskowania statystycznego; Wykład 13;

10.01.07

Chcemy zweryfikowa´c hipotez˛e:

„ ´Srednia temperatura zdrowego człowieka jest równa 98,6 stopni w skali Fahrenheita”

w oparciu o zbiór danych NT (zaprezentowany podczas poprzedniego wykładu);

´Srednia próbkowa dla temperatury— dla 130 pomiarów w zbiorze NT:

98,25 stopni w skali Fahrenheita.

Naiwne rozwi ˛azanie: odrzuci´c hipotez˛e zerow ˛a H0 mówi ˛ac ˛a, ˙ze

„prawdziwa” ´srednia jest równa 98,6 w przypadku, gdy moduł ró˙znicy

|¯x − 98,6| jest du˙zy, wi˛ekszy ni˙z pewna warto´s´c graniczna.

Wada tego podej´scia: |¯x − 98,6| zale˙zy od przyj˛etej jednostki pomiaru.

(2)

Modyfikacja naszego podej´scia: odrzuci´c H0, gdy

|¯x − 98,6|

s (1)

lub

|¯x − 98,6|

s/√

n (2)

jest du˙ze (n oznacza liczb˛e obserwacji; dla danych NT n = 130).

Problem: w jaki sposób wyznaczy´c sensownie „warto´s´c graniczn ˛a” dla wyra˙ze´n (1) lub (2)?

Rozwi ˛azanie: mo˙zliwe przy zało˙zeniu, ˙ze obserwacje s ˛a wygenerowane przez pewien mechanizm losowy (model probabilistyczny).

St ˛ad potrzeba prezentacji podstawowych poj˛e´c teorii prawdopodobie´nstwa

(3)

Zmienna losowa-wyniki eksperymentu losowego

Definicja 1 Do´swiadczenie nazywamy losowym, je˙zeli mo˙ze by´c powtarzane w tych samych warunkach, jego wynik nie mo˙ze by´c

przewidziany w sposób pewny oraz zbiór wszystkich mo˙zliwych wyników jest znany i mo˙ze by´c opisany przed przeprowadzeniem do´swiadczenia.

Przykład do´swiadczenia losowego: pomiar wzrostu losowo wybranego, dorosłego m˛e˙zczyzny mieszkaj ˛acego w Polsce.

Nieformaln ˛a definicj˛e zmiennej losowej odpowiadaj ˛acej cesze ilo´sciowej:

Zmienn ˛a losow ˛a bedziemy nazywa´c liczbowy wynik do´swiadczenia losowego.

(4)

Poj˛ecie zmiennej losowej- c.d.

Precyzjne okre´slenie zmiennej losowej wymaga znajomo´sci poj˛e´c teorii prawdopodobie´nstwa.

Zmienne losowe b˛edziemy oznacza´c du˙zymi literami X, Y, Z, a warto´sci tych zmiennych, odpowiednio, literami małymi.

Zapis X = x oznacza zdarzenie, w którym zmienna losowa X przyjmuje warto´s´c x, a zapis a < X < b oznacza zdarzenie, w którym zmienna losowa X przyjmuje warto´s´c nale˙z ˛ac ˛a do przedziału (a, b).

Ka˙zdej zmiennej losowej odpowiada tzw. rozkład prawdopodobie´nstwa.

Jest to funkcja opisuj ˛aca to, w jaki sposób jedno´s´c prawdopodobie´nstwa jest rozdzielona wzgl˛edem ró˙znych warto´sci tej zmiennej, w szczególno´sci

pozwala oblicza´c prawdopodobie´nstwo, ˙ze dana zmienna losowa przyjmuje

(5)

Rzut dwoma kostkami— przykład

Rzucamy dwoma kostkami; suma oczek jest zmienn ˛a losow ˛a;

jest funkcj ˛a okre´slon ˛a na przestrzeni zdarze´n losowych Ω:

(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6) Mamy P ((1, 1)) = P ((1, 2)) = . . . = P ((6, 6)) = 361 .

Suma oczek- odpowiada zmiennej losowej X, funkcji okre´slonej na Ω,

(6)

której rozkład przedstawia tabelka:

k 2 3 4 5 6 7 8 9 10 11 12

P (X = k) 361 362 363 364 365 366 365 364 363 362 361

(7)

Klasy zmiennych losowych

Zmienne losowe

• dyskretne: zbiór ich warto´sci mo˙zna ustawi´c w ci ˛ag; zmienna X — liczba oczek w dwukrotnym rzucie monet ˛a jest zmienn ˛a losow ˛a dyskretn ˛a;

• typu ci ˛agłego: prawdopodobie´nstwo, ˙ze warto´s´c zmiennej losowej nale˙zy do danego przedziału [a, b] jest równe pewnej całce z tzw.

funkcji g˛esto´sci

• zmienne losowe innych typów— np. pewne sumy zmiennych losowych dyskretnych i typu ci ˛agłego

(8)

Zmienne losowe typu ciagłego

Funkcj˛e f nazywamy przedziałami ci ˛agł ˛a na przedziale I, je˙zeli istniej ˛a liczby c1, c2, . . . , ck nale˙z ˛ace do tego przedziału takie, ˙ze:

(i) c1 < . . . < ck oraz:

(ii) f jest ograniczona na I oraz ci ˛agła na przedziałach, których ko´ncami s ˛a c1, c2, . . . , ck.

Definicja 2 Mówimy, ˙ze zmienna losowa X jest typu ci ˛agłego, je´sli istnieje nieujemna funkcja g, Dg = R taka, ˙ze dla ka˙zdych a < b

P (a < X < b) =

Z b a

g(x)dx.

(9)

Rozkłady typu ci ˛ agłego-przykłady

Przykładami zmiennych losowych typu ciagłego s ˛a zmienne losowe o funkcjach g˛esto´sci równych:

• histogramowi probabilistycznemu, rozumianemu jako funkcja,

• funkcja u dana wzorem

u(x) =

1, je´sli 0 ¬ x ¬ 1,

0 je´sli x < 0 lub x > 1.

(10)

Zmienne losowe typu ci ˛ agłego— obliczanie prawdopodobie ´nstw

Dla zmiennej losowej X o rozkładzie typu ci ˛agłego mamy:

P (a < X < b) = P (a ¬ X < b) = P (a < X ¬ b) = P (a ¬ X ¬ b).

Równo´s´c ta wynika z własno´sci całki oznaczonej.

(11)

Rozkład normalny N (µ, σ)

Szczególnie wa˙znym w zastosowaniach jest rozkład normalny.

Definicja 3 Mówimy, ˙ze zmienna losowa X ma rozkład normalny z parametrami µ i σ, gdzie µ ∈ R i σ > 0, je˙zeli g˛esto´s´c jej rozkładu jest okre´slona wzorem:

φµ,σ(x) = 1

√2πσe(x−µ)22σ2 . Skrótowy zapis: X ma rozkład N (µ, σ).

(12)

−4 −2 0 2 4

0.00.10.20.30.4

(13)

Niezale˙zno´s´c zmiennych losowych

Nieformalna definicja

Definicja 4 Niezale˙zne zmienne losowe oznaczaj ˛a realizacje liczbowe niezale˙znych eksperymentów losowych.

´Scisła definicja:

Definicja 5 Zmienne losowe X i Y s ˛a niezale˙zne, je˙zeli dla dowolnych przedziałów [a, b] i [c, d] zachodzi:

P (X ∈ [a, b] ∧ Y ∈ [c, d]) = P (X ∈ [a, b])P (Y ∈ [c, d]).

(14)

Poj˛ecie próby losowej

Definicja 6 n-elementowa losowa próba to ci ˛ag n niezale˙znych zmiennych losowych o jednakowych rozkładach prawdopodobie´nstwa.

Uwaga. Niektórzy autorzy uto˙zsamiaj ˛a prób˛e losow ˛a X1, X2, . . . , Xn z jej realizacj ˛a x1, x2, . . . , xn

(15)

Zastosowanie do problemu weryfikaacji hipotezy dotycz ˛ acej ´sredniej

Zakładamy, ˙ze próba x1, x2, . . . , xn jest realizacj ˛a próby losowej

X1, X2, . . . , Xn pochodz ˛acej z rozkładu normalnego N (µ, σ) dla pewnych nieznanych parametrów µ ∈ R oraz σ > 0.

Parametr µ jest warto´sci ˛a ´sredni ˛a zmiennej losowej o rozkładzie N (µ, σ).

Jeste´smy zainteresowani weryfikacj ˛a hipotezy:

H0 : µ = µ0 przeciwko hipotezie

H1 : µ 6= µ0.

W naszym przykładzie:µ = 98,6 stopni w skali Fahrenheita.

(16)

Statystyka testowa i jej rozkład

Procedur˛e testow ˛a chcemy oprze´c na warto´sciach zmiennej losowej (tzw.

statystyki testowej)

Tn−1 =

X − µ¯ 0 s/ˆ

n =

X − µ¯ 0 sˆ

√n,

gdzie i

X =¯ X1 + . . . + Xn

n i ˆs =

v u u t

1 n − 1

n

X

i=1

(Xi − ¯X)2.

Zwró´cmy uwag˛e na to, ˙ze ¯X i ˆs s ˛a zmiennymi losowymi— s ˛a funkcjami zmiennych losowych X1, . . . , Xn. Zakładamy, ˙ze s ˛a one niezale˙zne oraz ˙ze

(17)

Zagadnienie estymacji parametrów rozkładu N (µ, σ)

X i ˆ¯ s s ˛a optymalnymi estymatorami parametrów µ i σ ze wzgl˛edu na powszechnie przyj˛ete kryteria. Ich realizacje (dla danych warto´sci

liczbowych x1, . . . , xn— realizacji próby X1, . . . , Xn) s ˛a sensownymi oszacowaniami µ i σ.

(18)

Rozkład t-Studenta

−3 −2 −1 0 1 2 3

0.00.10.20.30.4

x

y

Rysunek 2: Wykresy g˛esto´sci rozkładów normalnych: normalnego N (0, 1) (linia ci ˛agła), t-Studenta z dwoma 4 st. swobody (linia „kropkowana”), t-

(19)

Obszar krytyczny testu

Niech t1−α/2,n−1 b˛edzie liczb ˛a wyznaczon ˛a przez warunek P r(Tn−1 < t1−α/2,n−1) = 1 − α/2.

Test dla weryfikacji H0 przeciw H1 okre´slamy:

przyjmij H0 gdy |Tn−1| ¬ t1−α/2,n−1; odrzu´c H0 gdy |Tn−1| > t1−α/2,n−1;

α jest równe prawdopodobie´nstwu, ˙ze H0 zostanie odrzucona w wyniku przeprowadzenia powy˙zszej procedury testowej mimo tego, ˙ze jest ona prawdziwa

α— współczynnik istotno´sci testowania hipotezy H0 przeciw hipotezie H1. W zasadzie α mo˙ze by´c dowoln ˛a liczb ˛a z przedziału (0, 1). Zazwyczaj

przyjmujemy α = 0,05; rzadziej α = 0,01 lub α = 0,001.

(20)

Weryfikacja hipotezy dotycz ˛ acej ´sredniej temperatury zdrowego człowieka— obliczenia

n = 130

Warto´s´c statystyki testowej (przez t oznaczamy realizacj˛e statystyki testowej Tn−1)

t = 98,25 − 98,6 0,733

130 ≈ −5,44.

Mamy:

|t| = 5,44 > t0,975,129 = 1,978524.

A wi˛ec s ˛a podstawy do odrzucenia hipotezy H0 (przy przyj˛etym poziomie istotnosci α = 0,05).

Obraz

Updating...

Cytaty

Powiązane tematy :