Egzamin: Statystyka I, 6 luty 2016
1. (2 pkt.) Badamy związek preferencji klientów z ich płcią. Wylosowano 50 osób i otrzymano wyniki:
Produkt Płeć K M
A 10 5
B 6 4
C 4 6
D 10 5
(a) Skonstruuj test χ2dla zweryfikowania hipotezy o niezależności.
(b) Korzystając z rozkładu asymptotycznego statystyki testowej podaj wartość krytyczną i wy- nik testu na poziomie istotności α = 0.05.
2. (4 pkt.) Niech X1, ..., Xnbędzie próbą prostą z rozkładu o dystrybuancie Fα(x) = (1+exp(−x))−1/α, dla α > 0.
(a) Znajdź jednowymiarową zupełną statystykę dostateczną dla α (b) Znajdź estymator największej wiarygodności ˆα parametru α.
(c) Policz błąd średniokwadratowy ˆα.
(d) Policz ograniczenie Cramera-Rao dla estymacji α.
Wskazówka: Jeśli fη(x) = exp(ηT (x) − κ(η))h(x), to EηT (X) = ˙κ(η) oraz varηT (X) = ¨κ(η).
3. (2 pkt.) Niech X1, ..., Xn i.i.d N (µ, σ2). Testujemy H0: µ = 0 przeciw H1: µ 6= 0.
(a) Podaj test ilorazu wiarygodności (LRT).
(b) Udowodnij, że LRT jest równoważny testowi t-Studenta.
4. (2 pkt.) Rozważmy model liniowy y = Xβ + ε, gdzie ε ∼ N (0, σ2I).
(a) Policz E||β − ˆβ||2. (b) Policz E||Xβ − X ˆβ||2.
5. (2 pkt.) Mierzono czas reakcji na sygnał wzrokowy u ośmiu kierowców przed oraz 15 minut po wypiciu stu gram wódki. Rezultaty przed wypiciem były nastepujące: 22, 18, 16, 19, 20, 23, 17, 25, natomiast po wypiciu: 28, 25, 20, 30, 19, 26, 28, 24. Czy różnica w czasie reakcji jest istotna na poziomie 1 − α = 0.95 ? Zakładamy, że różnica w czasie reakcji ma rozkład normalny oraz, że wyniki dla różnych osób są niezależne o tym samym rozkładzie.
6. (3 pkt.) W modelu regresji logistycznej zakłada się, że obserwujemy niezależne zmienne Y1, Y2, . . . , Yn gdzie Yi∼ Bin(1, pi) dla i = 1, . . . , n. Przy czym
log
pi 1 − pi
= β1Xi,1+ · · · + βpXi,p.
(a) Przypuśćmy, że prawdopodobieństwo bycia blondynem zależy do koloru oczu (niebieski,zielony, piwny). Zbuduj model regresji logistycznej odpowiadający tym przypuszczeniom.
(b) Dla losowej próbki osób Y1, Y2, . . . , Yn znajdź statystykę dostaczną dla modelu z podpunktu a), o tym samym wymiarze co przestrzeń nieznanych parametrów.
(c) Wyznacz estymatory największej wiarygodności nieznanych parametrów w modelu logistycz- nym z podpunktu a) na podstawie obserwacji Y1, Y2, . . . , Yn.
1