Egzamin: Statystyka I, 24 lutego 2016
1. (2 pkt.) Badamy związek preferencji klientów z ich wiekiem. Wylosowano 100 osób i otrzymano wyniki:
Produkt Wiek 18–30 31–50 > 50
A 15 10 5
B 12 8 10
C 13 12 15
(a) Skonstruuj test χ2dla zweryfikowania hipotezy o niezależności.
(b) Korzystając z rozkładu asymptotycznego statystyki testowej podaj wartość krytyczną i wy- nik testu na poziomie istotności α = 0.1.
2. (3 pkt.) Niech X ∼ binomial(n, θ).
(a) Policz błąd średniokwadratowy (MSE) dla ˆθ1= X/n.
(b) Policz MSE dla ˆθ2=
√n
√n+1θˆ1+2√1n+2.
(c) Policz dla jakich θ estymator ˆθ1 ma mniejszy MSE niż ˆθ2.
3. (2 pkt.) Niech X będzie pojedyńczą obserwacją z rozkładu potęgowego o gęstości fθ(x) = θxθ−1I(0 < x < 1),
gdzie θ jest nieznanym parametrem. Testujemy H0: θ = 2 przeciw H1: θ > 2.
(a) Wyznacz test jednostajnie najmocniejszy na poziomie 1 − α = 0.95.
(b) Policz, dla jakich θ moc tego testu jest większa niż 0.9.
4. (3 pkt.) Rozważmy model liniowy y = Xβ + ε, gdzie X jest macierzą n × p, p < n pełnego rzędu oraz ε ∼ N (0, σ2I).
(a) Policz E|| ˆβ||2. (b) Policz ˆβλ= argminβ
||y − Xβ||2+ λ||β||2
dla pewnego λ > 0.
5. (2 pkt.) Zmierzono czas reakcji na sygnał wzrokowy u siedmiu kierowców przed oraz 15 minut po wypiciu stu gram wódki. Rezultaty przed wypiciem były nastepujące: 22, 18, 16, 19, 20, 23, 25, natomiast po wypiciu: 28, 25, 20, 30, 19, 26, 24. Zakładamy, że różnica w czasie reakcji ma rozkład normalny N (µ, σ2) oraz, że wyniki dla różnych osób są niezależne. Oblicz dwustronny przedział ufności dla µ na poziomie 1 − α = 0.95.
6. (3 pkt.) W modelu prostej regresji logistycznej zakłada się, że obserwujemy niezależne zmienne Y1, Y2, . . . , Yn, gdzie Yi∼ Bin(1, pi) oraz log(pi/(1 − pi)) = β0+ β1Xi dla i = 1, . . . , n.
(a) Przypuśćmy, że prawdopodobieństwo bycia blondynem zależy do koloru oczu (niebieski,inny).
Zbuduj model regresji logistycznej odpowiadający tym przypuszczeniom.
(b) Dla losowej próbki osób Y1, Y2, . . . , Yn znajdź dwuwymiarową statystykę dostaczną dla tego modelu.
(c) Wyznacz estymatory największej wiarygodności parametrów na podstawie obserwacji Y1, Y2, . . . , Yn.
1