Analiza danych jakościowych Lista 1A
1. Pokaż, że prawdopodobieństwo, że w ciągu niezależnych prób o
prawdopodobieństwie sukcesu p, m-ty ( m1) sukces będzie poprzedzony k porażkami jest opisane rozkładem ujemnym dwumianowym:
k
m p
m p m
k
1
1
1 dla k=0,1,2,…
2. Sprawdź, że rozkład geometryczny, opisany w zadaniu 1.2.1.c) jest szczególnym przypadkiem tego rozkładu.
3. Sprawdź, że rozkład ujemny dwumianowy da się opisać równaniem Orda. Oblicz parametry a i b w tym równaniu.
4. Pokaż, że estymator największej wiarygodności parametru p, przy ustalonym m, gdy dane z próby można zapisać w tabeli:
k 0 1 … I
Liczba obserwacji n
1
n
2
… n
I
ma postać
m k p m
ˆ , gdzie
I
j
nj
n j k
0
1 jest średnią liczbą porażek poprzedzających m-ty sukces.
5. Zaproponuj, bazując na postaci parametrów a i b w równaniu Orda dla tego rozkładu, iteracyjny sposób wyliczenia estymatorów parametrów mˆ i pˆ :
ˆ ? ˆ , ˆ ˆ
,
ˆ1 1 1
i
i i
i m
m k p m m
6. Wylicz stałą c w rozkładzie zmiennej losowej X o wartościach 0,1,2,… z
prawdopodobieństwami pk c(k1)k. Sprawdź, że spełnia równanie Orda. Oblicz parametry a i b w tym równaniu.
Wskazówka: zauważ, że (k1)k k1
7. Pokaż, że estymator największej wiarygodności parametru , gdy dane z próby można zapisać w tabeli:
k 0 1 … I
Liczba obserwacji n
1
n
2
… n
I
ma postać
ˆ 2
k
k , gdzie
I
j
nj
n j k
0
1 jest średnią wartością zmiennej X w próbie.
8. Oszacowanie parametrów w równaniu Orda jest bardzo nieodporne na małe wartości nk. Można ulepszyć te estymatory stosując ważoną metodę najmniejszych kwadratów.
Ważone estymatory najmniejszych kwadratów dla prostej regresji y = a + b x z wagami wi, takimi, że
n
i i
i w
w
1
1 ,
0 uzyskane na podstawie obserwacji x ,i yi
(i=1,2,…, n) minimalizują wyrażenie 2
1
n
i
i i
i a bx y
w . Pokaż, że te estymatory mają postać:
2 1 2
1 1 2 2
1 2
1 2 2
1 , ˆ
ˆ
b
a , gdzie
n
i
i i i n
i i i n
i i n
i i
ix wx wy wx y
w i
1 2 1
1 1
2 2
1
1 , , ,
W równaniu Orda lepsze estymatory regresji vk = a + b k otrzymamy stosując ważone estymatory najmniejszych kwadratów z wagami
1 0
1 1
k k k
k n
n n
w c i stała c jest
taka, że
I
k
wk 1
1.
9. Znajdź estymatory współczynników równania Orda dla danych Bortkiewicza i Listy Federalistów, stosując estymatory regresji ważonej. Dla danych Listy Federalistów wybierz adekwatny model i sprawdź swój wybór odpowiednim testem zgodności.
10. Wybierz adekwatny model i sprawdź swój wybór odpowiednim testem zgodności dla danych o liczbie X egzemplarzy jednego tytułu w bibliotece Uniwersytetu w Pretorii:
X 1 2 3 4 5 6 7
Liczba tytułów 9860 1941 569 262 144 120 57
X 8 9 10 11 12 13
Liczba tytułów 36 21 19 10 10 6