• Nie Znaleziono Wyników

Analiza danych ankietowych Lista 8

N/A
N/A
Protected

Academic year: 2021

Share "Analiza danych ankietowych Lista 8"

Copied!
4
0
0

Pełen tekst

(1)

Analiza danych ankietowych Lista 8

1. Pokazać, że relacja Y ⊥ Z|X nie implikuje relacji Y ⊥ Z. Dla dowodu wystarczy podać przykład.

Przykład: Tabela 1 przedstawia prawdopodobieństwa dla układu trzech cech:

X − wykształcenie s − ścisłe, h − humanistyczne, Y − płeć k − kobieta, m − mężczyzna Z − zarobki w − wysokie, n − niskie.

Tabela 1:

X Y Z

w n

s k 0.08 0.02 m 0.32 0.08 h k 0.12 0.18 m 0.08 0.12

2. Pokazać, że następujące modele logarytmiczno-liniowe reprezentują poda- ne w Tabeli 2 typy zależności między cechami

Tabela 2:

Symbol Typ zależności πijk

(X, Y, Z) X ⊥ Y ⊥ Z πi++π+j+π++k (XY, Z) (X, Y ) ⊥ Z πij+π++k (XZ, Y Z) X ⊥ Y |Z πi+kπ+jk++k

3. W Tabeli 3 podano ciąg hierarchicznie podporządkowanych modeli.

(a) Wyznaczyć stopnie swobody rozważanych modeli.

Tabela 3:

Oznaczenie Symbol

M0 : (XY Z)

M1 : (XY, Y Z, XZ)

M2 : (XY, Y Z)

M3 : (XY, Z)

M4 : (X, Y, Z)

(2)

(b) A następnie sprawdzić stopnie swobody rozkładu χ2statystyk ilorazu wiarogodności

DF (G2(M1|M0)) = (I − 1)(J − 1)(K − 1), DF (G2(M2|M1)) = (I − 1)(K − 1), DF (G2(M3|M2)) = (J − 1)(K − 1), DF (G2(M4|M3)) = (I − 1)(J − 1).

4. Pokazać, że estymatory największej wiarogodności µ(r)ijk w modelach hie- rarchicznych Mr (patrz Tabela 3) wyrażają się wzorami

Tabela 4:

Oznaczenie Symbol Estymator µijk

M2 (XY, Y Z) µˆ(2)ijk= nij+n n+jk

+j+

M3 (XY, Z) µˆ(3)ijk= nij+nn++k M4 (X, Y, Z) µˆ(4)ijk= ni++n+j+n2 n++k

5. Tabela 5 zawiera uzyskane losowo wielkości sprzedaży czterech produktów w trzech grupach wiekowych w dwóch różnych regionach.

Tabela 5:

produkt

A B C D

20 < wiek < 30 75 28 36 28 region 1 30 < wiek < 40 30 14 17 12 40 < wiek < 50 40 51 87 18 20 < wiek < 30 42 28 22 13 region 2 30 < wiek < 40 21 81 14 14 40 < wiek < 50 18 16 42 55

(a) Zbadać, czy wielkość sprzedaży jest zależna od grup wiekowych i re- gionów.

(b) Zbadać warunkową niezależność sprzedaży i regionów pod warunkiem grup wiekowych.

(c) Zbadać warunkową niezależność sprzedaży i grup wiekowych pod wa- runkiem regionów

(d) Wybrać optymalny model.

Przyjąć poziom istotności α = 0.05.

6. Metoda iteracyjnego oszacowania proporcjonalnego (ang. Iterative Proportional Fitting, skrót IPN)1jest przeznaczona do znajdowania estymatorów ˆµijk.

1Została opracowana przez Deminga i Stephana w 1940

(3)

Algorytm - Rozdz. 8.7.2 z książki Agresti (2002), str. 343-344. Zastosować algorytm IPN dla danych z Tabeli 8.15 (patrz str. 345, Agresti (2002)) i sprawdzić, że wartości µ(t)ij zbiegają do wartości w nawiasach.

7. Napisać algorytm IPN dla modeli a) (X, Y Z) oraz b) (XZ, Y Z).

8. Używając pakietu R, przeprowadzić analizy opisane w Rozdziale 8 książki Agresti (2002) dla danych ankietowych dotyczących używek (A-Alcohol, C-Cigarette, M-Marijuana) z Tabeli 8.3 (patrz str. 323, Agresti (2002)).

(4)

Wyznaczyć warunkowe i brzegowe ilorazy szans (patrz Tabela 8.5, Agresti (2002)), testy zgodności G2 i X2 dla wszystkich modeli logarytmiczno- liniowych (patrz Tabela 8.6, Agresti (2002)). Za pomocą kryterium Aka- ike’a wybrać najlepiej dopasowany model oraz zbadać różnice dewiancji miedzy modelami hierarchicznymi. Wyznaczyć Przedziały ufności Walda dla warunkowego ilorazu szans AC, AM i CM w najlepiej dopasowanym modelu.

Cytaty

Powiązane dokumenty

Zad 3) Zestaw lampek choinkowych składa się z żarówek o napięciu znamionowym 14V i mocy 5W. Z ilu żarówek musi składad się zestaw, aby mógł byd zasilany

Domain and boundary discretization type (nodes, elements + nodes, …) Solution discretization type (nodal values, other degrees of freedom, …) Solution approximation type.

Przy każdym zdarzeniu Tick Timera zmienna nr będzie zwiękaszła swoją wartość o 1 i kolejne zdjęcie zostanie wyświetlone w PictureBox1. Jeśli dojdzie do błędu należy

Wykorzystując formatkę z Zada- nia 10 wyznaczyć przedział ufności dla ilorazu szans powrotu do zdrowia pacjentów, którym podano lek i pacjentów, którzy leku nie otrzymali. W

Napisać program komputerowy do wyznaczania estymatorów parametrów log-liniowego modelu Po- issona używając algorytmu

Ziemia gromadzi wypadkowy ładunek, który wytwarza pole o natężeniu 150 N/C, skierowane do środka planety.. Jaki jest znak i wielkość ładunku zgromadzonego

• Te bazy zawierają różne poufne dane dotyczące wieku, dochodu, wyznania, preferencji seksualnych..... Reguły spod

• Re-analiza meteorologiczna pozwala na ujednolicenie pomiarów za pomocą technik asymilacji danych i.. przeprowadzenie dokładnej