Model logitowy
W pliku S.C. zebrano m.in. dane dotyczące dychotomicznej odpowiedzi Y(wykrycie lub nie pewnej substancji) przy różnych rozcieńczeniach pobranej krwi. Rozważmy dla przykładu rozcieńczenie 5%
i dychotomiczną zmienną SC5.
Wykorzystując model logitowy zbadać, czy grupy diagnostyczne (AIU, CIU,AIA,ATA i zdrowi) różnią się między sobą frakcją pozytywnych odpowiedzi SC5
Oznaczmy przez Yi dychotomiczną zmienną losową o rozkładzie Bernouliego z funkcją gęstości
(względem miary liczącej) i i i yi ppii
i y
y i y i i
i p p p p e
y
f( , ) (1 )1 (1 ) log1 , yi=0,1. Naturalny
parametr Q(p)log1pp nazywamy logitem. Jest to logarytm szansy (ang. odds) 1pp odpowiedzi Y=1.
Uogólniony model liniowy GLZ, używający powiązania logitowego pomiędzy wartością oczekiwaną
dychotomicznej odpowiedzi a liniowym predyktorem j
j ij
i x
nazywamy modelem logitowym
j
j p ij
p x
i
i
log1 , i=1,...,n.
W charakterze liniowego predyktora użyjemy funkcji
i i
i i
i
i()0 1I{AIU}() 2I{CIU}() 3I{ATA}() 4I{AIA}() (1 2 3 4)I{zdrowy}()
opartej na zmiennej nominalnej Diagnoza o 5 poziomach (AIU,CIU,ATA,AIA, zdrowy). Zastosowano parametryzacje oszczędną (bez sigma ograniczeń) z grupą zdrowych jako grupą kontrolną.
Wyjaśnienie - jeżeli i- ta osoba jest zdrowa to predyktor przyjmuje wartość 0
AIA jest osoba ta -
ATA jest osoba ta -
CIU jest osoba ta -
AIU jest osoba ta -
zdrowa jest osoba ta
i i i i
- i
, ,
, ,
,
4 0
3 0
2 0
1 0
4 3 2 1 0
i
Zależność pomiędzy prawdopodobieństwem p odpowiedzi Y=1 (pozytywny wynik SC) a wartością predyktora
e p e
1
-4 -2 2 4
0.2 0.4 0.6 0.8 1
1
WIEK 2
PŁEĆ 3
DIAGNOZA 4
IGE 5
A_IGE 6
DSC_5 7
QDSC_5 1
2 3 4 5 6 7
49K AIU 532,0Brak 0 1 53K AIU 26,9Obecne1 0 60K AIU 186,0Brak 0 1 22K AIU 46,7Obecne0 1 26M AIU 376,0Brak 0 1 48K AIU 38,1Brak 0 1 32K AIU 124,0Obecne0 1 Model logitowy dla SC5%
Rozkład: DWUMIANOWY F. wiążąca: LOGIT
Stopnie Wald Swobody Stat. p Wyraz wolny 1 34,05451 ,000000
DIAGNOZA 4 15,70172 ,003447
Wniosek. Grupy diagnostyczne różnią się między sobą częstością pozytywnego wyniku SC5%
Tabela liczebności
DSC5%
Grupa Nie Tak Razem
AIU 22 3 25
CIU 12 14 26
ATA 31 6 37
AIA 23 4 27
zdrowy 18 4 22
Ogół grp 106 31 137
Rozkład: DWUMIANOWY F. wiążąca: LOGIT
Poziom Standard Wald
Efekt Kolumna Ocena Błąd Stat. p
W.wol. 1 -1,34676 ,230782 34,05451 ,000000
DIAGNOZA AIU 2 -,64567 ,529654 1,48608 ,222826
DIAGNOZA CIU 3 1,50091 ,382253 15,41721 ,000086
DIAGNOZA ATA 4 -,29547 ,415470 ,50577 ,476977
DIAGNOZA AIA 5 -,40244 ,478902 ,70618 ,400715
Skala 1,00000 0,000000
Wyestymowany modeldla DSC5%
Średnie i 95% CI
AIU CIU ATA AIA zdrowy
DIAGNOZA 0,0
0,1 0,2 0,3 0,4 0,5 0,6 0,7
SC 5%
i i
i i
i i
) ( 15733
, 0 ) ( 40244 , 0
) ( 29547
, 0 ) ( 50091 , 1 ) ( 64567 , 0 34676 , 1
} { }
{
} { }
{ }
{
zdrowy AIA
ATA CIU
AIU
I I
I I
I
Wnioski . Widać, że w grupie CIU proporcja pozytywnych wyników SC5% jest wyższa niż w pozostałych grupach, które nie różnią się istotnie między sobą. Iloraz szans pozytywnego wyniku SC5% w grupie CIU w odniesieniu do zdrowych jest OR=5,25 tzn. szansa pozytywnego wyniku SC5% jest 5-krotnie większa w grupie CIU niż w kontrolnej grupie zdrowych .
Analiza SAS
The SAS System 14:37 Friday, February 1, 2002 11 The LOGISTIC Procedure Model Information
Data Set WORK.SC5 Response Variable (Events) r
Response Variable (Trials) n Number of Observations 5 Link Function Logit
Optimization Technique Fisher's scoring
Response Profile
Ordered Binary Total Value Outcome Frequency 1 Event 31 2 Nonevent 106
Class Level Information Design Variables Class Value 1 2 3 4 Group 1 1 0 0 0 2 0 1 0 0 3 0 0 1 0 4 0 0 0 1 5 -1 -1 -1 -1
Model Convergence Status
Convergence criterion (GCONV=1E-8) satisfied.
Model Fit Statistics
Intercept Intercept and Criterion Only Covariates AIC 148.518 140.550 SC 151.438 155.150 -2 Log L 146.518 130.550
The SAS System 14:37 Friday, February 1, 2002 12 The LOGISTIC Procedure
Testing Global Null Hypothesis: BETA=0
Test Chi-Square DF Pr > ChiSq Likelihood Ratio 15.9687 4 0.0031 Score 18.1447 4 0.0012 Wald 15.7015 4 0.0034
Type III Analysis of Effects Wald
Effect DF Chi-Square Pr > ChiSq Group 4 15.7015 0.0034
Analysis of Maximum Likelihood Estimates Standard
Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -1.3468 0.2308 34.0545 <.0001 Group 1 1 -0.6456 0.5296 1.4860 0.2228 Group 2 1 1.5009 0.3823 15.4170 <.0001 Group 3 1 -0.2955 0.4155 0.5058 0.4770 Group 4 1 -0.4024 0.4789 0.7062 0.4007
Odds Ratio Estimates
Point 95% Wald Effect Estimate Confidence Limits Group 1 vs 5 0.614 0.121 3.105 Group 2 vs 5 5.250 1.389 19.846 Group 3 vs 5 0.871 0.216 3.504 Group 4 vs 5 0.783 0.172 3.567
Association of Predicted Probabilities and Observed Responses Percent Concordant 60.2 Somers' D 0.382 Percent Discordant 22.0 Gamma 0.464 Percent Tied 17.8 Tau-a 0.135