• Nie Znaleziono Wyników

O wykorzystaniu metody ważenia danych do estymacji kowariancji przy brakach odpowiedzi

N/A
N/A
Protected

Academic year: 2021

Share "O wykorzystaniu metody ważenia danych do estymacji kowariancji przy brakach odpowiedzi"

Copied!
13
0
0

Pełen tekst

(1)

FOLIA OECONOMICA 271, 2012

[115]

Wojciech Gamrot*

O WYKORZYSTANIU METODY WA ENIA DANYCH

DO ESTYMACJI KOWARIANCJI PRZY BRAKACH

ODPOWIEDZI

Streszczenie. Metoda wa enia danych w przypadku wyst!pienia braków odpowiedzi opiera

si" na przypisaniu zaobserwowanym warto#ciom badanej cechy odpowiednich wag kompensuj!-cych niekompletno#$ danych w próbie. W niniejszym opracowaniu podj"to prób" zastosowania tej metody do estymacji z%o onego parametru populacji jakim jest kowariancja dwóch cech. Zapropo-nowano estymatory kowariancji wykorzystuj!ce wa enie danych. Ich w%asno#ci zbadano z wyko-rzystaniem symulacji komputerowej.

S!owa kluczowe: Wa enie danych, estymacja, kowariancja, brak odpowiedzi. I. WPROWADZENIE

Niekompletno#$ danych w próbie statystycznej jest problemem z jakim spo-tyka si" organizator ka dego badania statystycznego prowadzonego na du ! skal". Jego wyst!pienie poci!ga za sob! obci! enie oszacowa& parametrów po-pulacji oraz utrat" precyzji estymacji wynikaj!c! ze zmniejszenia liczebno#ci próby. Wiele wysi%ku po#wi"ca si" ograniczeniu tych niepo !danych efektów. Szerokie zastosowanie znajduj! tu metody estymacji wykorzystuj!ce zwi!zki pomi"dzy warto#ciami cech pomocniczych i sk%onno#ci! poszczególnych jedno-stek populacji do uczestnictwa w badaniu statystycznym. Znacz!c! grup" w#ród nich stanowi! tak zwane metody wa enia danych (ang. weighting adjustment methods), polegaj!ce na tworzeniu oszacowa& parametrów populacji b"d!cych kombinacjami liniowymi warto#ci cechy poprzez przypisanie obserwacjom ce-chy zarejestrowanym w niekompletnej próbie odpowiednich wag równowa !-cych zarówno fakt próbkowania populacji, jak te niekompletno#$ obserwacji w niej. Wagi te tworzy si" cz"sto jako odwrotno#ci znanych prawdopodobie&stw inkluzji i szacowanych na podstawie dost"pnej informacji o warto#ciach cech pomocniczych indywidualnych prawdopodobie&stw odpowiedzi. Stosunkowo niewiele uwagi po#wi"cono dotychczas w literaturze przedmiotu mo liwo#ciom wykorzystania tego podej#cia do estymacji bardziej z%o onych parametrów po-pulacji, nie b"d!cych liniowymi kombinacjami obserwacji cechy, takich jak

(2)

wariancja, kowariancja, czy te wspó%czynnik zmienno#ci. W niniejszym opra-cowaniu podj"to prób" wype%nienia tej luki, poprzez konstrukcj" opartych o wa enie danych estymatorów kowariancji oraz przez zbadanie ich w%asno#ci poprzez przeprowadzenie symulacji komputerowej.

II. ESTYMACJA WARTO"CI GLOBALNEJ

Rozwa my sko&czon! populacj" U o rozmiarze N i pewn! cech" X przyjmu-j!c! dla poszczególnych jednostek populacji ustalone warto#ci x1,...,xN. Celem

badania jest estymacja warto#ci globalnej

! " U i i x ) X (

t cechy X. Niech s ozna-cza prób" losowan! z populacji U z wykorzystaniem pewnego planu losowania p(s) charakteryzuj!cego si" prawdopodobie&stwami inkluzji rz"du pierwszego odpowiednio równymi # " $ i s

i p(s) dla i!U oraz prawdopodobie&stwami

in-kluzji drugiego rz"du odpowiednio równymi

# " $ j , i s

ij p(s)dla i%j!U.

Przyj-mijmy, e wskutek wyst!pienia braków odpowiedzi warto#ci badanych cech obserwowane s! jedynie w pewnym podzbiorze s1 próby s. Zbiór jednostek

po-pulacji dla których nie uzyskano obserwacji cechy oznaczymy symbolem s2.

Podobnie jak Cassel i inni (1983) przyjmiemy, e brak odpowiedzi jest zjawi-skiem losowym i ka demu mo liwemu podzbiorowi s1 próby s odpowiada

pew-ne prawdopodobie&stwo jego realizacji rówpew-ne q(s1|s). Warunkowy rozk%ad

prawdopodobie&stwa q(s1|s) nazwiemy rozk%adem odpowiedzi (ang. response

distribution). Okre#la on prawdopodobie&stwa uzyskania odpowiedzi od ka dej i-tej jednostki populacji wynosz!ce

#

"

&

i s 1 s | i 1

)

s

|

s

(

q

dla i!U oraz prawdopo-dobie&stwa równoczesnego uzyskania odpowiedzi od i-tej i j-tej jednostki popu-lacji wynosz!ce #

"

&

j , i s 1 s | ij 1

)

s

|

s

(

q

dla i%j!U. W przypadku pe%nej odpowiedzi, a wi"c wtedy gdy &i|s = &ij|s = 1 dla i,j!U nieobci! onym estymatorem warto#ci

globalnej w populacji jest statystyka zaproponowana przez Horvitza i Thompso-na (1952). Niestety, w przeciwnym wypadku estymator ten jest obci! ony a jego obci! enie nie maleje wraz ze wzrostem liczebno#ci próby (nie jest nawet asymptotycznie nieobci! ony) co wykazali Nargundkar i Joshi (1975). W tej sytuacji jako oszacowanie warto#ci globalnej cechy X w populacji rozwa a si" statystyk" (por. Lessler i Kalsbeek 1992):

(3)

! &

"

$

&

1 s i i i i

ˆ

x

)

X

(

(1)

gdzie

&

ˆ

i oznacza oszacowanie indywidualnego prawdopodobie&stwa odpowie-dzi &i. Mo na wykaza$, e gdyby oszacowania

&

ˆ

i by%y bezb%"dne, to powy sza

statystyka by%aby nieobci! onym estymatorem t(X). W praktyce niestety indy-widualne prawdopodobie&stwa odpowiedzi nie s! znane i zachodzi potrzeba ich estymacji.

III. ESTYMACJA PRAWDOPODOBIE#STW ODPOWIEDZI

W najprostszym przypadku dla oszacowania prawdopodobie&stw odpowie-dzi mo na si" pos%u y$ modelem, stanowi!cym, i uodpowie-dzielenie lub nie uodpowie-dzielenie odpowiedzi przez dowoln! i-t! i j-t! spo#ród jednostek wylosowanych do próby to niezale ne zdarzenia losowe o jednakowym prawdopodobie&stwie niezale -nym od próby s co mo na zapisa$ formu%ami:

& " & ' !U |is i ; (2) 2 s |j s |i s |j i U j ,

i

'

!

&

"

&

(

&

"

&

(3)

Estymator najwi"kszej wiarogodno#ci parametru & przyjmuje posta$:

!

$

"

&

1 s i i UNI

1

N

1

ˆ

(4)

W konsekwencji otrzymujemy estymator warto#ci globalnej t(X) w postaci:

!

$

&

"

1 s i i UNI i UNI

ˆ

x

)

X

(

(5)

Bethlehem (1988) wykaza%, e przybli one obci! enie tego estymatora wy-znaczone poprzez rozwini"cie go w szereg Taylora z dok%adno#ci! do wyrazów pierwszego rz"du jest proporcjonalne do kowariancji pomi"dzy prawdopodo-bie&stwami odpowiedzi i warto#ciami cechy badanej a ponadto wyznaczy% jego przybli on! wariancj".

Inny sposób konstrukcji oszacowa& indywidualnych prawdopodobie&stw odpowiedzi opiera si" na wykorzystaniu zale no#ci pomi"dzy warto#ciami cech

(4)

pomocniczych obserwowanymi w ca%ej próbie s, oraz prawdopodobie&stwami odpowiedzi. Mog! one okaza$ si" przydatne do wyznaczenia dok%adniejszych oszacowa& indywidualnych prawdopodobie&stw odpowiedzi. W tym celu przy-datny b"dzie model regresji logistycznej (por np. Cassel i inni 1983), opisywany formu%!: 1 i 1 0 1 0 i( , ) (1 exp( z )) ) * + * + " * * & (6)

gdzie z1,...,zN oznaczaj! warto#ci pewnej cechy pomocniczej obserwowanej

w ca%ej próbie s, natomiast *0 i *1 to nieznane parametry. Oceny

ˆ*

0 i ˆ*1 tych

parametrów mo na uzyska$ maksymalizuj!c funkcj" wiarogodno#ci (por. np. Thiel 1979):

,

,

! !

*

*

&

)

(

*

*

&

"

*

*

2 1 i s 1 0 i s i 1 0 i 1 0

,

)

(

,

)

(

1

(

,

))

(

L

(7)

Rozwi!zanie tak postawionego problemu mo na uzyska$ z wykorzystaniem metod iteracyjnych. W niniejszej pracy zastosowano do tego celu metod" naj-wi"kszego spadku Rosena (1969). Wykorzystuj!c uzyskane w ten sposób osza-cowania

ˆ*

0 i ˆ*1 mo na skonstruowa$ estymator indywidualnego prawdopodo-bie&stwa odpowiedzi &i w postaci:

1 i 1 0 iLOG

(

1

exp(

ˆ

ˆ

z

))

ˆ

"

+

*

+

*

)

&

(8)

St!d estymator warto#ci globalnej t(X) przyjmuje posta$:

!

$

&

"

1 s i i iLOG i LOG

ˆ

x

)

X

(

(9)

W pewnych sytuacjach wykorzystanie metod parametrycznych do szacowa-nia indywidualnych prawdopodobie&stw odpowiedzi napotyka trudno#ci. Dzieje si" tak wtedy gdy brak jest przes%anek mog!cych uzasadni$ wybór postaci mode-lu i gdy zachodzi niebezpiecze&stwo nietrafnej jego specyfikacji. Do szacowania prawdopodobie&stw odpowiedzi mo na wtedy wykorzysta$ metody nieparame-tryczne, a w szczególno#ci estymatory j!drowe (por. np. Kulczycki (2005)), nie wymagaj!ce jawnego okre#lania analitycznej postaci zale no#ci pomi"dzy ce-chami pomocniczymi i prawdopodobie&stwami odpowiedzi. W niniejszym arty-kule wykorzystano rozwa any wcze#niej przez Giommiego (1987), estymator j!drowy:

(5)

! ! -. / 0 0 1 2) ) -. / 0 0 1 2) ) " & s j 2 2 j i s j 2 2 j i iKRN h 2 ) z z ( exp h 2 ) z z ( exp ˆ 1 (10)

gdzie sta%a h okre#lana jest zwykle mianem parametru wyg%adzania lub szeroko-#ci pasma (ang. bandwidth). Okre#la ona z jednej strony czu%o#$ metody na lo-kalne anomalie rozk%adu prawdopodobie&stwa odpowiedzi, a z drugiej strony zró nicowanie uzyskiwanych ocen tego prawdopodobie&stwa. Zwi"kszenie war-to#ci h oznacza zatem zwi"kszenie wariancji oszacowa& wzgl"dem obci! enia, a zmniejszenie skutkuje zmniejszeniem obci! enia kosztem wzrostu wariancji. Na potrzeby niniejszego artyku%u przyj"to arbitralnie, e h=1. W rezultacie otrzymujemy kolejny estymator warto#ci globalnej t(X) w postaci:

!

$

&

"

1 s i i iKRN i KRN

ˆ

x

)

X

(

(11)

IV. ESTYMACJA KOWARIANCJI

Rozwa my dwie cechy X i Y przyjmuj!ce w sko&czonej populacji U odpo-wiednio warto#ci x1,...,xN oraz y1,...,yN. Kowariancj" cech X i Y mo na zapisa$

za pomoc! formu%y: ! ! !

-.

/

0

1

2

)

-.

/

0

1

2

)

)

"

U i i U i i U i i i

y

N

1

y

x

N

1

x

1

N

1

)

Y

,

X

(

C

(12)

Dla potrzeb estymacji parametru C(X,Y) w sytuacji gdy w badaniu staty-stycznym wyst"puj! braki odpowiedzi zapiszemy powy sze wyra enie w rów-nowa nej postaci:

)) Y ( t ) X ( t N ) XY ( t N ( 1 N 1 ) Y , X ( C )1 ) )2 ) " (13) gdzie !

"

U i i

x

)

X

(

t

, !

"

U i i

y

)

Y

(

t

oraz !

"

U i i i

y

x

)

XY

(

t

. W przypadku pe%nej

odpowiedzi jednym z powszechnie znanych sposobów estymacji parametru C(X,Y) jest zast!pienie nieznanych warto#ci globalnych t(X), t(Y), t(XY) odpo-wiednimi estymatorami Horvitza-Thompsona (por. np. Särndal et al 1992). W przypadku braku odpowiedzi estymator Horvitza-Thompsona nie jest jednak

(6)

nawet asymptotycznie nieobci! ony, wskutek czego równie estymator kowa-riancji b"dzie si" charakteryzowa% obci! eniem nie malej!cym do zera wraz ze wzrostem liczebno#ci próby. Dlatego te , w miejsce statystyk Horvitza-Thompsona wykorzystamy omawiane wy ej estymatory wykorzystuj!ce wa e-nie danych. Rozwa my zatem nast"puj!ce trzy estymatory kowariancji:

)) Y ( tˆ ) X ( tˆ N ) XY ( tˆ N ( 1 N 1 ) Y , X (

UNI )1 UNI ) )2 UNI UNI

) " (14) )) Y ( tˆ ) X ( tˆ N ) XY ( tˆ N ( 1 N 1 ) Y , X (

LOG )1 LOG ) )2 LOG LOG

) " (15) )) Y ( tˆ ) X ( tˆ N ) XY ( tˆ N ( 1 N 1 ) Y , X ( Cˆ 2 KRN KRN KRN 1 KRN ) ) ) ) " (16)

gdzie statystyki tˆUNI(X), tˆUNI(Y) i tˆUNI(XY) s! odpowiednio estymatorami warto#ci globalnych t(X), t(Y) i t(XY) wyznaczanymi zgodnie z wzorem (5), statystyki tˆLOG(X), tˆLOG(Y) i tˆLOG(XY) s! odpowiednio ich estymatorami wyznaczanymi z wykorzystaniem wzoru (9), natomiast statystyki tˆKRN(X),

) Y (

KRN i tˆKRN(XY) s! odpowiednio ich estymatorami wyznaczanymi z wy-korzystaniem wzoru (11).

VI. WYNIKI EKSPERYMENTÓW SYMULACYJNYCH

Celem eksperymentów symulacyjnych by%o zbadanie w%asno#ci stocha-stycznych zaproponowanych strategii estymacji. W badaniach wykorzystano dane uzyskane podczas spisu rolnego przeprowadzonego w roku 1996 w wybra-nych gminach powiatu D!browa Tarnowska (gminy: Boles%aw, Gr"boszów i Radgoszcz). Dotyczy%y one 2420 gospodarstw, które w symulacjach reprezen-towa%y badan! populacj". Wykorzystano trzy obserwowane zmienne: sprzeda ogó%em gospodarstwa (X), pog%owie byd%a (Y) i powierzchni" gospodarstwa (Z). Szacowano kowariancj" cech X i Y w populacji z wykorzystaniem cechy Z jako pomocniczej dla celów estymacji prawdopodobie&stw odpowiedzi. Przyj"to, e prawdopodobie&stwa te okre#lone s! formu%! (6) przy czym warto#ci parame-trów *0 i *1 przyj"to w ka dym eksperymencie arbitralnie. Przeprowadzono trzy

eksperymenty symulacyjne. W ka dym z nich przeprowadzono 10000-krotn! symulacj" losowania dla liczebno#ci próby n=40,80,...200.

(7)

W pierwszym eksperymencie zbadano w%asno#ci proponowanych estyma-torów w sytuacji gdy *0=*1=0. Do porównania dok%adno#ci wykorzystano

wzgl"dny wska'nik efektywno#ci, obliczany jako stosunek #redniego b%"du kwadratowego danego estymatora, do #redniego b%"du kwadratowego estymato-ra

C

ˆ

UNI

(

X

,

Y

)

. Wzgl"dne wska'niki efektywno#ci estymatorów, ich obci! enia oraz udzia%y obci! e& w MSE przedstawiono odpowiednio na rys. 1., 2. i 3. Es-tymatory

C

ˆ

UNI

(

X

,

Y

)

i

C

ˆ

LOG

(

X

,

Y

)

cechuj! si" zbli on! dok%adno#ci!. Esty-mator

C

ˆ

KRN

(

X

,

Y

)

jest dok%adniejszy od dwóch pozosta%ych. Obci! enie es-tymatorów jest ujemne. Jego warto#$ bezwzgl"dna maleje wraz ze wzrostem rozmiaru próby. Obci! enie estymatorów

C

ˆ

UNI

(

X

,

Y

)

oraz

C

ˆ

LOG

(

X

,

Y

)

jest kilkukrotnie mniejsze ni estymatora

C

ˆ

KRN

(

X

,

Y

)

, zw%aszcza dla du ych prób. Udzia% obci! enia w MSE nie przekracza 1% dla

C

ˆ

UNI

(

X

,

Y

)

oraz

)

Y

,

X

(

C

ˆ

LOG oraz 2,5% dla

C

ˆ

KRN

(

X

,

Y

)

a wi"c jest znikomy.

0 0,2 0,4 0,6 0,8 1 1,2 40 80 120 160 200 n e ff LOG KRN

Rys. 1. Zale no#$ wzgl"dnego wska'nika efektywno#ci (eff) estymatorów kowariancji od liczebno#ci n próby s dla (0=0, (1=0

(8)

-800 -700 -600 -500 -400 -300 -200 -100 0 40 80 120 160 200 n B UNI LOG KRN

Rys 2. Zale no#$ obci! enia (B) estymatorów kowariancji od liczebno#ci n próby s dla (0=0,

oraz (1=0 0,000 0,005 0,010 0,015 0,020 0,025 40 80 120 160 200 n B ^ 2 /M S E UNI LOG KRN

Rys 3. Zale no#$ udzia%u (B^2/MSE) obci! enia w #rednim b%"dzie kwadratowym estymatorów kowariancji od liczebno#ci n próby s dla (0=0, (1=0

W drugim eksperymencie zbadano w%asno#ci proponowanych estymatorów kowariancji w sytuacji gdy *0=0 oraz *1= -1. Wzgl"dne wska'niki efektywno#ci

estymatorów, ich obci! enia oraz udzia% obci! e& w MSE przedstawiono na rys. 4. 5. i 6. Estymatory

C

ˆ

LOG

(

X

,

Y

)

oraz

C

ˆ

KRN

(

X

,

Y

)

s! dok%adniejsze od

(9)

esty-matora

C

ˆ

UNI

(

X

,

Y

)

w sensie #redniego b%"du kwadratowego a ich przewaga wzrasta wraz z rozmiarem próby. Obci! enie estymatora

C

ˆ

LOG

(

X

,

Y

)

pozostaje ujemne dla wszystkich badanych rozmiarów próby i co do warto#ci bezwzgl"d-nej maleje wraz z n. Estymator

C

ˆ

KRN

(

X

,

Y

)

charakteryzuje si" wyra'nie wi"k-szym co do modu%u, dodatnim obci! eniem które wraz ze wzrostem n zmienia si" minimalnie i raczej nieregularnie – jego zmiany trudno interpretowa$ jako wyra'n! tendencj". Najwi"ksze co do warto#ci bezwzgl"dnej, dodatnie obci! e-nie zarejestrowano dla estymatora

C

ˆ

UNI

(

X

,

Y

)

. Wrasta ono wraz ze zwi"ksze-niem n. Udzia% obci! enia w MSE dla estymatora

C

ˆ

LOG

(

X

,

Y

)

nie przekracza 1% i maleje wraz ze wzrostem n. Dla estymatora

C

ˆ

KRN

(

X

,

Y

)

ro#nie wraz ze wzrostem n, utrzymuj!c si" w przedziale <1%, 5%>. Dla estymatora

)

Y

,

X

(

C

ˆ

UNI szybko ro#nie przekraczaj!c 35% dla n=200.

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 40 80 120 160 200 n e ff LOG KRN

Rys. 4. Zale no#$ wzgl"dnego wska'nika efektywno#ci (eff) estymatorów kowariancji od liczebno#ci n próby s dla (0=0, (1= –1

(10)

-500 0 500 1000 1500 2000 40 80 120 160 200 n B UNI LOG KRN

Rys 5. Zale no#$ obci! enia (B) estymatorów kowariancji od liczebno#ci n próby s dla (0=0,

oraz (1= –1 0,000 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400 40 80 120 160 200 n B ^ 2 /M S E UNI LOG KRN

Rys 6. Zale no#$ udzia%u (B^2/MSE) obci! enia w #rednim b%"dzie kwadratowym estymatorów kowariancji od liczebno#ci n próby s dla (0=0, (1= –1

W trzecim eksperymencie zbadano w%asno#ci proponowanych estymato-rów kowariancji w sytuacji gdy *0=0 oraz *1=1. Wzgl"dne wska'niki

efektyw-no#ci estymatorów, ich obci! enia oraz udzia%y obci! enia w MSE przedsta-wiono odpowiednio na rys. 7, 8 oraz 9. Wzgl"dny wska'nik efektywno#ci esty-matora

C

ˆ

LOG

(

X

,

Y

)

przyjmuje warto#ci znacznie wi"ksze od jedno#ci co

(11)

ozna-cza e estymator ten jest znacznie mniej dok%adny od

C

ˆ

UNI

(

X

,

Y

)

. Wzgl"dny wska'nik efektywno#ci estymatora

C

ˆ

KRN

(

X

,

Y

)

utrzymuje si" w przedziale <0.92; 0.69> co oznacza e estymator ten jest bardziej dok%adny od estymatora

)

Y

,

X

(

C

ˆ

UNI , a przewaga w dok%adno#ci ro#nie wraz ze wzrostem rozmiaru pró-by. Obci! enie wszystkich estymatorów jest w tym eksperymencie ujemne i maleje co do modu%u wraz ze wzrostem n. Najmniejsze warto#ci bezwzgl"dne a zarazem najszybszy spadek obci! enia wraz z n zaobserwowano dla estymato-ra

C

ˆ

LOG

(

X

,

Y

)

. Najwi"ksze warto#ci bezwzgl"dne obci! enia i jego najwol-niejszy spadek zaobserwowano dla estymatora

C

ˆ

UNI

(

X

,

Y

)

. Tak wi"c, estyma-tor o najwi"kszym #rednim b"dzie kwadratowym charakteryzuje si" najmniej-szym obci! eniem. Udzia% obci! enia estymatora

C

ˆ

LOG

(

X

,

Y

)

w jego #rednim b%"dzie kwadratowym jest pomijalnie ma%y, i nie przekracza 4%. Dla pozosta-%ych estymatorów udzia% ten wynosi od czterdziestu do dziewi"$dziesi"ciu pro-cent i wzrasta wraz ze zwi"kszaniem rozmiaru próby.

0 5 10 15 20 25 40 80 120 160 200 n e ff LOG KRN

(12)

-4500 -4000 -3500 -3000 -2500 -2000 -1500 -1000 -500 0 40 80 120 160 200 n B UNI LOG KRN

Rys 8. Zale no#$ obci! enia (B) estymatorów od liczebno#ci n próby s dla (0=0, oraz (1=1

0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 40 80 120 160 200 n B ^ 2 /M S E UNI LOG KRN

Rys 9. Zale no#$ udzia%u (B^2/MSE) obci! enia w #rednim b%"dzie kwadratowym estymatorów od liczebno#ci n próby s dla (0=0, (1=1

V. PODSUMOWANIE

Wyniki symulacji wskazuj!, e wykorzystanie dost"pnych informacji o war-to#ciach cech pomocniczych mo e w istotny sposób poprawi$ w%asno#ci stocha-styczne estymatorów kowariancji. Zarazem jednak trudno w#ród badanych es-tymatorów wskaza$ taki, który by%by lepszy od pozosta%ych pod ka dym wzgl"-dem. Z punktu widzenia obci! enia zdecydowanie najkorzystniej prezentuje si"

(13)

estymator oparty o model logistyczny. Jednak jego dok%adno#$ mierzona b%"dem #redniokwadratowym zale y wyra'nie od rozk%adu odpowiedzi, i w sytuacji gdy sk%onno#$ respondentów do odpowiedzi jest negatywnie skorelowana z badany-mi cechabadany-mi jest ona bardzo niska. Gdy mo na oczekiwa$ wyst"powania takich zale no#ci godnym polecenia wydaje si" estymator kowariancji skonstruowany z wykorzystaniem estymacji j!drowej. Uzyskane wyniki uzasadniaj! dalsze ba-danie tych strategii estymacji z wykorzystaniem metod analitycznych, oraz roz-szerzenie docieka& na inne parametry populacji daj!ce si" przedstawi$ jako funkcje warto#ci globalnych.

BIBLIOGRAFIA

Bethlehem J.G. (1988), Reduction of Nonresponse Bias Through Regression Estimation, Journal

of Official Statistics Vol 4. No. 3. 251–160.

Cassel C.M. Särndal C.E. Wretman J.H. (1983), Some Uses of Statistical Models in Connection with the Nonresponse Problem w: Incomplete Data in Sample Surveys W.G. Madow I.Olkin (red.) Academic Press New York.

Giommi A. (1987), Nonparametric Methods for Estimating Individual Response Probabilities,

Survey Methodology, Vol 13, No 2, 127–134.

Horvitz D.G. Thompson D.J. (1952), A Generalization of Sampling Without Replacement from a Finite Universe, Journal of the American Statistical Association No 47, 663–685.

Kulczycki P. (2005), Estymatory j drowe w analizie systemowej. WNT Warszawa. Lessler J.T. Kalsbeek W.D. (1992), Nonsampling Error in Surveys Wiley, New York

Nargundkar M.S. Joshi G.B. (1975), Non-response in Sample Surveys 40-th Session of Interna-tional Statistical Institute – Warsaw 1975, Contributed Papers, 626–628.

Rosen J.B. (1969), The gradient projection method for nonlinear programming, Journal of Society

for Industrial and Applied Mathematics, Vol. 8(1), 181–217.

Särndal C.E. Swensson B. Wretman J.H. (1992), Model Assisted Survey Sampling Springer– Verlag New York.

Theil H. (1979), Zasady ekonometrii, PWN Warszawa.

Wojciech Gamrot

ON THE USE OF WEIGHTING ADJUSTMENTS TO ESTIMATE THE FINITE POPULATION COVARIANCE UNDER NONRESPONSE

Abstract

The weighting adjustment method associates some weight compensating for sample nonre-spondents with each responding unit. These weights are usually constructed as reciprocals of individual response probabilities, estimated on the basis of available auxiliary information. In this paper an attempt is made to apply the weighting adjustment method to estimate the complex popu-lation parameter, namely the covariance between two popupopu-lation characteristics. A weighting adjustment estimator is proposed. Its properties are examined in a simulation study.

Cytaty

Powiązane dokumenty

Zamiast tego zajmują się albo analizą wewnętrzną zjawisk dotyczących mediów społecznościo- wych, albo próbują przewidzieć zjawiska zewnętrzne, wykorzy- stując

Zastanów się i zapisz w zeszycie odpowiedź na pytanie: Czym dla Ciebie jest słowo Boże?. Pomódl się słowami

Obliczyć prawdopodobień- stwo, że w każdej urnie o numerze nieparzystym znajdzie się dokładnie jedna kula, a w każdej urnie o numerze parzystym dokładnie dwie

6.5 Na odcinku wybrano losowo dwa punkty, które dzielą go na trzy części.. Jakie jest prawdopodobieństwo, że można z nich

7.18 Jeżeli średni czas sprawności akumulatora wynosi 30 miesięcy z odchyleniem standardowym 5 miesięcy, to jaki procent akumulatorów będzie mieć czas sprawności od 24 do

Opracowane w doktoracie nowe metody przetwarzania wstqpnego obraz6w i wizualizacji (MLJPP, MUDD, MUDE, MUSE) doprowadzity do poprawy percepc.ii zmian niedokrwiennych

Udowodni¢, »e je±li M jest projektywny, to M jest

„s³odkie idiotki”, kieruj¹ce siê raczej emocjami ni¿ intelek- tem, i których rola spo³eczna sprowadza siê do rodzenia i opieki nad dzieæmi.. Tak¿e mê¿czyŸni zmuszani s¹