• Nie Znaleziono Wyników

UWAGI METODOLOGICZNE

2. Schemat losowania próby oraz uogólnianie wyników badania

2.3. Zastępowanie

W przypadku gospodarstw z wylosowanych mieszkań, odmawiających udziału w badaniu stosowano tzw. zastę-powanie z próby rezerwowej (dotyczyło to tylko nowej podpróby). W edycji badania w 2019 roku wprowadzono uporządkowanie adresów z listy rezerwowej ze względu na odległości do adresu z próby zasadniczej. Rozwiąza-nie to wprowadzono aby zmRozwiąza-niejszyć obciążeRozwiąza-nie sieci ankieterskiej ze względu na czas przemieszczania się mię-dzy adresami (w szczególności w terenach wiejskich) oraz koszty dojazdu w przypadku konieczności kilkukrot-nych wizyt pod tym samym adresem (brak kontaktu z respondentem lub dokończenie wywiadu).

3. Jakość danych

3.1. Błędy losowe

Błąd standardowy i efektywna liczebność próby

Estymacja błędów standardowych została oparta na metodzie wielokrotnego losowania podpróbek. Użyto wariantu metody bootstrap, w którym niezależnie w każdej warstwie dokonuje się wielokrotnego (w tym przy-padku 500 powtórzeń) losowania ze zwracaniem podpróbek o liczebności nh −1 spośród nh wylosowanych do badania jednostek pierwszego stopnia w h-tej warstwie (metoda McCarthy i Snowden (1985)). Po wylosowa-niu odpowiedniej liczby podpróbek, oryginalne wagi dla jednostek losowania są odpowiednio modyfikowane. Następnie metodą bootstrap szacowana jest wariancja odpowiednich wskaźników przy wykorzystaniu aproksy-macji typu Monte Carlo opartej na niezależnych podpróbkach.

Obliczenia wykonano w systemie SAS. Ponadto zaimplementowano metodę szacowania wariancji dla podsta-wowych wskaźników ubóstwa, opartą na linearyzacji. Wykonane porównania obliczeń metodą linearyzacji oraz metodą bootstrap potwierdziły dużą zgodność uzyskanych rezultatów.

Oceny błędów i efektywność schematu losowania dla wybranych wskaźników Wyszczególnienie Wartość Błąd standardowy Efektywność schematu losowania Liczebność próby zrealizowanej Efektywna liczebność próby Wskaźnik zagrożenia ubóstwem po uwzględnieniu

w dochodach tr ansferów społecznych 15,4 0,39 1,490 50788 34086

Wskaźnik zróżnicowania kwintylowego (S80/S20) 4,4 0,06 1,445 50788 35147 Wskaźnik głębokości ubóstwa (w odniesieniu do mediany) 22,1 0,65 1,399 50788 36303

Współczynnik Giniego 28,5 0,30 1,455 50788 34906

Przeciętny ekwiwalentny dochód do dyspozycji 34184,8 226,2 1,553 50788 32703

3.2. Błędy nielosowe

Operat losowania i błędy pokrycia

Próby do badania EU-SILC losowane są z operatu losowania opartego o system TERYT, tj. Urzędowy Rejestr Podziału Terytorialnego Kraju. W operacie tym wyróżniono dwa rodzaje jednostek pierwszego stopnia – JPS: - około 186 000 obwodów spisowych zawierających średnio około 78 mieszkań,

- około 35 000 rejonów statystycznych średnio po około 414 mieszkań.

Terytorium Polski podzielone jest na rejony statystyczne i obwody spisowe. Do badania EU-SILC jako jednostki pierwszego stopnia wykorzystuje się obwody spisowe. Jednostkami losowania drugiego stopnia są mieszkania. Dla każdego obwodu stworzony został wykaz mieszkań, który stanowi operat losowania drugiego stopnia. Wszyst-kie gospodarstwa domowe mieszkające w wylosowanych mieszkaniach powinny wziąć udział w badaniu.

System TERYT podlega corocznej aktualizacji. Przedmiotem aktualizacji jest podział terytorium kraju na rejony i obwody, aktualizuje się wykazy mieszkań oraz nazwy miejscowości i ulic. Ponadto, wprowadzane są inne zmiany wynikające z nowego budownictwa, wyburzeń oraz zmian w podziale administracyjnym kraju.

Próba do EU-SILC 2019 losowana była w listopadzie 2018 roku z operatu zaktualizowanego na dzień 30 czerwca 2018 r. W próbie numer 2 wylosowanej do badania w 2019 roku stwierdzono 8,3% mieszkań nie istniejących oraz mieszkań niezamieszkanych lub zamieszkanych czasowo; 2,3% wylosowanych mieszkań miało nieprawidłowy adres.

Błędy wynikające z braku odpowiedzi

Zrealizowana liczebność próby

Wielkość próby Podpróba 7 8 1 2 Ogółem A 2456 3496 5307 8615 19874 B 4873 6703 9761 15101 36438 C 6544 9120 13504 21620 50788

A - liczba zbadanych gospodarstw domowych, włączonych do zbioru danych106

B - liczba osób w wieku 16 lat i więcej, z którymi został przeprowadzony wywiad indywidualny C - liczba osób w zbadanych gospodarstwach domowych

106 Warunkiem włączenia gospodarstwa domowego do zbioru danych było zrealizowanie kwestionariusza gospodarstwa domowego oraz co najmniej jednego wywiadu indywidualnego.

Jednostki niezbadane

Wskaźniki związane z realizacją wywiadów dla połączonych podprób Symbol wskaźnika Wskaźnik Wartość wskaźnika bez próby rezerwoweja uwzględniająca próbę rezerwowąb Ra

tzw. kontaktu z wylosowanym adresem, czyli iloraz liczby skontaktowanych adresów do liczby wszystkich poprawnych wylosowanych adresów

0,997 0,798

Rh

udział liczby zbadanych gospodarstw domowych względem liczby wszystkich gospodarstw w skontaktowanych mieszka-niach

0,872 0,463

Rp

udział liczby uzyskanych wywiadów indywidualnych względem liczby osób indywidulanych które powinny być zbadane (w ra-mach zbadanych gospodarstw)

0,860 0,860

*NRp całkowitego braku odpowiedzi 25,2 68,2

a Z listy rezerwowej uwzględniono tylko te adresy, w których zrealizowano wywiad. b Z listy rezerwowej uwzględniono wszystkie adresy pod którymi był ankieter, niezależnie od tego czy wywiad zrealizowano czy nie.

Wskaźniki związane z realizacją wywiadów dla nowej podpróby (numer 2) Symbol wskaźnika Wskaźnik Wartość wskaźnika bez próby rezerwoweja uwzględniająca próbę rezerwowąb Ra

tzw. kontaktu z wylosowanym adresem, czyli iloraz liczby skontaktowanych adresów do liczby wszystkich poprawnych wylosowanych adresów

0,992 0,733

Rh

udział liczby zbadanych gospodarstw domowych względem liczby wszystkich gospodarstw w skontaktowanych mieszka-niach

0,871 0,287

Rp

udział liczby uzyskanych wywiadów indywidualnych względem liczby osób indywidulanych które powinny być zbadane (w ra-mach zbadanych gospodarstw)

0,844 0,844

*NRp całkowitego braku odpowiedzi 27,1 82,2

a Z listy rezerwowej uwzględniono tylko te adresy, w których zrealizowano wywiad. b Z listy rezerwowej uwzględniono wszystkie adresy pod którymi był ankieter, niezależnie od tego czy wywiad zrealizowano czy nie.

Rozkład gospodarstw domowych

Kontakt z wylosowanym adresem (bez próby rezerwoweja)

DB120

Podpróba

7 8 1 2 Ogółem

Nawiązany kontakt 2709 3946 6245 9892 22792

Mieszkanie nie znalezione 0 0 0 48 48

Brak możliwości dotarcia do mieszkania 0 0 0 29 29

Pod wylosowanym adresem nie ma mieszkania 0 1 1 457 459

Ogółem 2709 3947 6246 10426 23328

Kontakt z wylosowanym adresem (z uwzględnieniem próby rezerwowejb)

DB120

Podpróba

7 8 1 2 Ogółem

Nawiązany kontakt 2709 3946 6245 30041 42941

Mieszkanie nie znalezione 0 0 0 835 835

Brak możliwości dotarcia do mieszkania 0 0 0 437 437

Pod wylosowanym adresem nie ma mieszkania 0 1 1 10014 10016

Ogółem 2709 3947 6246 41327 54229

b Z listy rezerwowej uwzględniono wszystkie adresy pod którymi był ankieter, niezależnie od tego czy wywiad zrealizowano czy nie. Wynik realizacji kwestionariusza gospodarstwa domowego (bez próby rezerwoweja)

DB130 Podpróba 7 8 1 2 Ogółem Wywiad przeprowadzony 2460 3500 5318 8616 19894 Odmowa 115 234 644 839 1832 Czasowa nieobecność 55 91 105 132 383

Brak możliwości nawiązania kontaktu z gospodarstwem (z

po-wodu choroby, podeszłego wieku, alkoholizmu) 19 39 45 69 172

Inne powody 60 82 133 236 511

Ogółem 2709 3946 6245 9892 22792

a Z listy rezerwowej uwzględniono tylko te adresy, w których zrealizowano wywiad.

Wynik realizacji kwestionariusza gospodarstwa domowego (z uwzględnieniem próby rezerwowejb)

DB130 Podpróba 7 8 1 2 Ogółem Wywiad przeprowadzony 2460 3500 5318 8616 19894 Odmowa 115 234 644 13179 14172 Czasowa nieobecność 55 91 105 1877 2128

Brak możliwości nawiązania kontaktu z gospodarstwem (z

po-wodu choroby, podeszłego wieku, alkoholizmu) 19 39 45 980 1083

Inne powody 60 82 133 5389 5664

Ogółem 2709 3946 6245 30041 42941

a Z listy rezerwowej uwzględniono wszystkie adresy pod którymi był ankieter, niezależnie od tego czy wywiad zrealizowano czy nie. Stopień realizacji badania

DB135

Podpróba

7 8 1 2 Ogółem

Gospodarstwa zbadane, włączone do zbioru danych 2456 3496 5307 8615 19874

Gospodarstwa badane, niewłączone do zbioru danych 4 4 11 1 20

Rozkład osób w wieku 16 lat i więcej Realizacja wywiadu indywidualnego

RB250

Podpróba

7 8 1 2 Ogółem

Wywiad zrealizowany 4873 6703 9761 15101 36438

Utrudniony kontakt z powodu choroby, niepełnosprawności, itp. 38 59 89 172 358

Odmowa udziału w badaniu 326 559 962 1504 3351

Respondent czasowo nieobecny – niemożliwe uzyskanie

informacji od innej osoby 207 330 480 1052 2069

Brak kontaktu z innego powodu 14 33 44 61 152

Brak jakichkolwiek informacji o osobie – powód nieznany 1 2 2 4 9

Ogółem 5459 7686 11338 17894 42377

Rodzaj wywiadu indywidualnego

RB260 Podpróba 7 8 1 2 Ogółem Wywiad bezpośredni 3467 4887 7067 11586 27007 Wywiad zastępczy 1406 1816 2694 3515 9431 Ogółem 4873 6703 9761 15101 36438

Błędy powstałe w trakcie realizacji badania oraz rejestracji danych

Podobnie jak inne badania statystyczne, badanie EU-SILC może być obciążone błędami powstającymi na różnych etapach badania. Dotyczy to przede wszystkim błędów popełnianych przez ankietera na etapie zbierania infor-macji, błędów respondenta wynikających z niezrozumienia pytań bądź nieprecyzyjnych odpowiedzi oraz błędów powstałych na etapie rejestracji danych.

Według ankieterów, którzy po przeprowadzeniu wywiadu z gospodarstwem domowym byli zobligowani do odpo-wiedzi na kilka pytań dotyczących realizacji wywiadu, 97,4% osób odpowiadających na pytania w kwestionariuszu gospodarstwa domowego oraz 97,8% osób odpowiadających na pytania w kwestionariuszu indywidualnym okazało pozytywne nastawienie do badania, podczas gdy ponad 2% respondentów (dotyczy to zarówno wywiadu o sytuacji gospodarstwa domowego, jak i wywiadu indywidualnego) wykazało niechętną postawę.

Według ankieterów w ponad 89% kwestionariuszy gospodarstwa domowego i w ponad 90% kwestionariuszy in-dywidualnych jakość danych pozadochodowych była dobra lub bardzo dobra, natomiast w 0,4% kwestionariuszy gospodarstw domowych i w 0,3% kwestionariuszy indywidualnych jakość danych była wątpliwa.

Powiązane dokumenty