• Nie Znaleziono Wyników

Ocena jakości oszacowania elementów macierzy migracji

Rozdział 4. Oszacowanie macierzy migracji dla roku 2011

4.3. Ocena jakości oszacowania elementów macierzy migracji

Dzięki zastosowaniu modelu trzypoziomowego przy szacowaniu wartości na diagonali uzyskano znaczną poprawę jakości dopasowania modelu (wiarogodność wzrosła o 36%, wartość kryterium Akaike’a spadła o 32% zaś kryterium Schwarza o prawie 20%) w stosunku do klasycznej regresji liniowej (por. tab. 4.7 i 4.34). Ponadto szacując natężenie przyjazdów do pracy przy pomocy trzypoziomowego pełnego modelu oszacowanego w podrozdziale 4.2, popełnimy przeciętnie błąd o ponad 17% mniejszy niż w przypadku klasycznej regresji liniowej (por. tab. 4.59). Zauważyć można,

że nastąpił równomierny spadek błędów szacunku w porównaniu z klasyczną regresją

liniową, ponieważ obniżyły się wartości wszystkich decyli (por. tab. 4.60).

Również w trakcie wprowadzania kolejnych rozszerzeń zaobserwowano konsekwentne zmniejszanie się błędów oszacowań (por. wykr. 4.10 i tab. 4.59). Stwierdzono mianowicie konsekwentny spadek wszystkich kwartyli charakteryzujących popełniane błędy, a także wartości błędu, powyżej którego byłby on uznawany za nietypowo wysoki (por. wykr. 4.10). Również wartości największych błędów szacunku zmniejszały się dzięki zastosowaniu modeli oszacowanych w kolejnych podetapach. Szczególny spadek silnie odstających błędów zaobserwowano po wprowadzeniu w etapie czwartym zmiennych objaśniających z poziomu powiatów do współczynników kierunkowych przy zmiennych z poziomu gmin (por. wykr. 4.10).

184

Wykres 4. 10. Rozkład ocen błędów standardowych szacunku natężenia przyjazdów dla różnych modeli, Polska, 2006 Źródło: Opracowanie własne na podstawie danych GUS

185

Tabela 4.59. Wartości średnie ocen błędów standardowych szacunku natężenia

przyjazdów do pracy w gminach, wybrane modele, Polska, 2006

Etap 0.1 1.2 2 3.1 4.2 5.3 Średnia ocena standardowego błędu szacunku 0,1236873 0,1222041 0,1155903 0,1155627 0,1032609 0,1024518

Źródło: Opracowanie własne na podstawie danych GUS

Tabela 4.60. Charakterystyki rozkładu błędów standardowych szacunku natężenia

przyjazdów do pracy w gminach według modelu trzypoziomowego w porównaniu z klasycznym modelem regresji liniowej, Polska, 2006

Model regresji

Wartość min

Decyle rozkładu błędów Wartość

max 10 20 30 40 50 60 70 80 90 regresja liniowa 0,00015 0,0179 0,0364 0,0555 0,0753 0,0973 0,1219 0,1507 0,1847 0,237 7 4,2161 model trzy- poziomowy 0,00001 0,0143 0,0292 0,0470 0,0621 0,0804 0,0994 0,1225 0,1543 0,200 7 1,3539 Źródło: Opracowanie własne na podstawie danych GUS

Dla połowy powiatów uzyskane z użyciem modelu trzypoziomowego oszacowanie różniło się od faktycznej wartości o nie więcej niż 0,0804. W przypadku jednej piątej gmin uzyskano błąd nie większy niż 0,0292, z kolei tylko dla 10 procent gmin otrzymano oszacowanie różniące się od wartości empirycznej o więcej niż 0,2007 (por. tab. 4.60). Ponadto wszystkie wyznaczone kwantyle błędów oszacowań przyjmowały mniejsze wartości przy oszacowaniach wyznaczonych przy pomocy modelu trzypoziomowego niż klasycznej regresji liniowej (por. tab. 4.60). Wartość największego błędu oszacowania była zaś aż trzykrotnie większa w przypadku nie uwzględnienia struktury trzypoziomowej (por. wykres 4.10 i tab. 4.60). Zarówno w przypadku modelu trzypoziomowego, jak i klasycznej regresji liniowej, dla żadnej z gmin nie oszacowano ujemnego natężenia przyjazdów. Ponieważ natężenie przyjazdów do pracy w naturalny sposób powinno przyjmować wartości nieujemne, jest to niewątpliwą zaletą skonstruowanych modeli. Przy pomocy skonstruowanego modelu trzypoziomowego oszacowano natężenie przyjazdów w gminach dla roku 201133. Otrzymane oszacowania przemnożono następnie przez liczbę osób pracujących w tych gminach w 2011 roku, w ten sposób uzyskując

33 Pomiędzy rokiem 2006 a 2011 następujące gminy zostały podzielone na część miejską i wiejską: Wolbórz, Nowe Brzesko, Bobowa, Szczucin, Radłów, Łaszczów, Kołaczyce, Pruchnik, Brzostek, Przecław, Michałowo, Krynki, Czyżew, Szepietowo, Tychowo i Gościno. W celu dokonania oszacowań przy pomocy modelu trzypoziomowego skonstruowanego dla roku 2006, konieczne było więc połączenie obu części dla roku 2011, w tym celu zsumowano odpowiednie dane bezwzględne.

186

oszacowania liczby osób pracujących na terenie gmin, jednak jednocześnie zamieszkałych poza ich granicami. Następnie wartości te odjęto od znanych dla roku 2011 liczebności ludności pracującej w gminach, otrzymując tym samym oszacowanie elementów na diagonali macierzy przepływów aktualnej dla roku 2011.

Po dokonaniu oszacowań sprawdzono, ile procent zmienności zmiennej objaśnianej wyjaśnione zostało przy pomocy skonstruowanego modelu. W tym celu skorzystano z przybliżenia O = 1 −∑ véì ¯é~&



∑ véì ¯é[&

 . Okazało się, że precyzja oszacowań natężenia przyjazdów dokonanych przy pomocy modelu trzypoziomowego utrzymywała się

na akceptowalnym poziomie (R2=0,499), czego raczej nie można stwierdzić w przypadku modelu klasycznej regresji liniowej (R2=0,135). Również w przypadku wartości bezwzględnych liczby osób przyjeżdżających do pracy oraz liczby osób pracujących w gminie zamieszkania zauważono znaczną przewagę modelu trzypoziomowego nad klasyczną regresją liniową (por. tab. 4.61).

Tabela 4.61. Wartości współczynników determinacji modeli natężenia przyjazdów

do pracy dla elementów na diagonali macierzy migracji Model Natężenie

przyjazdów

Liczba osób przyjeżdżających do pracy

Liczba osób pracujących w gminie zamieszkania1 Klasyczna regresja liniowa 0,1347983 0,5696773 0,9542779 Model wielopoziomowy 0,4993631 0,9092982 0,9903545 Uwaga:

1 W przypadku klasycznej regresji liniowej w gminie Kleszczów z województwa łódzkiego oszacowano ujemną wartość mieszkańców zatrudnionych na jej terenie (-2367 osób), którą zastąpiono zerem. Z kolei zgodnie

z modelem wielopoziomowym ujemne wartości osób pracujących w obszarze zamieszkania oszacowano dla części wiejskiej gminy Olszyna z województwa Dolnośląskiego, części wiejskiej gminy Polkowice z województwa Dolnośląskiego, części miejskiej gminy Kleczew z Wielkopolski, gminie Ostrowite z Wielkopolski oraz gminie Powidz, również z Wielkopolski (odpowiednio -53, -1905, -542, -42 i -577). Źródło: Opracowanie własne na podstawie danych GUS

Analogiczną weryfikacje jakości modelu i błędów szacunku przeprowadzono dla modelu wykorzystanego do oszacowania elementów macierzy migracji poza diagonalą (por. tab. 4.62).

187

Tabela 4.62. Wartości współczynników determinacji modeli natężenia dojazdów do

pracy dla elementów poza diagonalą macierzy migracji

Model Natężenie przepływów Liczba osób dojeżdżających do pracy pomiędzy parami gmin

Klasyczna regresja liniowa 0,2000348 0,3750672

Model wielopoziomowy 0,6312913 0,7119627

Źródło: Opracowanie własne na podstawie danych GUS

Również w przypadku modelu mającego na celu oszacowanie przepływów związanych z zatrudnieniem pomiędzy parami gmin zaobserwowano znaczną przewagę zastosowanego modelu czteropoziomowego z dwoma kryteriami grupowania nad klasyczną regresją liniową (por. tab. 4.62). Należy jednak zaznaczyć, że precyzja szacunków poza diagonalą jest istotnie niższa niż dla diagonali, pomimo zastosowania znacznie bardziej zaawansowanego modelu. Wynika to z faktu, że pary gmin, dla których szacowane są przepływy związane z zatrudnieniem są niezwykle trudną do badania populacją. Ponadto pogłębiona analiza otrzymanych oszacowań wskazuje, że błędy popełnione podczas estymacji natężenia przepływów związanych z zatrudnieniem pomiędzy parami gmin mają pewnego rodzaju charakter systematyczny. Mianowicie przeszacowane zostały wartości dojazdów na dużych odległościach przy jednoczesnym niedoszacowaniu przepływów pomiędzy pobliskimi gminami. Jedną z przyczyn takiego stany rzeczy może być fakt, że estymację przepływów pomiędzy parami gmin przeprowadzono na wartościach względnych i dopiero po otrzymaniu oszacowań przemnożono je przez wartości mianownika, czyli liczbę osób pracujących w gminach przyjazdu. Ponieważ dojazdy na dużych odległościach skierowane są zazwyczaj do największych ośrodków miejskich, charakteryzujących się dużą liczbą osób pracujących, podczas przechodzenia z wartości względnych przepływów, oszacowanych przy pomocy modelu czteropoziomowego, na bezwzględne, konieczne do konstrukcji macierzy migracji, błędy popełnione przy szacowani dojazdów na dużych odległościach uległy powiększeniu.

188