• Nie Znaleziono Wyników

Badanie Ekonomicznej Aktywności Ludności

W dokumencie produkty EE (Stron 57-60)

1. Preferencje młodzieży względem usług edukacyjnych na poziomie wyższym –

1.4. Źródła danych dotyczących wyborów edukacyjnych

1.4.1. Informacje o wyborach edukacyjnych – opis istniejących zbiorów danych

1.4.1.1. Badanie Ekonomicznej Aktywności Ludności

Bilans Kapitału Ludzkiego + + - - +/- - +/- + - + - - - + Diagnoza Społeczna - + - - +/- - +/- + - - +/- - - - Polski Generalny Sondaż

Społeczny +/- + - - - + +/- + - - - - Program „Pierwsza Praca” - Absolwent + + + - - - - + - + +/- - - - Wybory ścieżki kształcenia a sytuacja zawodowa Polaków + + - - + +/- - + - - - +/- - - Uwarunkowania Decyzji Edukacyjnych + + +/- - - +/- +/- +/- +/- - - + - - Źródło: opracowanie własne.

Jak wynika z powyższej analizy, najbardziej istotną ułomnością baz zastanych jest brak informacji o preferencjach kandydatów, brak wyniku egzaminu maturalnego i brak oczekiwań kandydatów względem wysokości płacy i prawdopodobieństwie uzyskania pracy oraz o pieniężnych i niepieniężnych kosztach studiowania. Tło społeczno-ekonomiczne wyboru edukacyjnego także nie jest dobrze opisane, ale w tym przypadku istnieje często możliwość zastosowania zmiennych będących niedoskonałym przybliżeniem brakujących danych.

Wyżej opisane ograniczania w istotny sposób przełożyły się na możliwość zastosowania opisanej wcześniej procedury estymacyjnej. W efekcie wstępnej analizy zdecydowano o zaniechaniu dalszej eksploracji w odniesieniu do dwóch ostatnich z wymienionych baz. W przypadku Bazy danych „Wybory ścieżki kształcenia a sytuacja zawodowa Polaków” o odrzuceniu bazy zdecydowały kluczowe niedostatki informacyjne oraz niska liczebność i struktura próby. W przypadku badania Uwarunkowań Decyzji Edukacyjnych (UDE), zaniechano analiz głównie ze względu na fakt, że na moment sporządzania niniejszego raportu badanie to było w trakcie realizacji – należy zaznaczyć, że ewentualna analiza w szczególności danych panelowych (które dopiero zostaną zebrane) stanowi obiecujący kierunek z punktu widzenia pytań badawczych. Poniżej przedstawiono bardziej szczegółowy opis pozostałych baz danych (tych których wykorzystanie jest na chwilę sporządzania raportu możliwe) wraz ze statystykami opisowymi oraz informacją o niezbędnych do modelowania zmiennych i ich przybliżeniach. Szczególną uwagę zwrócono na konieczność modyfikacji w procedurze modelowania ekonometrycznego, w związku z niedoskonałościami zastanych baz danych.

1.4.1.1. Badanie Ekonomicznej Aktywności Ludności

Badanie Ekonomicznej Aktywności Ludności (BAEL) jest podstawowym narzędziem służącym monitorowaniu zmian aktywności zawodowej ludności. Analizowane są zmiany rozmiarów i struktury populacji osób pracujących, bezrobotnych i nieaktywnych zawodowo. Ankiety przeprowadzane są kwartalnie, od 1992 roku, zaś próba jest reprezentatywna na poziomie kraju i województw. Ankietą obejmowane są gospodarstwa domowe oraz osoby w wielu 15 lat i więcej, będące członkami tych gospodarstw, zamieszkałe w 54,7 tysięcy mieszkań wylosowanych do badania.

58

Z uwagi na zasięg badania, BAEL może stanowić potencjalnie najbardziej wartościowe źródło danych na potrzeby niniejszego projektu. Dane dostarczają bowiem informacji o poziomie i dziedzinie wykształcenia oraz statusie ekonomiczno-społecznym rodziny respondenta. Istotnym ograniczeniem jest jednak to, iż informacje o pozycji ekonomicznej rodziny pozyskana jest tylko dla studentów mieszających z rodzicami (lub z jednym z nich). Odsetek studentów w wieku produkcyjnym mieszkających z rodzicami wynosi 75%. Rzeczywisty odsetek studentów mieszkających z rodzicami jest jednak zapewne niższy, ponieważ w ankiet BAEL nie przeprowadza się w gospodarstwach zbiorowych, co oznacza, iż w próbie nie uwzględnia się studentów mieszkających w akademikach czy bursach.

W próbie znajduje się ponad 358 tysięcy osób w wieku powyżej 15 roku życia, z czego 58% stanowią kobiety. Należy tu jednak mieć na uwadze konstrukcję samej próby BAEL i częstotliwość przeprowadzanej ankiety. Ankiety przeprowadzane są kwartalnie, przy czym co cztery kwartały część próby ulega zmianie. W rezultacie liczba obserwowanych w próbie indywidualnych jednostek wynosi 95 792. Struktura populacji wskazuje, iż w próbie znajduje się stosunkowo dużo osób poniżej 30. roku życia, będących docelową próbą badawczą niniejszego badania. Mediana wynosi 33 lata, zaś I i III kwantyl to 26 i 44 lata, odpowiednio. Ta nadreprezentacja młodszych kohort wynika z ograniczenia próby od osób posiadających wyższe wykształcenie.

Kierunki kształcenia zgrupować można w osiem kategorii: kształcenie nauczycieli i pedagogika (16,5% próby4), języki obce, nauki humanistyczne, nauka (8,9%), nauki społeczne, ekonomia i prawo (35,3%), nauki biologiczne, nauki fizyczne, matematyka (11,3%), inżynieria, procesy produkcyjne, budownictwo (14%), rolnictwo, weterynaria (3,4%), zdrowie i opieka społeczna (6,2%), usługi (4,6%). Informację o wykształceniu ojca i matki respondenta można przyjąć jako przybliżenie statusu społecznego rodziny respondenta. Pamiętać jednak należy, iż jest to przybliżenie niedoskonałe chociażby ze względu na fakt, iż pytanie nie ma charakteru retrospektywnego.

Poza wykształceniem rodziców żadna inna nie pozwala opisać sytuacji ekonomicznej i społecznej respondenta i jego rodziny w momencie podejmowania decyzji o wyborze kierunku kształcenia na poziomie wyższym. Nie ma także informacji o umiejętnościach respondenta, które pozwoliłyby mu na „dostanie się” na określony kierunek studiów, ani informacji o wyniku egzaminu maturalnego. Oczekiwane płace oraz prawdopodobieństwo zatrudnienia oszacować można na postawie wysokości płac osób, które dany kierunek ukończyły i posiadały pracę. Miejsce zamieszkania potraktować można jako niedoskonałe przybliżenie istniejącej oferty edukacyjnej. Zmienna dotycząca zamieszkania respondenta w chwili badania może stanowić także przybliżenie informacji o zamieszkaniu studenta w momencie podejmowania decyzji o wyborze kierunku kształcenia, a zatem przybliżać pieniężny koszt związany z podjęciem studiowania. Należy tu nadmienić, iż jest to zasadny, ponieważ w próbie zastosowanej dla regresji wyboru kierunku studiów uwzględniono jedynie respondentów mieszkających z rodzicami.

Ważną słabością bazy BAEL, dotyczącą też wszystkich pozostałych baz, jest brak informacji o cechach przypisywanych przez respondenta każdemu, bądź tylko wybranemu kierunkowi studiów. Nie pozwala to na zweryfikowanie hipotezy o znaczeniu kosztów niepieniężnych (czasochłonność, trudność), ale też

4 Podane odsetki (podobnie jak inne dane o strukturze próby) odnoszą się do bazy z 2010 roku. Struktura późniejszych fal, które również były poddane analizie jest podobna.

59

pieniężnych (koszt dojazdu do uczelni, dostęp do nieodpłatnych podręczników itp.) dla podejmowanych wyborów edukacyjnych.

W przypadku bazy BAEL pewne wątpliwości dotyczą danych o wysokości płac. Po pierwsze, notowany jest stosunkowo wysoki odsetek odmów na pytanie o płacę. Na początku okresu użytego w badaniu (pierwszy kwartał 2004) odsetek tych odmów wynosił 33%, co budzi pewne wątpliwości w odniesieniu do reprezentatywności tych danych. Co więcej, nawet spośród tych, którzy odpowiedzi tej udzielali, mały odsetek udzielał dokładnych odpowiedzi. Pytanie o płacę dotyczyło płacy netto w głównym miejscu pracy. Ponieważ umowy o pracę zawierane są na wynagrodzenie brutto, od którego odlicza się podatki i składki, by uzyskać wynagrodzenie netto, w rzeczywistości dokładne wynagrodzenia netto nigdy nie są okrągłą sumą. Jednak wśród odpowiedzi na to pytanie widać było silną tendencję do zaokrąglania podawanych sum do pełnych tysięcy i setek. Co więcej, wyraźnie można zaobserwować tendencję to spadku precyzji podawanych wynagrodzeń wraz z ich wzrostem. Tego rodzaju fenomen może być jedną z przyczyn występowania heteroskedastyczności błędu losowego obserwowanej dla estymowanych na podstawie BAEL modelach równaniach płac, co powoduje konieczność użycia odpornych macierzy wariancji. Podobne problemy związane z ze stosunkowo wysoką liczbą odmów w odniesieniu do pytania o płace i małej precyzji udzielanych odpowiedzi pojawiają się jednak także w odniesieniu do pozostałych analizowanych baz danych.

Dodatkowym specyficznym dla BAEL problemem jest zmiana sposobu zbierania danych dotyczących płac, która nastąpiła w pierwszym kwartale 2008 roku. We wcześniejszych okresach respondenci podawali wysokość płac bądź odmawiali odpowiedzi na to pytanie. Od 2008 roku, w przypadku odmowy odpowiedzi na pytanie o wysokość płacy, ankieterzy zaczęli zadawać dodatkowe pytanie o przedział, w którym znajdują się zarobki respondenta. Oczywiście na to pytanie także można odmówić odpowiedzi. Co ciekawe, bezpośrednio po wprowadzeniu tej zmiany odsetek respondentów odmawiających podania wszelkich informacji o swoich płacach silnie spadł (do 12%), jednak niestety z czasem wrócił niemal do swojego poprzedniego poziomu (29% w ostatnim kwartale 2013). Równocześnie jednak coraz większy odsetek respondentów zamiast podawać wysokość swoich płac, podawał jedynie przedział, w którym znajduje się płaca (w ostatnim kwartale 2013 udział takich odpowiedzi wyniósł 63%). W efekcie, gdybyśmy zawęzili próbę jedynie do tych odpowiedzi, dla których respondenci podali wysokość płacy, to dla ostatnich fal BAEL-u „straconych” dla badania zostałoby blisko 2/3 dostępnych obserwacji. Z tego powyższego powodu do estymacji równania płac należy użyć tak zwanej regresji przedziałowej. Jest to metoda, która stanowi uogólnienie modelu tobitowego i umożliwia wykorzystanie obserwacji, dla których informacja na temat zmiennej zależnej jest dokładna bądź też dotyczy przedziału, w jakim zmienna ta się znajduje. Przedziały te mogą przy tym być lewostronnie bądź prawostronnie nieograniczone. Zastosowanie tego modelu powoduje jednak, że w przypadku BAEL-u nie można użyć modelu Heckmana, a problem ewentualnej korelacji między czynnikami nieobserwowalnymi w równaniu płac i równaniu partycypacji jest ignorowany. Spowodowane to jest trudnością w zaimplementowaniu odpowiednika modelu Heckmana dla regresji przedziałowej. W równaniu płac poza standardowym wiekiem i wiekiem do kwadratu rozważyć należy umieszczenie także wieku do potęgi trzeciej, ponieważ bez tego rodzaju modyfikacji model może nie przechodzić standardowego testu typu związku (link test), który wykorzystany jest zwykle jako test na poprawność formy funkcyjnej.

Specyficzną trudnością związaną z użyciem danych z BAEL jest złożony sposób, w jaki losowani są respondenci do tej próby. Z opisu tej bazy dostarczonej przez GUS wynika, że jest to próba stratyfikowana po województwach, przy czym proporcjonalnie więcej obserwacji jest losowanych dla województw małych i obserwacji z terenów wiejskich. Losowanymi bez zwracania jednostkami

60

pierwszego stopnia (JPS) są numery rejonów statystycznych, a adresy mieszkań są jednostkami drugiego stopnia, zaś ankiety przeprowadzane są dla wszystkich osób w wieku powyżej 14 lat, zamieszkałych pod danym adresem. Taki schemat losowania powoduje po pierwsze konieczność uwzględnienia nierównych wag obserwacji, po drugie samej stratyfikacji, a po trzecie korelacji czynników nieobserwowalnych wewnątrz grup obserwacji dotyczących osób mieszkających pod tym samym adresem. Co więcej, jednostki losowane dla kolejnych fal BAEL-u częściowo się powtarzają, a struktura próby odpowiada strukturze rotacyjnego panelu. W procesie estymacji uwzględnić można na etapie szacowania parametrów jedynie zróżnicowanie wag poszczególnych obserwacji. Estymatory zastosowane do estymacji równania płac i partycypacji należą będą wówczas do klasy estymatorów pseudo-ML. Korelacje wynikające z panelowej struktury bazy danych oraz korelacji między jednostkami należącymi do jednego JPS uwzględnić należy na etapie szacowania macierzy wariancji. Niestety nie jest możliwe pełne odwzorowanie dwustopniowej procedury doboru jednostek do próby, ponieważ GUS nie udostępnia identyfikatorów rejonów statystycznych.

W dokumencie produkty EE (Stron 57-60)

Powiązane dokumenty