• Nie Znaleziono Wyników

ZASTOSOWANIE MODELU Z EFEKTAMI USTALONYMI Rozważmy przedstawiony w tabeli 4 uproszczony problem dotyczący badania

W dokumencie ZASTOSOWANIE ANALIZY ZAWARTOŚCI (Stron 132-135)

W BADANIU ZACHOWAŃ WYBORCZYCH

ZASTOSOWANIE MODELU Z EFEKTAMI USTALONYMI Rozważmy przedstawiony w tabeli 4 uproszczony problem dotyczący badania

zależności między frekwencją wyborczą a takimi zmiennymi jak stopa bezrobocia w  powiatach (UNEMPL) oraz przeciętne miesięczne wynagrodzenie brutto w powiecie w relacji do średniej krajowej (WAGES).

Tabela 4. Specyfi kacja problemu nr 1

Problem badawczy: weryfi kacja wpływu wybranych zmiennych warunkujących stan gospodarki na poziom frekwencji wyborczej w Polsce w wyborach do Sejmu 2007 i 2011.

Okres badania: wybrano dwie ostatnie elekcje, które zakończyły się zwycięstwem Platformy Obywatelskiej.

Jednostka badawcza: obszar powiatu

Metoda: model regresji z efektami ustalonymi szacowany metodą LSDV

Opis zmiennych: VT – frekwencja wyborcza; UNEMPL – stopa bezrobocia w powiecie; WAGES – przeciętne miesięczne wynagrodzenie brutto w powiecie w relacji do średniej krajowej.

Cele: sprawdzenie, które zmienne społeczno-gospodarcze istotnie oddziałują na poziom frekwencji wyborczej. Ustalenie kierunku zależności między badanymi zmiennymi.

Hipoteza:

H1: wśród zmiennych statystycznie istotnie wpływających na poziom frekwencji wyborczej na poziomie powiatów są stopa bezrobocia (zależność odwrotna) oraz przeciętne miesięczne wynagrodzenie brutto w relacji do średniej krajowej (zależność jednokierunkowa).

Źródło: Opracowanie własne.

Baza danych potrzebna do rozwiązania przedstawionego problemu ma strukturę panelową, dlatego modelowanie zależności między zmiennymi, o których infor-macje znajdują się w bazie, wymaga wykorzystania jednego z modeli dla danych panelowych.

W rozważanym przykładzie wykorzystamy dwie zmienne objaśniające, które mogą wpływać na poziom frekwencji wyborczej (VT) – UNEMPL i WAGES. Celem badania jest sprawdzenie, czy wpływ tych zmiennych na poziom frekwencji wybor-czej jest istotny. Weryfi kacji przyjętego przypuszczenia dokonamy, wykorzystując dane dotyczące wyborów do Sejmu RP w 2007 i 2011 r. oraz dane roczne o warto-ściach zmiennych objaśniających (UNEMPL i WAGES) dla lat poprzedzających daną elekcję – dla lat 2006 i 2010. Jako podstawową jednostkę badawczą przyjęto

obszar powiatu. Wszystkie obserwacje na zmiennych dotyczą 379 powiatów, a zatem mamy dla dwóch badanych lat 379 obserwacji na każdej ze zmiennych.

Należy podkreślić, że chcąc wyczerpująco opisać i wyjaśnić zmienność poziomu frekwencji wyborczej, należy wziąć pod uwagę znacznie większą liczbę istotnych zmiennych i zbudować bardziej złożony model. Czytelnik może spróbować roz-szerzyć katalog zmiennych objaśniających (np. o takie zmienne jak stopa infl acji bazowej netto, poziom przestępczości, PKB per capita, struktura poparcia wybor-czego na dwie największe partie polityczne itp.) i wówczas przeprowadzić estyma-cję parametrów modelu. W ten sposób można sprawdzić, jakie zmienne istotnie wpływały na poziom frekwencji wyborczej lub też były skorelowane z jej pozio-mem. Niemniej w modelowaniu tak skomplikowanych zależności zawsze istnieje znaczne prawdopodobieństwo pominięcia istotnych czynników, co jest dodatko-wym argumentem na rzecz stosowania specjalistycznych modeli dla danych panelowych. Jak wspomniano, modele te pomagają uniknąć obciążenia estymato-rów spowodowanego nieuwzględnieniem ważnych zmiennych objaśniających.

Postać formalna modelu dla rozważanego przykładu jest następująca:

0 1 2 1 2

it it it t it

y  UNEMPL WAGES  B  (7) gdzie:

WAGESit – przeciętne miesięczne wynagrodzenie brutto w powiecie w relacji do średniej krajowej; UNEMPLit – stopa bezrobocia w powiatach; B2t = 1, gdy t = 2 i B2t = 0, gdy t ≠ 2;

μit – błąd czysto losowy.

W celu przeprowadzenia analizy zależności między wskazanymi zmiennymi zbudowano bazę danych zawierającą wszystkie obserwacje na tych zmiennych z lat 2007 i 2011 na poziomie powiatów36. Łączna liczba obserwacji na zmiennych jest więc równa N x T = 379 x 2 = 75937.

Ponieważ w badaniu uwzględniono wszystkie możliwe obserwacje, analiza ma charakter badania pełnego. W tym przypadku elementy badanej próby są tożsame z całą populacją jednostek badawczych (powiaty).

Przed rozpoczęciem estymacji parametrów modelu należy wygenerować zmienną zero-jedynkową.

36 Źródłem danych były strony internetowe Państwowej Komisji Wyborczej, http://pkw.gov.pl/

oraz Banku Danych Lokalnych GUS, http://www.stat.gov.pl/bdl/app/strona.html?p_name=indeks, odczyt z dn. 16.05.2012.

37 Strukturę bazy danych, którą należy zbudować na początkowym etapie badania, przedstawiono wyżej w tabelach 1 i 2.

Pozwoli ona uwzględnić efekty ustalone w wymiarze czasowym (time fi xed eff ects – np. zmiana stanu gospodarki spowodowana kryzysem gospodarczym, zmiana formatu systemu partyjnego), ponieważ istnieje możliwość, że dla poszcze-gólnych okresów mamy dwie różne linie regresji – różnią się wyrazem wolnym.

Tabela nr 5 zawiera wyniki estymacji wygenerowane przez program STATA.

Tabela 5. Wyniki estymacji modelu LSDV opisującego zależność między poziomem zmiennej VT a UNEMPL i WAGES

. reg vt unempl wages _It_2011 /* Instrukcja programu STATA */

Source | SS df MS Number of obs = 758 ---+--- F( 3, 754) = 246.47 Model | 1.67580354 3 .558601179 Prob > F = 0.0000 Residual | 1.70888125 754 .002266421 R-squared = 0.4951 ---+--- Adj R-squared = 0.4931 Total | 3.38468478 757 .004471182 Root MSE = .04761

vt | Coef. Std. Err. t P>|t| [95% Conf. Interval]

unempl | -.4351742 .0288538 –15.08 0.000 –.4918175 -.3785309 wages | .1665537 .0151075 11.02 0.000 .1368959 .1962116 _It_2011 | -.059026 .0035252 -16.74 0.000 -.0659464 -.0521056 _cons | .4375023 .0155454 28.14 0.000 .406985 .4680197

---Źródło: Opracowanie własne na podstawie danych PKW i Banku Danych Lokalnych GUS, http://

www.stat.gov.pl/bdl/app/strona.html?p_name=indeks, odczyt z dn. 16.05.2012.

Jak zinterpretować otrzymane wyniki? Przede wszystkim wybrane zmienne niezależne są statystycznie istotne, a więc włączenie do modelu tych zmiennych jest zasadne. Ponadto, na podstawie otrzymanej postaci równania modelu możemy wnioskować, że wzrost stopy bezrobocia powoduje spadek wartości oczekiwanej frekwencji wyborczej w  danym powiecie (ujemny parametr przy zmiennej UNEMPL), podczas gdy dla relacji między przeciętnym poziomem płac a pozio-mem frekwencji wyborczej zależność jest jednokierunkowa (dodatnia wartość szacowanego parametru przy WAGES). Poza tym potwierdzenie istotności staty-stycznej zmiennej zero-jedynkowej _It_2011 potwierdza zasadność wykorzystania w tym przypadku modelu LSDV.

Podsumowując: stosując przedstawiony model teoretyczny, można potwierdzić lub odrzucić hipotezy dotyczące ewentualnego wpływu wybranych czynników społeczno-politycznych na poziom frekwencji wyborczej lub np. na poparcie

wyborcze dla wybranych partii politycznych. Model regresyjny pomaga zrozumieć i precyzyjnie opisać układ zależności między analizowanymi zmiennymi społecz-nymi. Dlatego, modele regresyjne są użytecznym narzędziem m.in. w badaniu uwarunkowań zachowań wyborczych. Stosując analizę regresji, należy jednak zawsze mieć świadomość, że istnieje możliwość wyboru nieodpowiedniej postaci analitycznej modelu, co może skutkować otrzymaniem błędnych wyników.

W dokumencie ZASTOSOWANIE ANALIZY ZAWARTOŚCI (Stron 132-135)