• Nie Znaleziono Wyników

I PODATKÓW DO DZIA- DZIA-àALNOĝCI

3. Propensity Score Matching jako narzĊdzie ewaluacji polityki

3.4. Sposoby áączenia obserwacji

Dysponując dwoma zbiorami obserwacji naleĪących do grupy ekspery-mentalnej lub kontrolnej, przed przystąpieniem do áączenia danych badacz musi podjąü szereg decyzji, rzutujących na uzyskane wyniki. StrawiĔski [2014] wy-róĪnia dwa podstawowe dylematy stojące przez badaczem.

Pierwszą kwestią jest wybór áączenia bez zwracania lub ze zwracaniem.

W pierwszym przypadku jednokrotnie dobrana do pary jednostka z grupy kon-trolnej nie moĪe zostaü ponownie wykorzystana, w drugim z kolei – moĪe ist-nieü wiele jednostek z grupy eksperymentalnej, które zostaną poáączone z tą sa-mą jednostką z grupy kontrolnej.

StrawiĔski [2014] wskazuje, przywoáując pracĊ Dehejia i Wahby [2002], wady stosowania áączenia bez zwracania. Stosowanie takiego podejĞcia moĪe prowadziü do sytuacji, w której poáączone zostaną ze sobą obserwacje „odle-gáe”, a w konsekwencji jednostce z grupy eksperymentalnej zostanie przypisany stan kontrfaktyczny od niepodobnej do niej jednostki z grupy kontrolnej. Badacz jednak musi uwzglĊdniaü, iĪ w przypadku zastosowania áączenia ze zwracaniem istnieje moĪliwoĞü niepoáączenia wszystkich jednostek z grupy kontrolnej, a za-tem niewykorzystania peánej informacji z dostĊpnego zbioru danych. Smith i Todd [2005] podkreĞlają, Īe chociaĪ podejĞcie to zwiĊksza przeciĊtną jakoĞü áączenia, to jednoczeĞnie zmniejsza liczbĊ jednostek w grupie kontrolnej, dla których liczona jest przeciĊtna wartoĞü zmiennej rezultatu w stanie kontrfak-tycznym, co prowadzi do wzrostu wariancji estymatora efektu oddziaáywania.

Jak podaje StrawiĔski [2014], wybór miĊdzy áączeniem bez zwracania a áącze-niem ze zwracaáącze-niem jest zatem ostatecznie wyborem miĊdzy obciąĪeáącze-niem osza-cowania a wysoką wariancją estymatora.

Za drugą konieczną do podjĊcia decyzjĊ uznaje siĊ wybór sposobu áącze-nia grupy eksperymentalnej z kontrolną na podstawie oszacowanego propensity

score29. W podstawowym podziale badacz moĪe zastosowaü áączenie zgrubne (ang. greedy matching) lub optymalne (ang. optimal matching). W przypadku áączenia ze zwracaniem obydwa podejĞcia prowadzą do jednakowych wyników [StrawiĔski, 2014].

àączenie zgrubne polega na losowym wybraniu jednostki z grupy ekspe-rymentalnej, a nastĊpnie dopasowaniu najlepszego odpowiednika do grupy kon-trolnej [StrawiĔski, 2014]. Przykáadowo, jak podają Guo i Fraser [2015], w ra-mach áączenia zgrubnego badacz moĪe zastosowaü: áączenie za pomocą metryki Mahalanobisa, áączenie za pomocą metryki Mahalanobisa z wykorzystaniem propensity score, áączenie najbliĪszego sąsiada, áączenie z odciĊciem, áączenie najbliĪszego sąsiada „wewnątrz” odciĊcia czy áączenie za pomocą metryki Ma-halanobisa „wewnątrz” odciĊcia30.

W przypadku áączenia za pomocą metryki Mahalanobisa losowo wybiera-na jest i-ta jednostka z grupy eksperymentalnej, a wybiera-nastĊpnie obliczane są odle-gáoĞci miĊdzy tą obserwacją a wszystkimi j-tymi jednostkami z grupy niepodda-nej oddziaáywaniu, zgodnie ze wzorem [por. Guo, Fraser, 2015]:

݀ሺ݅ǡ ݆ሻ ൌ ൫ঘെ ঘԧିଵ൫ঘെ ঘ൯ gdzie:

ԧ – macierz kowariancji zmiennych z wektora ঘ dla wszystkich jednostek nie-poddanych oddziaáywaniu31.

Jednostka z grupy niepoddanej oddziaáywaniu, dla której odlegáoĞü ݀ሺ݅ǡ ݆ሻ byáa najmniejsza, zostaje poáączona z i-tą jednostką z grupy eksperymentalnej.

NaleĪy jednak zaznaczyü, Īe w przypadku áączenia na podstawie wielu cech trudno jest zwykle znaleĨü satysfakcjonujące dopasowanie. Rozwiązaniem jest sprowadzenie problemu do jednowymiarowego i zastosowanie áączenia za pomocą metryki Mahalanobisa z wykorzystaniem propensity score.



29 NaleĪy jednakĪe ponownie podkreĞliü, iĪ w miejsce stosowanej przez StrawiĔskiego [2014]

podstawy áączenia, tj. wektora propensity score, badacz ma moĪliwoĞü áączenia obserwacji na podstawie zbioru obserwowalnych charakterystyk.

30 Oprócz wymienionej metryki Mahalanobisa, w przypadku áączenia jednostek na podstawie wartoĞci wielu zmiennych, wykorzystaü równieĪ moĪna m.in. metrykĊ euklidesową, Manhat-tan czy Czebyszewa [por. PaĞko, Setlak, 2015; Sielska, Pawáowska, 2016].

31 Guo i Fraser [2015] zwracają uwagĊ, iĪ w ramach áączenia za pomocą metryki Mahalanobi-sa macierz ԧ moĪe byü róĪnie zdefiniowana. Przykáadowo, D’Agostino [1998] definiuje ԧ jako macierz kowariancji zmiennych z wektora ঘ dla jednostek z grupy kontrolnej, z kolei Abadie i in. [2004] – jako macierz kowariancji zmiennych z wektora ঘ dla jednostek z grupy eksperymentalnej i kontrolnej.

Podczas áączenia za pomocą metody najbliĪszego sąsiada, w pary áączone są obserwacje z grupy eksperymentalnej i kontrolnej, dla których odlegáoĞü miĊdzy propensity score jest najmniejsza. Metryka ta zdefiniowana jest jako [Guo, Fraser, 2015]:

݀ሺ݅ǡ ݆ሻ ൌ ‹

ฮܾ௉ௌሺঘሻ െ ܾ௉ௌ൫ঘ൯ฮ

W skrajnych przypadkach obserwacje i-ta i j-ta mogą zostaü ze sobą poáą-czone, nawet jeĪeli odlegáoĞü ฮܾ௉ௌሺঘሻ െ ܾ௉ௌ൫ঘ൯ฮ bĊdzie duĪa. Aby uniknąü takiej ewentualnoĞci, stosuje siĊ áączenie z odciĊciem. Przyjmuje siĊ wówczas, Īe jako pary mogą byü rozwaĪane jedynie takie jednostki, pomiĊdzy którymi odlegáoĞü nie bĊdzie przekraczaü pewnej przyjĊtej wartoĞci, co zapisaü moĪna jako:

ฮܾ௉ௌሺঘሻ െ ܾ௉ௌ൫ঘ൯ฮ ൏ ߝ gdzie:

ߝ – liczba okreĞlająca „tolerancjĊ” dla áączenia32.

Jak áatwo zauwaĪyü, áączenie z odciĊciem moĪna stosowaü zarówno z dopaso-waniem za pomocą metody najbliĪszego sąsiada, jak i metryki Mahalanobisa.

Wówczas sposób wyboru „podobnych” do siebie jednostek jest taki sam, przy czym zawĊĪony zostaje zbiór jednostek z grupy kontrolnej, które mogą zostaü dopasowane do danej jednostki z grupy eksperymentalnej. Zaznaczenia wymaga jednak, iĪ wybór tego typu áączenia prowadzi do dylematu pomiĊdzy moĪliwo-Ğcią wystąpienia áączenia niekompletnego lub niedokáadnego [Parsons, 2001].

àączenie niekompletne oznacza sytuacjĊ, w której nie wszystkie jednostki z grupy eksperymentalnej znajdują swojego odpowiednika w grupie kontrolnej, z kolei w przypadku áączenia niedokáadnego dopasowane do siebie mogą zostaü jednostki o róĪnych wartoĞciach cech z wektora ঘ lub róĪnych wartoĞciach pro-pensity score. Guo i Fraser [2015] zaznaczają, Īe Īaden z tych wyborów nie jest jednoznacznie najlepszy.

Zaletą áączenia zgrubnego jest moĪliwoĞü podzielenia jednego duĪego problemu decyzyjnego, tj. poáączenia obserwacji, i optymalizacji wielu prost-szych decyzji. Jako wadĊ Rosenbaum [2002] wskazuje natomiast, Īe w danym



32 Rosenbaum i Rubin [1985] sugerują wybór ߝ na poziomie jednej czwartej odchylenia stan-dardowego propensity score liczonego dla caáej próby, przy czym Guo i Fraser [2015] reko-mendują przeprowadzenie analizy wraĪliwoĞci wyników na zastosowanie róĪnych wartoĞci odciĊcia.

momencie optymalizowany jest wybór tylko jednej pary obserwacji, bez uwzglĊdniania przeszáych i przyszáych decyzji odnoĞnie áączenia33.

Swego rodzaju odpowiedzią na uáomnoĞci áączenia zgrubnego jest áącze-nie optymalne, bazujące na teorii przepáywów w sieciach (ang. network flow theory). Jak podaje StrawiĔski [2014, s. 44], celem tej metody jest „minimaliza-cja caákowitej róĪnicy wewnątrz par pomiĊdzy wartoĞciami wektora prawdopo-dobieĔstwa oddziaáywania”. Formalnie, optymalizacji podlega odlegáoĞü zdefi-niowana jako [por. Guo, Fraser, 2015]:

οൌ ෍ ߱ሺȁܫȁǡ ȁܬȁሻߜሺܫǡ ܬ

௦ୀଵ

gdzie:

ݏ ൌ ͳǡ ǥ ǡ  – liczba warstw (poáączonych zbiorów),

ȁܫȁǡ ȁܬȁ – liczba jednostek odpowiednio z grupy eksperymentalnej i kontrolnej w danej warstwie,

߱ሺȁܫȁȁܬȁሻ – funkcja wag34,

ߜሺܫǡ ܬሻ – odlegáoĞü mierzona jako róĪnica w wartoĞciach propensity score lub za pomocą metryki Mahalanobisa.

Wadą áączenia optymalnego jest jednak záoĪonoĞü obliczeniowa, a co za tym idzie – czas potrzebny na wykonanie áączenia [StrawiĔski, 2014].

Zarówno áączenie zgrubne, jak i optymalne opiera siĊ na takim poáączeniu jednostek z grupy eksperymentalnej i kontrolnej, aby róĪnica miĊdzy warto-Ğciami propensity score pozwalaáa na zbalansowanie cech z wektora ঘ miĊdzy tymi jednostkami. Rosenbaum, Ross i Silber [2007] wprowadzili dodatkowo metodĊ tzw. odpowiedniego zbalansowania (ang. fine balance), niewymagającą áączenia obserwacji na podstawie wartoĞci propensity score [Guo, Fraser, 2015].

PodejĞcie to polega na dokáadnym zbalansowaniu zmiennych o charakterze

no-

33 Mimo pewnych sáaboĞci áączenia zgrubnego, zwraca siĊ jednak uwagĊ na fakt, iĪ czĊste stosowanie tego typu podejĞcia, w szczególnoĞci áączenie najbliĪszego sąsiada „wewnątrz”

odciĊcia, wynika z moĪliwoĞci przeprowadzenia w dalszych etapach wszelkiego rodzaju ana-liz wielowymiarowych, tak jak ma to miejsce w przypadku randomizowanych eksperymen-tów [Guo, Fraser, 2015].

34 Rosenbaum [2002] proponuje zdefiniowaü funkcjĊ wag jako:

߱ሺȁܫȁȁܬȁሻ ൌ ȁܫȁȀߙ

߱ሺȁܫȁȁܬȁሻ ൌ ȁܫȁȀߚ lub

߱ሺȁܫȁȁܬȁሻ ൌ ሺȁܫȁ ൅ ȁܬȁሻȀሺߙ ൅ ߚሻ gdzie:

ߙ, ߚ – liczba jednostek odpowiednio w grupie eksperymentalnej i kontrolnej.

minalnym, bez áączenia ze sobą pojedynczych jednostek z grupy eksperymen-talnej i kontrolnej, przy jednoczesnym „bliskim” áączeniu jednostek na podsta-wie wartoĞci propensity score szacowanego na podstapodsta-wie wszystkich zmiennych z wektora ঘ. W praktyce badacz zwykle jednak nie podejmuje decyzji, które po-dejĞcie zastosowaü, tj. áączenie wedáug propensity score, metodĊ najbliĪszego sąsiada, áączenie wedáug metryki Mahalanobisa czy metodĊ fine balance, a ra-czej, z którą z pierwszych trzech metod poáączyü tĊ ostatnią [Guo, Fraser, 2015].