NOWE METODOLOGICZNE PROPOZYCJE ANALIZ W NAUKACH SPOŁECZNYCH ZE SZCZEGÓLNYM UWZGLĘDNIENIEM DEMOGRAFII

(1)

Sekcja Analiz Demograficznych Komitet Nauk Demograficznych PAN Al. Niepodległości 164

02-554 Warszawa tel/fax: 646-61-38

e-mail: ewaf@sgh.waw.pl

2/2000

NOWE METODOLOGICZNE PROPOZYCJE ANALIZ W NAUKACH SPOŁECZNYCH ZE SZCZEGÓLNYM

UWZGLĘDNIENIEM DEMOGRAFII

Spis treści

Przedmowa.

1. Ewa Frątczak – Nowe metodologiczne propozycje analiz w demografii.

2. Ewa Soja - Analiza historii zdarzeń grup. Rezultaty trwających badań.

3. Aneta Ptak-Chmielewska (SGH, Warszawa) - Analizy wielopoziomowe w naukach społecznych.

4. Alicja Siwek, Małgorzata Kowalska, Małgorzata Szczyt - Analiza tekstowa (statystyka tekstowa).

5. Maciej Rodzewicz - Metody mikrosymulacyjne w prognozowaniu demograficznym.

Zeszyt nr 2. Sekcji Analiz Demograficznych (dokumentacja posiedzeń SAD).

(2)

2

Przedmowa

Sekcja Analiz Demograficznych KND PAN została powołana na posiedzeniu Prezydium Komitetu Nauk Demograficznych Polskiej Akademii Nauk w dniu 23 września 1999 roku. Jest trzecią obok Sekcji Demografii Medycznej i Sekcji Demografii Historycznej sekcją naukową działającą w ramach Komitetu Nauk Demograficznych Wydziału I. Nauk Społecznych - Polskiej Akademii Nauk.

Sekcją Analiz Demograficznych SAD prowadzą : dr hab. Ewa Frątczak (kierownik sekcji) i dr hab. Jolanta Kurkiewicz (z-ca kierownika sekcji).

Głównym zadaniem Sekcji Analiz Demograficznych jest organizowanie spotkań merytorycznych poświęconych szeroko rozumianym metodom analiz demograficznych, włączając najnowsze metody i techniki zarówno organizacji badań jak i metod analiz

opisujących zjawiska i procesy demograficzne ich uwarunkowania i konsekwencje. Podstawą każdej prezentowanej metody w ramach spotkań SAD jest dokładny i gruntowny opis

teoretyczny metody (metod) oparty na możliwie wszechstronnej i najnowszej literaturze wraz z prezentacją zastosowania teorii na danych empirycznych. Prezentacja nowych metod wymagać będzie od referentów zapoznania się ze stosowną literaturą i niemałego nakładu pracy. Dość często upowszechnienie nowej metody i jej zastosowanie wymagać będzie nakładu pracy związanego z zapoznaniem się ze stosownym programem lub pakietem komputerowym umożliwiającym dość sprawną aplikację modelu lub metody. Zatem działania mające na celu informację o programach komputerowych i organizowanie w przyszłości warsztatów szkoleniowych to jedno z kolejnych zadań SAD.

Ogranizatorom Sekcji i osobom prowadzącym SAD zależy na integracji środowiska demograficznego, w tym głownie młodych adeptów nauki wokół zagadnień szeroko

rozumianych analiz demograficznych. Zebrania Sekcji Analiz Demograficznych mogą być również poświęcone prezentacji nowych twórczych metod analiz lub zastosowań metod (modeli) będących wynikami prac doktorskich lub habilitacyjnych ukończonych lub znajdujących się w fazie przygotowywania, na odpowiednim etapie.

Drugie spotkanie Sekcji Analiz Demograficznych KND PAN miało miejsce 19 czerwca 2000 w sali 713, budynek F - Instytut Statystyki i Demografii Szkoły Głównej Handlowej przy Al. Niepodległości 162 w Warszawie, miejsce w którym odbywają się posiedzenia SAD. Wprowadzenie oraz referat na temat „Nowe metodologiczne propozycje analiz w demografii” został wygłoszony przez Kierownika SAD dr hab. Ewę Frątczak.

(3)

3

Niniejszy, drugi numer Zeszytów Sekcji Analiz Demograficznych jest numerem, zawierającym wystąpienia :

- Ewa Soja - Analiza historii zdarzeń grup. Rezultaty trwających badań.

-Aneta Ptak-Chmielewska (SGH, Warszawa) - Analizy wielopoziomowe w naukach społecznych.

- Alicja Siwek - Analiza tekstowa (statystyka tekstowa).

- Maciej Rodzewicz - Metody mikrosymulacyjne w prognozowaniu demograficznym.

Zeszyty SAD przygotowywane są we własnym zakresie, za teksty odpowiedzialni są Autorzy. Prace techniczne związane z końcową obróbką tekstu zostały wykonane przez mgr Anetę Ptak-Chmielewską.

Z nadzieją na upowszechnianie informacji o działalności Sekcji Analiz

Demograficznych KND PAN oraz o formie dokumentacji spotkań w postaci serii Zeszytów Naukowych Sekcji¹.

Kierownik SAD

/ dr hab. Ewa Frątczak /

1Wobec faktu oczekiwania na uzyskanie formalnej zgody na publikowanie Zeszytów Naukowych SAD, mają one formę dokumentacji z kolejnych posiedzeń SAD.

(4)

4

SPIS TREŚCI str.

Nowe metodologiczne propozycje analiz w demografii... 6

Analiza historii zdarzeń grup - Rezultaty trwających badań. ... 7

1. Problemy badania wpływu otoczenia na zachowanie jednostki. ... 7

1.1 Model pseudojednostkowy ... 10

1.2 Model multijednostkowy ... 12

2. Modelowanie interakcji pomiędzy członkami grupy kontaktowej... 13

3. Rezultaty wstępnych badań empirycznych... 15

4. Podsumowanie. ... 20

Analizy wielopoziomowe w naukach społecznych... 21

1. Informacje wprowadzające. ... 21

2. Model analizy wielopoziomowej – założenia ogólne... 23

3. Model analizy wielopoziomowej bez składnika losowego... 24

3.1. Zastosowanie modelu do analizy migracji. ... 24

3.2. Analiza migracji uwzględniająca przepływy międzyregionalne. ... 25

4. Model analizy wielopoziomowej uwzględniający składnik losowy... 29

4.1. Zastosowanie modelu do analizy migracji. ... 31

5. Ograniczenia w zastosowaniu analizy wielopoziomowej do analizy historii zdarzeń. ... 33

6. Podsumowanie. ... 34

7. Tabele i wykresy. ... 35

Statystyczna analiza tekstu (Textual Statistics). ... 52

1. Wprowadzenie. ... 52

2. Metodologia Statystycznej Analizy Tekstowej ... 53

3. Statystyka tekstowa dla celów analizy odpowiedzi na pytania otwarte ... 55

4. Analiza długich tekstów ... 62

4.1 Rozprawy naukowe i wywiady... 62

4.2 Tekst specjalny: dziennik ... 63

(5)

5

5. Podsumowanie ... 65

Metody mikrosymulacyjne w prognozowaniu demograficznym ... 67

1. Wstęp ... 67

2. Porównanie metody makro i mikro symulacyjnej ... 68

3. Zastosowanie mikrosymulacji w prognozowaniu demograficznym. ... 71

4. Zastosowanie mikrosymulacji w prognozowaniu demograficznym... 74

5. Losowość w mikrosymulacji... 75

5.1 Losowość wewnętrzna (związana z metodą Monte Carlo). ... 75

5.2 Losowość populacji początkowej (próby) ... 76

5.3 Losowość sformułowania modelu (zakłócenia modelu). ... 76

6. Inne właściwości charakterystyczne dla mikrosymulacji demograficznej ... 78

6.1 Modele otwarte i zamknięte... 78

6.2 Modele ciągłe i dyskretne. ... 79

6.3 Ryzyko konkurencyjne i zdarzenia złożone... 80

6.4 Zdarzenia powiązane z kilkoma jednostkami ... 80

7. Przegląd istniejących demograficznych modeli mikrosymulacyjnych... 82

8. Omówienie modelu KIMSIM ... 85

9. Wnioski... 88

(6)

6

Dr hab. Ewa Frątczak

Instytut Statystyki i Demografii, Szkoła Główna Handlowa

Nowe metodologiczne propozycje analiz w demografii.

(7)

7

Mgr Ewa Soja

Zakład Demografii, Katedra Statystyki Akademia Ekonomiczna w Krakowie

Analiza historii zdarzeń grup - Rezultaty trwających badań.¹

1. Problemy badania wpływu otoczenia na zachowanie jednostki.

Klasyczna analiza historii zdarzeń w demografii pozwala badać przebieg życia jednostki w czasie. Jednostka w ciągu życia doświadcza wielu zdarzeń, składających się na różne kariery, tworzące jej biografię (rys.1).

Rysunek 1. Klasyczna analiza historii zdarzeń jednostki.

Kariery

rodzinna migracyjna

zawodowa

t

Przebieg życia jednostki

(opisany za pomocą procesów stochastycznych) ••••- zdarzenia

Pytanie:

Jak na ryzyko wystąpienia pewnego zdarzenia w życiu jednostki wpływa zajście innego zdarzenia z jej życia (np. jak na pierwszą migrację wpływa urodzenie dziecka)?

Metody klasycznej analizy historii zdarzeń, wykorzystujące procesy stochastyczne umożliwiają badanie zjawisk i procesów demograficznych dotyczących jednostki. W szczególności pozwalają badać w czasie interakcje jednego lub wielu zjawisk, biorąc

1 Opracowanie przygotowane na podstawie artykułu: Event history analysis of groups. The findings of an on- going research project. E.Lelievre, C. Bonvalet, X. Bry w Population vol. 10 No 1, 1998, str. 11-38.

Prezentowany tekst był przedstawiony przez Autora i dyskutowany na posiedzeniu Sekcji Analiz Demograficznych w dniu 19.06.2000.

(8)

8

równocześnie pod uwagę dużą liczbę charakterystyk jednostki, które mogą być modyfikowane w czasie.

Klasyczna analiza historii zdarzeń pozwoliła efektywnie rozwiązać kilka problemów stawianych w tradycyjnej analizie wzdłużnej. Jednakże analiza historii zdarzeń jednostki nie mogła dać odpowiedzi na pytanie jak zachowania wielu jednostek wpływają na zachowanie wybranej jednostki (ego) i odwrotnie (rys.2).

Rysunek 2. Wzajemne oddziaływanie jednostek na siebie.

Jak grupa jako całość wpływa na „ego”? (i od wrotn ie)

eg o

C K

A B

Jak poszczególne jednostki wpływają na „ego”? (i od wrotnie)

t eg o

A A B

C K T rajekto rie

Poniższe opracowanie przedstawia próbę przejścia z modelowania zdarzeń historii dotyczących jednostki na jej grupę wpływów (grupę kontaktową). Proponowane modele są tak budowane, aby wykorzystać narzędzia klasycznej analizy historii zdarzeń.

Próba definicji nowej jednostki - grupy kontaktowej

Jednym z pierwszych problemów pojawiających się w analizie historii zdarzeń grup jest określenie tych jednostek, które rzeczywiście miałyby wpływ na wybraną jednostkę (ego) i odwrotnie. Wydaje się iż tradycyjne grupy wpływów , takie jak: rodzina , rodzina nuklearna czy też gospodarstwo domowe nie są już wystarczające z wielu względów. Głównie wynika to z tego, iż:

⇒ tradycyjne grupy nie obejmują wszystkich osób bliskich (bierzemy pod uwagę związki między osobami wynikają z pokrewieństwa, ze wspólnego mieszkania lub z przyjaźni),

⇒ tradycyjne grupy nie pozwalają na analizę ewolucji powiązań (sieci związków) między wszystkimi jednostkami w czasie, np.: problem rozwodów – którą gałąź rodziny śledzić, problem innych niż tradycyjne więzi rodzinne- np. wolne związki

(9)

9

Dlatego istnieje potrzeba powstania nowej jednostki statystycznej, która zastąpiłaby dotychczasowe, tradycyjne jednostki (grupy wpływów) i równocześnie spełniłaby nowe wymagania.

Zaproponowano następującą definicję grupy kontaktowej:

Grupa kontaktowa stanowi kombinację wszystkich członków różnych gospodarstw domowych, do których należała jednostka (ego) w ciągu swojego życia wraz z kluczowymi członkami rodziny, którzy nie mieszkali z jednostką i niekoniecznie związani byli pokrewieństwem

Tak zdefiniowana grupa zachowuje dwie fundamentalne cechy rodziny: pokrewieństwo oraz współzamieszkiwanie. Jest ona również wyznaczona jednoznacznie, co wynika ze zorientowania grupy na „ego” (grupa ukonstytuowana na „ego” ).

Modelowanie grupy kontaktowej.

Dla potrzeb empirycznych badań oraz do budowania modeli użyteczne jest zdefiniowanie następujących pojęć:

minimalna grupa kontaktowa – należą do niej:

• wszyscy członkowie gospodarstw domowych, do których należała jednostka,

• dzieci jednostki (nie mieszkające razem),

• współmieszkający partner.

pozycja jednostki - opisana przez fakt, że jest się:

• rodzicem,

• częścią pary,

• samotnym.

typy kohabitacji:

proste:

• mieszkanie z rodzicami

• mieszkanie z partnerem,

• mieszkanie z dziećmi,

• mieszkanie samemu.

(10)

10 złożone:

• kombinacje prostych typów z uwzględnieniem współzamieszkiwania z osobami niespokrewnionymi

W modelowaniu grup kontaktowych są wykorzystane metody i miary klasycznej analizy historii zdarzeń jednostki (procesy stochastyczne). Zaproponowano dwa uzupełniające się modele: model pseudojednostkowy oraz model multijednostkowy. Opisują one wzajemne oddziaływanie jednostki „ego” z jej grupą kontaktową (Rys.2).

1.1 Model pseudojednostkowy

W modelu pseudojednostkowym grupa traktowana jest jako złożona jednostka - (pseudojednostka), charakteryzowana przez swoją strukturę (skład), która zmienia się w czasie.

Struktura opisana jest przez wektor charakterystyk reprezentujący:

1) egzogeniczne zmienne kolektywne np. typ kohabitacji (wyznaczony min. przez pozycję jednostki „ego”), rozmiar grupy ,

2) zmienne endogeniczne opisujące poszczególnych członków grupy.

W przypadku zmiennych endogenicznych pojawia się problem "równoważnych" członków grupy, tj. osób mających równoważną pozycję (równoważność uwarunkowaną socjologicznie i demograficznie). Osoby takie są reprezentowane przez tzw. "syntetycznego członka"

opisanego wspólną charakterystyką.

Przykład:

Badając determinanty migracji rodziny, można ją opisać jako:

(matka, ojciec, {dzieci}) lub ({rodzice},{dzieci}),

gdzie {dzieci} stanowią syntetycznego członka, reprezentującego poszczególne dzieci (zostały one zagregowane i opisane wspólnymi charakterystykami takimi jak: liczba dzieci, liczba dzieci przed migracją, piramida wieku dzieci...). Analogicznie w drugim przypadku matka i ojciec zostali zastali zastąpieni wspólnym reprezentantem {rodzice}.

Struktura (skład) grupy w modelu pseudojednostkowym zmienia się w czasie. Zmiany te zachodzą w czasie (t, t+1) i są obserwowane poprzez "wyjścia" i "wejścia" członków grupy („wejścia i wyjścia” są realizacjami zdarzeń doświadczanych przez jednostki).

(11)

11

Zdarzenia doświadczane przez poszczególne jednostki (indywidualne zdarzenia) w grupie są traktowane jako warianty pewnego kolektywnego zdarzenia – w związku z tym badany jest w czasie tzw. kolektywny proces np. dekohabitacja dzieci.

Obserwowane zmiany w strukturze opisuje wektor charakterystyk, reprezentujący zmienne egzogeniczne i endogeniczne.

1) Zmiany w zmiennych kolektywnych (typ kohabitacji, rozmiar) dokonują się poprzez np.

zmianę pozycji „ego” np. urodzenie dziecka przez samotną matkę, odejście partnera (zgon, rozwód, separacja),

2) W przypadku zmiennych endogenicznych opisujących poszczególnych członków grupy pojawia się tzw. problem obcięcia (censoring) kolektywnego procesu przez jednostkowy (indywidualny) proces.

Przykład:

Badając kolektywny proces dekohabitacji dzieci w grupie (matka, ojciec, {dzieci}), powstaje problem „wyjścia” kolejnego dziecka. Można modelować go za pomocą ryzyk konkurencyjnych (model ryzyk konkurencyjnych).

W modelu pseudoindywidualnym występuje również problem wyboru skali czasu.

Pamiętając o tym, iż zdarzenie kolektywne jest realizacją zdarzeń jednostkowych (kilku), można wybrać:

• pojedynczą skalę czasu (wspólny kolektywny czas),

• kilka skal czasu

Najczęściej wybiera się pojedynczą skalę czasu, a specyficzne czasy członków grupy można włączyć do zmiennych w modelu (np. w semiparametrycznym modelu)

Przykład: dekohabitacja dzieci

• kolektywny czas – liczony od momentu zawarcia małżeństwa przez parę

• specyficzne (jednostkowe) czasy - wiek dziecka w chwili odejścia

Wybierając więcej niż jedną skalę czasu, napotykamy na problem ograniczenia ilości skal („kilka” musi być ograniczone), aby była możliwość konstrukcji estymatorów. Jednakże z góry nie wiadomo jaka jest wielkość grupy kontaktowej (dobierając jednostkę –„ego” do próby nie możemy wykorzystywać wiadomości o niej –o rozmiarze jej grupy wpływów).

(12)

12

Podsumowując model pseudojednostkowy jest dobry we wstępnej fazie badań. Daje

"spojrzenie z góry" na grupę (rys.2) - pozwala zobaczyć ogólną strukturę grupy, jej zmiany w czasie, przez co lepiej opisać badane zjawisko. Jednak aby analizować interakcje pomiędzy jednostkami należy spojrzeć "od wewnątrz"- „do środka grupy” (rys.2). Prowadzi to do modelowania multijednostkowego- do modelu multijednostkowego.

1.2 Model multijednostkowy

Model multijednostkowy angażuje do badania wszystkie trajektorie osób należących do grupy kontaktowej i pozwala opisać relacje między nimi. Model opisany jest jako wielowymiarowy proces stochastyczny, przy użyciu funkcji gęstości, przeżycia, dystrybuanty, ryzyka oraz ich brzegowych i warunkowych wersji.

Kluczowym problemem w budowie tego modelu jest określenie zależności między trajektoriami poszczególnych członków grupy wpływów. W przypadku klasycznej analizy jednostki istnieje niezależność między jednostkami, jednak w analizie grupy zostaje utracona stochastyczna niezależność. Problem niezależności próbuje się rozwiązać poprzez odpowiednie uwarunkowanie zmiennych, aby otrzymać pewną lokalną niezależność. W tym celu definiuje się zdarzenie brzegowe:

Zdarzenie brzegowe: zdarzenie zaobserwowane na jednostkowej (indywidualnej) trajektorii członka grupy kontaktowej.

Rodzaje zależności pomiędzy procesami wywołującymi zdarzenia brzegowe wynikają ze źródeł wywołujących te zdarzenia. Można wyodrębnić dwojakiego rodzaju zależności:

1) Zależność jawną - wywołaną przez obserwowalne źródła będące czynnikami, które koduje się jako zmienne egzo i endogeniczne), np. odejście jednego członka gospodarstwa domowego może zmienić ryzyko migracji rodziny, czy ryzyko dekohabitacji innych członków, „odejście"- jest obserwowalne.

2) Zależność niejawną - źródła wywołujące zależność są niejawne – czynników tych nie można zidentyfikować, są zmiennymi ukrytymi nieobserwowalnymi, np. wspólna tendencja do częstej migracji przez rodzinę.

(13)

13

2. Modelowanie interakcji pomiędzy członkami grupy kontaktowej

Hipoteza o lokalnej warunkowej niezależności.

Zależność jawna.

Jeżeli wszystkie źródła zależności zostaną zidentyfikowane i zakodowane w postaci zmiennych, to wtedy warunkowo do tych zmiennych ryzyko pojawienia się indywidualnego zdarzenia, można traktować jako czysto jednostkowy hazard, niezależny od pozostałych.

Przykład:

Fakt znalezienia zatrudnienia w czasie t przez dwóch bezrobotnych rodziców, jest traktowany jako dwa zdarzenia, które podlegają niezależnym hazardom.

Ze względu na problem tzw. nieobserwowalnej heterogeniczności, powinno się jednak testować zakładaną hipotezę. o lokalnej niezależności.

Zależność niejawna:

Jeżeli oprócz jawnych źródeł zależności istnieją źródła niejawne można wykorzystać modele (Clayton,1978; Oakes,1989), bazujące na wspólnym dla różnych członków grupy nieobserwowalnym czynniku ryzyka. W tym przypadku pojawiają się jednak pewne problemy:

• model wymaga parametrycznego modelowania wspólnego czynnika, ale trudno jest dobrać pasujący rozkład parametryczny, gdy nie znana jest natura źródła zależności,

• trudno twierdzić, że wspólny czynnik ryzyka odpowiada za podstawowy rodzaj zależności.

W takiej sytuacji potrzeba bardziej ogólnego modelu. Wydaje się, iż rozwiązaniem jest poszukiwanie sposobu rozdzielenia brzegów od ich struktury zależności (poszukiwanie informacji o efektach brzegowych).

Modele wykorzystujące hipotezę o lokalnej warunkowej niezależności, pozwalają badać interakcje pomiędzy jednostkami, tak jakby były one niezależne (zależność jest uwzględniona poprzez zmienne). Do konstrukcji i estymacji tych modeli stosuje się narzędzia analizy ekonometrycznej, w szczególności bazuje się na formule Jacod’a (Anderson (1993)):

(14)

14 Niech

X – oznacza proces stochastyczny, taki, że

] T , 0 [

)}t

t ( X {

X= _∈ ₍₁₎

Niech

x - oznacza trajektorię grupy, będącą realizacją procesu:

] , 0

)} [

(

{x t _t _T

x= _∈ (2)

Gęstość prawdopodobieństwa trajektorii, warunkową do punktu wyjścia można zapisać:

∈∏ =

=

] T , 0 ( t

) t , 0 [ x ) t , 0 [ X

| ) t (

X (x(t))

dP ))

0 ( x ) 0 ( X

| x X (

P (3)

Hipoteza lokalnej warunkowej niezależności prowadzi do grupy modeli „szoku”, wśród których szczególnie użyteczne są modele semiparametryczne.

Przykład:

Rozważmy parę małżeńską, dla której możemy badać jak zmieni się ryzyko śmierci partnera na skutek „szoku” wywołanego odejściem (śmiercią, rozwodem, separacją) drugiego partnera.

Dla każdej jednostki ryzyko to opiszemy używając modelu Coxa. Każdy indywidualny model jest uwarunkowany w odniesieniu do objaśniających charakterystyk ryzyka (zmienne z, y).

Niech:

z - zmienna egzogeniczna opisująca jednego partnera

y – zmienna endogeniczna, będąca funkcją kodującą, czy partner doświadczył zdarzenia Dla pierwszego partnera:

) y z

exp(

) t ( h ) y , z

| t (

h₁ ₁ ₂ = ₀₁ β₁ ₁ +γ₂ ₂ ⁽⁴⁾

(15)

15 gdzie:

)

01(t

h jest niewyspecyfikowaną parametrycznie funkcją czasu (tzw. baseline hazard) Analogicznie dla drugiego partnera:

) y z

exp(

) t ( h ) y , z

| t (

h₂ ₂ ₁ = ₀₂ β₂ ₂ +γ₁ ₁ (5) Ryzyko śmierci pierwszego partnera przedstawia się następująco:

jeśli

2 =0

y co oznacza, że drugi partner „nie odszedł” (nie doświadczył zdarzenia) to:

) z exp(

) t ( h ) 0 , z

| t (

h₁ ₁ = ₀₁ β₁ ₁ (6) jeśli

2 =1

y co oznacza, że drugi partner „odszedł” (doświadczył zdarzenia), ryzyko śmierci pierwszego partnera wzrosło, nastąpił efekt szoku

to

2 1

1 01

2 1 1 01

1

1(t|z ,1) h (t)exp( z ) h (t)exp( z )expγ

h = β +γ = β (7)

3. Rezultaty wstępnych badań empirycznych.

Wydaje się, iż modele szoku są bardzo obiecujące, jednak metodologia zależy od danych. Jednak do tego czasu nie zebrano zbioru danych, które zawierałyby informacje o trajektoriach grup kontaktowych (zdefiniowanych tutaj). Niemniej dokonano prób przybliżenia i rozjaśnienia koncepcji grupy kontaktowej wykorzystując dane z dwóch francuskich badań retrospektywnych. Były to badania przeprowadzone przez INED.

Pierwsze z nich „Population and Depopulation of Paris” zostało przeprowadzone w 1986 roku i dotyczyło zaludnienia i wyludnienia Paryża. Wśród 2000 Paryżan w wieku 50 do 60 lat (generacje z 1926 do 1935 roku) zebrano informacje o strukturze gospodarstw domowych, do których należały jednostki w ciągu swojego życia. Badanie to służyło do opisu ewolucji grupy domowej (minimalnej grupy kontaktowej) w trakcie trwania życia jednostki.

Drugie z badań „Close friends and relatives” przeprowadzono w 1990 roku na reprezentatywnej próbie dorosłej populacji Francuzów. Pozwoliło ono oszacować sieć przyjaciół i krewnych jednostki w pewnym momencie jej życia.

(16)

16

Badania te przyczyniły się do lepszego zrozumienia koncepcji grupy kontaktowej, potwierdziły potrzebę porzucenia tradycyjnych grup wpływu (gospodarstwa domowego, rodziny) do opisu ewolucji socjalno- demograficznych struktur. Tabele 1-3 dotyczą pierwszego badania, a dane w tabeli 4 i 5 pochodzą z drugiego badania.

Tablica 1. Struktura gospodarstw domowych, do których należeli respondenci w czasie swojego życia

Wiek respondenta (w latach) Typ gospodarstwa

25 35 45 55

Osoby mieszkające samotnie 18,7 10,1 10 16,1

Rodziny nuklearne:

• pary bez dzieci 16,8 9,4 11,6 34,2

• pary z dziećmi 29,8 65,3 65,5 38,4

Rodziny z jednym rodzicem 2,5 4,5 5,9 5,4

Rodziny złożone

• pary bez dzieci z dziadkami lub rodzeństwem

2,9 0,7 0,8 1,4

• pary z dziećmi z dziadkami lub rodzeństwem

5,9 5 3,3 2

• osoby samotne z rodzicami 21,9 4,4 2,4 1,7

• inne złożone rodziny 1,5 0,8 0,5 0,7

Razem 100 100 100 100

Źródło: Badania (Population and Depopulation of Paris)

Tablica 2. Przebywanie w różnych typach gospodarstw domowych do 50 roku życia

Typ gospodarstwa domowego Mężczyźni Kobiety Razem

Osoby mieszkające samotnie 55% 38% 46%

Pary bez dzieci 73% 73% 73%

Pary z dziećmi 80% 80% 80%

Rodziny niepełne 7% 24% 16%

Rodziny złożone 49% 43% 46%

Liczba osób 989 998 1987

(17)

17

Przykładowo (Tab.2), zauważmy iż prawie połowa respondentów (46%) mieszkała kiedyś w rodzinie złożonej, a w oficjalnych statystykach są to tylko marginalne udziały.

Widać, że ten typ kohabitacji był istotny dla badanej populacji. Jednak sam typ kohabitacji nic nie informuje o rozmiarze grupy domowej (typ kohabitacji i rozmiar były zmiennymi kolektywnymi opisującymi strukturę w modelu pseudojednostkowym).

Tablica 3. Średnia liczba osób w gospodarstwach domowych respondentów Wiek (w latach) Liczba osób

25 3,0

30 3,4

35 3,7

40 3,8

45 3,6

50 3,1

55 1,9

Dane w Tab.3 obrazują ewolucję w rozmiarze grupy domowej (gospodarstwa domowego). Należy pamiętać że są to wielkości średnie. Ogólnie wywnioskowano, że średnia liczba osób mieszkająca z respondentem w trakcie jego dorosłego życia wyniosła 4,9. Dla osób, które nigdy nie wchodziły w związki małżeńskie wielkość ta wyniosła 3, a dla małżeństw (w chwili badania) 5. Jak widać badania te pozwoliły wstępnie oszacować wielkość minimalnej grupy kontaktowej oraz pokazały jej ewolucję w trakcie życia jednostki.

Drugie badanie (Bliscy i krewni) pokazuje znaczenie rodziny rozszerzonej. Składają się na nią bezpośrednia rodzina „ego” i partnera „ego” (rodzice i dzieci) oraz krewni „ego” i partnera„ego”. Oszacowano ,że średnia liczba poszerzonej rodziny (w danym punkcie czasu) wyniosła dla młodych par 63 osoby, a dla starszych 46 osób, co sugeruje, że sieć powiązań maleje z wiekiem jednostki. Rozmiar rodziny bezpośredniej waha się między10 a 20 osobami bez względu na wiek, płeć i typ gospodarstwa domowego. Jednak liczba osób w sieci nie informuje o naturze związków i powiązań (czy są one bliskie, przyjacielskie etc.).

Stwierdzono, że średnia liczba osób opisana jako bliscy (przyjaciele i krewni) wyniosła 8,1, w tym 4,9 to krewni (związki pokrewieństwa), a 3,2 to niespokrewnieni przyjaciele. Dla par w wieku 35-49 lat bezpośrednia rodzina stanowiła 86% grupy, dla samotnych mężczyzn w tym

(18)

18

samym wieku wielkość ta wyniosła 80%, a dla kobiet 73%. Wyniki te potwierdzają raz jeszcze potrzebę skonstruowania nowej jednostki.

Tablica 4. Sieć powiązań według wieku i typu gospodarstwa domowego w badaniach

„Close friends and relatives” (podane liczby są wielkościami średnimi liczby osób)

Sytuacja w czasie badania

Wiek (w latach) Pary Samotni

mężczyźni

Samotne kobiety

Rodziny z jednym rodzicem Najbliższa rodzina

(rodzice, dzieci, rodzeństwo „ego” i „ego” partnera)

poniżej 35 17,7 10,0 8,6 14,4

35-49 18,5 11,1 9,0 15,3

50-64 18,0 10,5 12,7 15,9

powyżej 64 18,5 9,9 14,1 23,7

Członkowie rodziny opisani jako bliscy

poniżej 35 6,3 3,9 3,8 3,3

40-49 5,4 3,3 2,7 4,6

50-64 5,1 2,8 4,1 4,4

powyżej 64 4,9 2,8 3,5 5,2

Źródło: Bonvalet (1993)

Obserwując wyniki podane w Tab.5 wyraźnie widać demograficzną historię zdarzeń grupy kontaktowej: dzieci zastępują dziadków, a potem wnuki rodziców. Na podstawie tych danych można wyobrazić sobie, jak mogłaby wyglądać trajektoria grupy kontaktowej w zależności od kariery małżeńskiej jednostki, np. kobiety. Rozważmy przypadek kobiety, która wychodzi za mąż w wieku 35 lat, wychowuje dzieci, rozwodzi się w wieku 50 lat i zostaje sama w domu w wieku 68 lat, gdy jej najmłodsze dziecko opuszcza dom. Wielkość jej grupy kontaktowej zmienia się następująco: gdy jest niezamężna średnia liczba osób wynosi około 3.7, prawie że podwaja się (6.65) w wieku 35-50 wraz z dołączeniem do jej grupy wpływów dzieci oraz jej partnera wraz z jego rodziną. W momencie rozwodu rozmiar (6.96) jej grupy nie zmniejsza się, lecz z wiekiem wzrasta do około 10 osób. Podobnie można rozważać inne ścieżki życia.

(19)

19

Tablica 5. Sieć powiązań według wieku i typu kohabitacji wyspecyfikowanej grupy wpływów w badaniach „Close friends and relatives” (podane liczby są wielkościami średnimi liczby osób)

Wiek respondentów w latach

20-34 35-49 50-64 powyżej 64

Najbliższa rodzina pary

Partner 1,0 1,0 1,0 1,0

Dzieci 1,17 2,22 2,5 2,69

Matka i ojciec ego 1,87 1,42 0,57 0,07

Dziadkowie „ego” 0,83 0,25 - -

Matka i ojciec partnera 1,75 1,4 0,58 0,13

Dziadkowie partnera 0,77 0,23 0,03 0,02

Wnuki - 0,13 1,9 4,29

Razem 7,39 6,65 6,58 8,2

Najbliższa rodzina mężczyzny mieszkającego samotnie

Partner 0,24 0,62 0,52 0,06

Dzieci 0,03 0,85 1,58 1,32

Matka i ojciec ego 1,95 1,38 0,56 -

Matka i ojciec partnera 0,38 0,7 0,51 -

Dziadkowie partnera 0,13 0,03 - -

Wnuki - - 1,09 2,49

Razem 3,58 3,83 4,26 3,87

Najbliższa rodzina kobiety mieszkającej samotnie

Partner 0,18 0,29 0,25 0,06

Dzieci 0,0 0,2 1,67 1,93

Matka i ojciec partnera 0,22 0,24 0,32 0,04

Dziadkowie partnera 0,02 0,07 - -

Wnuki - 0,05 2,22 3,98

Razem 3,74 2,43 5,0 6,03

Najbliższa rodzina samotnego rodzica

Partner 0,81 0,8 0,52 0,11

Dzieci 1,44 2,3 3,32 3,87

Matka i ojciec partnera 1,2 0,96 0,4 -

Dziadkowie partnera 0,25 0,06 2,06 -

Wnuki - 0,06 - 5,9

Razem 6,67 5,82 6,96 10,03

Źródło: Badania (Close friends and relatives)

(20)

20

4. Podsumowanie.

Podsumowując można stwierdzić, że trudno zrozumieć fazy przebiegu życia jednostki (takie jak opuszczenie domu rodzinnego, formowanie pary, rozpad rodziny) bez ich odniesienia do rodziny i grupy osób bliskich, czyli do grupy kontaktowej jednostki. Prace badawcze nad modelowaniem multijednostkowym i ich zastosowanie do dostępnych danych powinny umożliwić pełną analizę informacji zebranych w przyszłych retrospektywnych badaniach obejmujących już właściwą grupę kontaktową. Modele pozwolą opisać wpływ grupy kontaktowej na socjalne, społeczne i demograficzne zachowanie jednostki, co ujawni istniejące wzorce zachowań w społeczeństwie.

Streszczenie

Opracowanie poniższe przedstawia w skrócie najnowsze badania związane z modelowaniem przebiegu życia grupy powiązanych ze sobą jednostek. Na wstępie omówiono niektóre problemy związane z badaniem wpływu otoczenia na zachowanie jednostki. Następnie zaproponowano definicję nowej jednostki statystycznej – grupy kontaktowej. W dalszej części ogólnie przedstawiono dwa podejścia w modelowaniu tej grupy – model pseudojednostkowy oraz model multijednostkowy. Na zakończenie zaprezentowane zostały niektóre rezultaty wstępnych badań empirycznych związanych z koncepcją grupy wpływów jednostki.

(21)

21

Mgr Aneta Ptak-Chmielewska Instytut Statystyki i Demografii Szkoła Główna Handlowa.

Analizy wielopoziomowe w naukach społecznych.¹

1. Informacje wprowadzające.

W demografii jako dyscyplinie naukowej współpracującej z socjologią i innymi dyscyplinami, popularne są analizy na poziomie zagregowanym. Przeprowadzanie tego typu analiz jest możliwe przy założeniu jednorodności badanej zbiorowości pod względem badanego zjawiska.

W przypadku analiz przeprowadzanych na zagregowanym poziomie uzasadnione jest ograniczenie analizy do znalezienia zależności pomiędzy klasycznymi wskaźnikami demograficznymi dotyczącymi rozpatrywanego zjawiska a średnimi charakterystykami obliczanymi dla tych zbiorowości a nie do indywidualnych charakterystyk. W przypadku migracji uzasadnione wydaje się powiązanie współczynników migracji dla regionów ze stopą bezrobocia, średnimi dochodami itp. dla tych regionów.

Zagregowane charakterystyki które mogą być wyznaczone w takich przypadkach są interpretowane jako ograniczenia wynikające z przynależności do danej zbiorowości i wpływające na zachowania jej członków. Tego typu analizy mogą na przykład odkryć pozytywne powiązania pomiędzy stopą bezrobocia a współczynnikiem emigracji.

Istnieje jednak bardzo duże ryzyko popełnienia błędu w interpretacji takich wyników.

Błąd określany jako „ecological fallacy” polega na błędnym zinterpretowaniu wyników w odniesieniu do jednostki przy wykorzystaniu wyników uzyskanych na poziomie zagregowanym. Dodatnia zależność pomiędzy stopą bezrobocia a współczynnikiem migracji dla danego regionu nie oznacza, iż jednostki które są bezrobotne mają większe

1 Opracowanie przygotowane na podstawie artykułu: ”Multilevel anaysis in the social sciences”, D. Courgeau, B. Baccaiini w Population vol. 10 No 1, 1998, str. 39-72. Prezentowany tekst był przedstawiony przez Autora i dyskutowany na posiedzeniu Sekcji Analiz Demograficznych w dniu 19.06.2000.

(22)

22

prawdopodobieństwo wyemigrowania z danego regionu ale oznacza jedynie iż wysokiej stopie bezrobocia w regionie towarzyszy wysoki współczynnik emigracji. Problemem tym zajmował się m.in. Robinson, który w 1950 roku wykazał iż zależność pomiędzy dwoma charakterystykami jest różna w zależności od poziomu agregacji. Dla przykładu (USA 1930) zależność pomiędzy byciem czarnym i analfabetą wyznaczona dla dziewięciu regionów geograficznym wykazała 0,95 natomiast na poziomie indywidualnym zależność ta wynosiła zaledwie 0,20. Dalsze badania w tej dziedzinie wykorzystały liniową i logistyczną regresję ale wyniki zawsze były takie same. Zagregowane analizy danych były odpowiedzialne za błędy w próbach wnioskowania na ich podstawie o zachowaniach jednostki. Rozbieżności są tym większe im bardziej wariancja wewnątrz grupowa przewyższa wariancję międzygrupową.

Wszystkie te nieścisłości spowodowały konieczność przeprowadzania analizy na poziomie indywidualnym. Odpowiedzią był rozwój analizy historii zdarzeń oraz badań zbierających dane, dotyczące wydarzeń z każdej dziedziny z życia jednostki, wykorzystywane w tej analizie. Cykl życia jednostki jest traktowany jako proces stochastyczny: w ciągu życia jednostka podlega procesowi który w dowolnym momencie jest zależny od dotychczasowego przebiegu kariery do danego momentu, informacji zebranych w przeszłości oraz warunków panujących w środowisku do którego przynależy dana jednostka. Celem tej analizy jest powiązanie zachowania danej jednostki z charakterystykami jej odpowiadającymi.

Charakterystyki te mogą być stałe niezależne od czasu np. miejsce urodzenia, liczba rodzeństwa itp., lub zależne od czasu które określają główne stany w jakich może znajdować się jednostka w ciągu całego cyklu. Najważniejsze w tej analizie jest: niejednorodność zbiorowości oraz zależności pomiędzy różnymi zjawiskami demograficznymi.

Dla przykładu analiza prawdopodobieństwa wyemigrowania z danego regionu zawierać będzie fakt bycia bezrobotnym, wysokość dochodów itd. Dodatkowo można uwzględnić zmienne stałe jak np. miejsce urodzenia dla sprawdzenia możliwości powrotu jednostki która wcześniej wyemigrowała.

W analizie na poziomie jednostki istnieje jednak możliwość popełnienia błędu w interpretacji wyników tzw. „atomic error”. Błąd ten jest związany z interpretacja wyników dotyczących jednostki w oderwaniu od środowiska do którego dana jednostka przynależy.

Jednostka podlega ograniczeniom narzuconym przez środowisko i czas do którego przynależy.

Poruszone powyżej dwa rodzaje błędów związanych z analizą na poziomie zagregowanym i z analizą na poziomie jednostki narzucają konieczność podjęcia analiz na wielu różnych poziomach agregacji równocześnie („Multilevel Analysis”).

(23)

23

Analiza wielopoziomowa pozwala na wyeliminowanie błędu „ecological fallacy”

ponieważ charakterystyki zagregowane są wykorzystywane do pomiaru konstrukcji odmiennych od konstrukcji wykorzystywanych jako ich ekwiwalent na poziomie jednostki.

Błąd „atomic fallacy” jest również wyeliminowany ponieważ kontekst w jakim ujmowana jest jednostka jest prawidłowo ujęty w analizie.

Rozwój bazy danych wykorzystywanych w analizie wielopoziomowej w ostatnich latach pozwolił na zastosowanie tej analizy w wielu różnych dziedzinach jak np.:

epidemiologia, edukacja, geografia ludzkości, socjologia, ekonomia i demografia.

2. Model analizy wielopoziomowej – założenia ogólne.

Analizy wielopoziomowe mają na celu pokazanie na jakie różnorodne sposoby charakterystyki: indywidualne i zagregowane, mogą wpływać na zachowanie jednostki przynależnej do każdej ze stref.

Analiza skoncentrowana jest na jednostce ponieważ to jednostki tworzą różne stopnie agregacji. Nie eliminuje to jednak wpływu zagregowanych zbiorowości (środowisk) na jednostki, ponieważ jednostka zachowuje się jednak odmiennie niż zachowywałaby się gdyby te ograniczenia nie istniały.

Podstawowe charakterystyki indywidualne wykorzystywane w tego typu analizach mogą mieć charakter binarny: np. fakt bycia zamężnym lub nie; albo charakter ciągły: np.

dochód jednostki. Charakterystyki opisowe mogą być bardziej lub mniej złożone. Wychodząc od charakterystyk prostych typu bycie zamężnym lub nie, można przejść do następnego stopnia agregacji poprzez wyznaczanie charakterystyk średnich np. procent zamężnych w danym regionie, lub zastosować bardziej skomplikowane procedury jak np. przy wyznaczaniu dochodu i równocześnie wyznaczyć odchylenie standardowe dochodu.

Charakterystyki globalne dotyczą całościowych jednostek jak np. gęstość zaludnienia lub liczba łóżek w szpitalach. Charakterystyki te nie są powiązane z charakterystykami indywidualnymi nie dotyczą żadnej konkretnej jednostki indywidualnej. Mogą one być agregowane w zależności od potrzeb według np. różnych jednostek administracyjnych.

Inna grupę stanowią charakterystyki, które są przypisane do konkretnego stopnia agregacji i nie mogą być dowolnie agregowane np. polityczna orientacja środowiska (commune).

Analizy wielopoziomowe wymagają zdefiniowania poziomów agregacji jak również struktury zorganizowania tych poziomów. Do najprostszych i najczęściej

(24)

24

stosowanych należy struktura hierarchiczna w której każdy kolejny poziom powstaje ze zgrupowania jednostek z poprzedniego poziomu. Innym typem agregacji jest agregacja poprzeczna (cross-classyfication) który może tworzyć podział np. miast na miasta:

turystyczne i przemysłowe itp. Istnieje oczywiście możliwość utworzenia agregacji składanej która zawiera zarówno podział hierarchiczny jak i poprzeczny równocześnie.

3. Model analizy wielopoziomowej bez składnika losowego.

Wyjściowa forma modelu zawiera analizę wpływu charakterystyk indywidualnych i na różnych poziomach agregacji na zachowania jednostek bez uwzględnienia składnika losowego. Jako przykład posłużyła analiza regionalnych migracji w Norwegii przeprowadzona w 1996 roku przez B. Baccaini i D. Courgeau. W modelu wykorzystane były dwa rodzaje analiz:

- regresja wykładnicza do modelowania współczynników migracji dla regionów,

- model logitowy i modele analizy historii zdarzeń do estymacji indywidualnych ryzyk migracji w odniesieniu do charakterystyk regionalnych i indywidualnych.

3.1. Zastosowanie modelu do analizy migracji.

Dane wykorzystane do modelowania migracji prezentowane w artykule D. Cougeou pochodziły z dwóch źródeł: rejestru bieżącego ludności który został w 1964 roku scentralizowany i skomputeryzowany co umożliwiło zebranie danych do analizy historii zdarzeń oraz dane zebrane podczas spisów w 1960, 1970 i 1980 roku.

Bazę danych stanowiły dane o 54 814 osobach urodzonych w 1958 roku którzy mieszkali w 1991 roku w Norwegii i nie wyemigrowali za granicę. Sama analiza dotyczyła zmian zamieszkania w odniesieniu regionalnym (Norwegia została podzielona na 19 regionów –(Figure 1.)) dla w.w. osób w ciągu krótkiego odcinka czasu tj. lat 1980 i 1981 (osoby te były wówczas w wieku 22-23 lata).

Dla poziomu indywidualnych jednostek do analizy zostały wybrane następujące charakterystyki, które uznano jako mające potencjalny wpływ na możliwość wyemigrowania z regionu:

- stan cywilny (zamężny(a)/ niezamężny(a)),

- aktywność zawodowa (aktywny(a) zawodowo/ nieaktywny(a) zawodowo), - typ zatrudnienia (pracujący w rolnictwie/ pracujący poza rolnictwem), - poziom wykształcenia (pełne 12 lat nauki/ mniej niż 13 lat nauki),

(25)

25

- potomstwo (co najmniej jedno dziecko/ bezdzietny(a)),

- poziom dochodów (wysokie dochody/ niskie dochody/ brak dochodów).

Jako charakterystyki zagregowane na poziomie wyznaczonych 19 regionów zostały wyznaczone udziały procentowe w.w. cech tj. procent emigrujących z regionu w latach 1980- 1981, procentowy udział zamężnych, procentowy udział rolników itd.

Wyniki uzyskane dla trzech typów modeli: regresja wykładnicza wykorzystana do modelowania współczynników migracji, model logitowy i analiza historii zdarzeń do estymacji indywidualnych prawdopodobieństw wyemigrowania z danego regionu okazały się podobne. Wyniki uzyskane dla analizy historii zdarzeń były dokładniejsze.

Wyniki uzyskane na poziomie indywidualnym i zagregowanym przy analizie wielopoziomowej tj. przeprowadzonej na wielu poziomach równocześnie okazały się jednak różne a w niektórych wypadkach nawet przeciwne. Dla przykładu wpływ faktu bycia zamężnym dla mężczyzn zwiększa prawdopodobieństwo emigracji z regionu w wieku 22 lat to prawdopodobieństwo to spada w miarę zwiększania się procentowego udziału mężczyzn w danym regionie. (Tabela 9.)

Niezależność wyników na poziomie „makro” i na poziomie „ mikro” potwierdza niska wartość wyznaczonego współczynnika korelacji wynoszącego zaledwie –0,10.

3.2. Analiza migracji uwzględniająca przepływy międzyregionalne.

W poszerzonej wersji modelu autorzy tj. D. Courgeau i B. Baccaini wykorzystali bazę danych z poprzedniej wersji modelu z uwzględnieniem niewielkich zmian mających na celu nadanie klarowności przeprowadzanej analizie. Model ten poddaje analizie nie tylko wypływy z regionów ale również przepływy zwrotne czyli analizuje dodatkowo możliwość wyboru tego a nie innego regionu jako miejsca docelowego lub powrotu do regionu wcześniej opuszczonego.

Dla większej przejrzystości wyników model uwzględnia podział kraju analizowanego tj. Norwegii na 5 dużych regionów. W tym modelu analiza obejmuje dwa lata 1981 i 1982.

Wprowadzono nowe charakterystyki na poziomie indywidualnym:

- wykształcenie (mniej niż 10 lat nauki lub więcej niż 12 lat nauki/ pomiędzy 10-12 lat nauki),

- fakt zamieszkiwania wcześniejszego w regionie przeznaczenia, - długość pobytu wcześniejszego w regionie przeznaczenia,

- czas jaki upłynął od opuszczenia regionu potencjalnego przeznaczenia, - wiek w latach jeśli osoba wcześniej w tym regionie nie przebywała w ogóle.

(26)

26

Charakterystyki te miały na celu dać odpowiedź na pytanie czy szanse na wybór danego regionu jako regionu przeznaczenia są większe dla osób które w tym regionie wcześniej mieszkały i wyemigrowały oraz mieszkały tam przez dłuższy czas i miało to miejsce stosunkowo niedawno.

Jako nowe charakterystyki na poziomie zagregowanym wykorzystano:

- procentowy udział osób które mieszkały wcześniej w regionie potencjalnego przeznaczenia,

- średni czas pobytu w różnych regionach przeznaczenia według osób mieszkających w danym regionie (region wyjściowy),

- średni czas jaki upłynął od ostatniego pobytu w różnych regionach przeznaczenia według osób mieszkających w danym regionie (region wyjściowy),

Przyjmując założenie iż osoby są bardziej związane z osobami o podobnych charakterystykach przyjęto dodatkowo grupę charakterystyk o wymiarze zarówno „makro”

odnoszącym się do regionów jak i o wymiarze „mikro” odnoszącym się do jednostek:

- procentowy udział osób z tym samym stanem cywilnym,

- procentowy udział osób z tym samym wykonywanym zawodem, - procentowy udział osób o tym samym wykształceniu,

Charakterystyki te mogą być więc wykorzystane do modelowania z użyciem analizy historii zdarzeń do estymacji indywidualnych prawdopodobieństw migracji.

Dodatkowo możliwe jest uwzględnienie utrudnienia wynikającego z przeszkody jaką stanowi geograficzna odległość pomiędzy regionami.

Pierwszym krokiem w analizie było wykorzystanie charakterystyk na poziomie indywidualnym do analizy historii zdarzeń w celu zbadania wpływu poprzedniego pobytu na wybór miejsca przeznaczenia w emigracji. Analiza składała się z pięciu modeli ryzyk konkurencyjnych. Jeden model oddzielnie dla każdego regionu jako stanu wyjściowego z czterema stanami przeznaczenia.

Niemożliwe okazało się wprowadzenie do modelu równocześnie zmiennych:

- fakt wcześniejszego pobytu w rejonie przeznaczenia, - czas wcześniejszego pobytu w rejonie przeznaczenia,

(27)

27

- czas jaki upłynął od opuszczenia rejonu przeznaczenia.

Zmienne te były ze sobą silnie skorelowane więc model został wyestymowany dla każdej z tych zmiennych oddzielnie.

(Tabela 1a. i Tabela 1b.)Wyniki okazały się jednoznaczne: fakt pobytu wcześniejszego w rejonie przeznaczenia zdecydowanie zwiększa ryzyko wyjazdu do tego rejonu w przypadku migracji. Podobnie jak czas wcześniejszego pobytu w tym rejonie: im dłuższy czas wcześniejszego pobytu w rejonie przeznaczenia tym większe ryzyko wyboru tego rejonu jako miejsca docelowego emigracji. Wskazuje to na przywiązanie osób do rejonu w którym zamieszkiwali w młodości (dzieciństwie). Więzy te ulegają jednak osłabieniu w miarę wydłużania się okresu czasu jaki upłynął od ostatniego pobytu w rejonie przeznaczenia.

Niezmiennie do poprzedniego modelu jednokierunkowych wypływów z rejonu i niezależnie od rejonu wyjściowego i rejonu przeznaczenia pewne prawidłowości dla charakterystyk indywidualnych nie zmieniają się. Prawdopodobieństwo zmiany miejsca zamieszkania jest niskie dla mężczyzn, osób aktywnych zawodowo, osób zamężnych posiadających dzieci, osób o niskim poziomie wykształcenia i osób o wysokich dochodach.

Jedynie fakt posiadania dzieci zwiększa ryzyko emigracji z dużego ośrodka jakim jest Oslo ze względu na dekoncentrację rejonu zurbanizowanego. Wyjątek stanowi również fakt iż niski poziom wykształcenia nie zniechęca ludzi do emigracji z rejonu Południowego od rejonu określonego jako Wschodni. Zależnie również od rejonu zmienia się prawdopodobieństwo migracji dla osób pracujących w rolnictwie.

Niektóre charakterystyki indywidualne mają przeciwne kierunki działania na migracje w zależności od tego czy ruch następuje z rejonu i do rejonu j czy odwrotnie z rejonu j do rejonu i.

Przechodząc do analizy charakterystyk na poziomie zagregowanym konieczne jest rozważenie powodów migracji tj. czy opuszczenie danego rejonu jest następstwem czy poprzedza wybór rejonu przeznaczenia. Co jest motywacją: czy chęć opuszczenia danego zamieszkiwanego obecnie rejonu czy też chęć przeniesienia się do rejonu wybranego jako rejon przeznaczenia. Oba te procesy są prawdopodobnie ze sobą ściśle związane. Podjęcie decyzji zależy od rozpatrzenia dokładnego co przeważy: czy korzyści wynikające z pozostania w rejonie obecnego pobytu czy też korzyści oferowane przez rejon przeznaczenia w powiązaniu oczywiście z charakterystykami indywidualnymi osoby.

Pierwszym krokiem było podjęcie analizy modelu w zależności od rejonu przeznaczenia w którym populacja zamieszkująca cztery pozostałe regiony była podmiotem wystawionym na ryzyko przeniesienia się do tego rejonu. Zmienną na poziomie makro