• Nie Znaleziono Wyników

Wiesław Szczęsny, Alicja Ciok, Teresa Kowalczyk, Elżbieta Pleszczyńska, Włodzimierz Wysocki Instytut Podstaw Informatyki PAN

N/A
N/A
Protected

Academic year: 2021

Share "Wiesław Szczęsny, Alicja Ciok, Teresa Kowalczyk, Elżbieta Pleszczyńska, Włodzimierz Wysocki Instytut Podstaw Informatyki PAN"

Copied!
20
0
0

Pełen tekst

(1)

Wiesław Szczęsny, Alicja Ciok, Teresa Kowalczyk, Elżbieta Pleszczyńska, Włodzimierz Wysocki

Instytut Podstaw Informatyki PAN

GRADACYJNA ANALIZA POWIĄZAŃ W TABLICACH KONTYNGENCJI. ZASTOSOWANIA DO ANALIZY WYNIKÓW

GŁOSOWANIA DO SEJMU RP Z LAT 1993 i 1997

Przedstawiamy gradacyjną analizę powiązań (w skrócie GCA od grade corresponden­

ce analysis) stanowiącą pewną odmianę standardowej analizy powiązań (correspondence analysis), w której maksymalizuje się współczynnik korelacji dwudzielnej tablicy kontyn- gencji na zbiorze par uporządkowań jej wierszy i kolumn. Wskazujemy też, ja k agregować wiersze lub kolumny po przekształceniu tablicy za pomocą GCA. Porządkowaniu i agrego­

waniu poddajemy tabele wyników wyborów do Sejmu RP z lat 1993 i 1997, obrazując w ten sposób zmiany preferencji wyborczych na terenie kraju. Przeprowadzamy też analizę porównawczą wyników wyborów i odnotowujemy duże podobieństwo geografii preferencji

wyborczych w 1993 i 1997 roku.

1. Gradacyjna analiza powiązań

Piśmiennictwo związane ze standardową analizą powiązań (correspondence analysis, w skrócie CA) jest olbrzymie. CA dotyczy wielowymiarowych tablic kontyngencji i - mówiąc nieściśle - polega na transformowaniu poszczególnych zmiennych w taki sposób, żeby uzyskać możliwie silną dodatnią zależność stochastyczną dla całego wektora przekształconych zmiennych. Istnieje wiele różnych formalizacji CA, ale w przypadku tablicy dwudzielczej wszystkie one sprowadzają się do wyznaczania maksimum współczynnika korelacji Pearsona.

Przed kilku laty „zakiełkowała” odmiana (zaproponowana przez zespół autorów niniejszego artykułu) CA dla tablic dwudzielczych, zwana gradacyjną analizą powiązań (GCA). GCA stanowi istotny element prac zespołu nad spójną infrastrukturą statystyczną wyprowadzoną z pojęcia koncentracji. Nie

Instytut Podstaw Informatyki PAN, Ordona 21, 01-237 Warszawa.

(2)

50 W. SZCZĘSNY, A. α ο κ , T. KOWALCZYK, Е. PLESZCZYŃSKA, W. WYSOCKI

jest to nowa infrastruktura, gdyż jej elementy są najczęściej znane i używane.

Nowa natomiast jest konsekwencja, z jaką powstaje hierarchiczna struktura pojęć, poczynając od krzywej koncentracji i opartego na niej porządku.

Wszystkie pojęcia mają uniwersalne zastosowanie dla dowolnych wektorów cech o rozkładach dyskretno-ciągłych, a hierarchia pojęć współgra z hierarchią skal pomiarowych. Podstawowe informacje o tworzonej infrastrukturze zawar­

te są w pracy Ciok, Kowalczyk, Pleszczyńska (1998), w której podana jest również bardzo obszerna bibliografia. W niniejszym artykule ograniczamy się do wskazania prac opublikowanych przez nas w Polsce (Ciok i inni 1995a, Ciok i inni 1995b, Kowalczyk 1994, 1997, 1998, Kowalczyk i inni 1996, Szczęsny, Ciok, Pleszczyńska 1998). Z olbrzymiej literatury dotyczącej prac na temat koncentracji wymienimy kilka szczególnie dla nas ważnych: Fogelson (1933), Cifarelli i Regazzini (1987), Govaert (1984), Meulman (1992), Rao (1982), Schriever (1985), Yitzhaki i Olkin (1991).

W gradacyjnej analizie powiązań oceniana jest siła związku i jego regular­

ność. Regularność związku, tak jak i jego siła, jest pojęciem pierwotnym odwołującym się do intuicji i różnie formalizowanym. Zgodnie z intuicją, dyskretyzowany rozkład binormalny m a większą regularną zależność mono- toniczną (dodatnią lub ujemną) niż rozkłady próbkowe. Im większa regular­

ność, tym bardziej przydatna jest GCA, która wyznacza najlepsze przy­

bliżenie do regularnej zależności monotonicznej (bliższy komentarz zamieś­

cimy przy omawianiu rys. 2a i 2b). W arto dodać, że nawet daleka od regularności zależność monotoniczna „regularnieje” przy właściwej agregacji i ujawnia występujące w tabeli trendy nadreprezentowania i niedoreprezen- towania.

Trendy takie postaramy się ujawnić za pomocą GCA w tabelach wyników wyborów do Sejmu RP z lat 1993 i 1997. Można się w nich doszukać silnej, acz nieregularnej zależności monotonicznej ukazującej relację między partiami politycznymi a okręgami wyborczymi. W niniejszej pracy demonstrujemy tę relację dla kilku zestawów danych wyborczych. Sądzimy, że analiza statystycz­

na pierwotnych wyników wyborów w okręgach wyborczych ( p r z e d ich przetworzeniem na reprezentację sejmową za pomocą dalszej procedury zawar­

tej w ordynacji wyborczej) m a ogromne znaczenie dla syntetycznego opisu wyborów i opartego na nim wnioskowania.

Najprostszy przypadek metody GCA jest dobrze znany użytkownikom statystyki i odnosi się do porównania dwóch fc-punktowych rozkładów praw­

dopodobieństwa oraz oceny występujących między nimi różnic. Opiszemy go na przykładzie wyników głosowania do Sejmu RP w 1997 roku w trzech parach okręgów wyborczych: m.st. Warszawa (okręg nr 1), Katowice-Sosnowiec (okręg nr 15) i woj. rzeszowskie (okręg nr 38), ograniczając się przy tym do 10 partii, które w 1997 roku zdobyły najwięcej głosów. Są to:

(3)

1. UP: Komitet Wykonawczy Unii Pracy

2. NChD: Komitet Wyborczy Narodowo Chrześcijańsko-Demokratyczny - Blok dla Polski

3. POREiR: Prezydium Rady Naczelnej Krajowego Porozumienia Emerytów i Rencistów Rzeczypospolitej Polskiej

4. UW: Zarząd Unii Wolności

5. AWS: Komitet Wyborczy Akcja Wyborcza Solidarność

6. SLD: Krajowy Komitet Wyborczy Sojuszu Lewicy Demokratycznej 7. PSL: Naczelny Komitet Wykonawczy Polskiego Stronnictwa Ludowego 8. UPR: Komitet Wyborczy Obywateli Unia Prawicy Rzeczypospolitej 9. ROP: Zarząd Główny Ruchu Odbudowy Polski

10. PAREiR: Rada Naczelna Krajowej Partii Emerytów i Rencistów

Niech ntJ oznacza liczbę głosów oddanych na partię j w okręgu i, niech и(, oznacza łączną liczbę głosów na г-ty okrąg, (n,.=Z ntf), niech пш] oznacza łączną liczbę głosów na partię j (и ,.=Σ( ηυ). Dalej, niech p tp p u i p mj oznaczają pro­

porcje głosów oddanych w okręgu i na partię j, głosów oddanych w okręgu i oraz głosów oddanych na partię j w całej puli głosów Σ,/ιυ (czyli p u=-n$fLjц itp.). Będziemy też stosować oznaczenie П,(/) = p j p it dla proporcji głosów oddanych na partię j w puli głosów przypadającej na okręg i, oraz oznaczenie П ,—(П,(1),...,П,(к)) dla rozkładu głosów w okręgu i (zwanego czasem profilem okręgu i). Dane nip i= 1, 15, 38,y = 1 ,...,10 zawarte są w Tabeli 1.

Tabela 1. Liczby głosów oddanych na 10 głównych partii w 1997 roku w okręgach nr 1,15,38

Okręg Partie

1 2 3 4 5 6 7 8 9 10

1. m.st. W-wa 15. K atow ice-

39607 4395 6061 172823 253539 205955 7451 23373 72827 8160 Sosnowiec 22953 2364 5903 42689 78542 155876 10340 6161 12619 11467 38. Rzeszowskie 7862 3933 4669 18712 177249 41644 28020 3924 16804 3815 Zajmiemy się najpierw porównaniem profili okręgów 1 i 15. Iloraz П,(/)/П15(/') porównuje proporcję głosów oddanych na partię j w okręgu 1 względem okręgu 15 (czyli mierzy „pozycję” y-tej partii w okręgu nr 1 względem okręgu nr 15). Wartość ilorazu większa od 1 wskazuje na prze­

wagę okręgu 1, mniejsza od 1 - na przewagę okręgu 15. Porządkując partie według niemalejących ocen pozycji partii w okręgu 1 względem okręgu 15, otrzymujemy kolejność podaną w Tabeli 2: na początku znajduje się partia z największą przewagą okręgu 15, a na końcu - z największą przewagą okręgu 1.

(4)

52 W. SZCZĘSNY, A. α ο κ , T. KOWALCZYK, Е. PLESZCZYŃSKA, W. WYSOCKI

Tabela 2. Uporządkowania partii politycznych metodą GCA dla kilku uporządkowa­

nych grup okręgów wyborczych

Grupy okręgów Najlepsze uporządkowanie a L (dla par)

P шах

(15Д)

(Kat - Sosn.; m.st W-wa) (1.38)

(m.st. W-wa; Rzeszowskie) (15.38)

(Kat.-Sosn; Rzeszowskie)

10 7 3 6 1 2 5 8 4 9 6 10 1 4 8 3 9 2 5 7 4 8 1 6 9 10 5 3 2 7

0,2978 0,4139 0,4807

0,1895 0,2495 0,3590 (15,1,38)

(Kat.-Sosn.; W-wa; Rzesz.) 10 6 1 4 3 8 9 2 5 7 X 0,2735

52 okręgi 6 1 4 10 8 3 9 5 2 7 X 0,2143

Wzajemne relacje rozkładów П, i П 15 ilustruje łamana na rys. 1 o kolejnych wierzchołkach (0, 0), (ΠΙ5(10), Π,(ΙΟ)), (ΠΙ5(10) + Π 15(7), Π,(10) + Π,(7)),..., (1-Π 15(9),1-Π 1(9)), (1, 1). Jest to krzywa zróżnicowania L tej pary rozkładów, zwana też krzywą Lorenza rozkładu Π, względem Π 15. Krzywa ta jest wypukła, gdyż rosną nachylenia poszczególnych odcinków łamanej, równe ilorazom n , ( j ) / n 15(j).

Rysunek 1. Krzywa L zróżnicowania między okręgiem 1 a okręgiem 15. Kolejność partii: 10, 7, 3, 6, 1, 2, 5, 8, 4, 9

(5)

Gdyby proporcje głosów w porównywanych okręgach były identyczne, wszystkie wierzchołki krzywej Lorenza leżałyby na przekątnej. Im bardziej się różnią, tym bardziej krzywa Lorenza oddala się od przekątnej. Toteż liczbowym wskaźnikiem zróżnicowania pary rozkładów jest podwojone pole między krzywą L a przekątną kwadratu, oznaczane dla dowolnej pary rozkładów Π„

Π 2 symbolem а^П ^П ^. Wskaźnik aL bywa nazywany indeksem Gini’ego i jest najczęściej zapisywany w postaci

aL( n „ n 2) = ^ П ^ Щ л Ь В Д В Д ! .

Gdy rozkłady są identyczne, indeks Gini’ego jest równy zero, w przeciwnym razie jest dodatni.

Utwórzmy tabelę wyników wyborów dla dwóch tylko okręgów i к partii i oznaczmy ją P2xk:

г Pu,-,Pik i 2xk L Ρ ,ι,-, Ρ η 1’

a następnie policzmy wskaźnik Gini’ego dla pary warunkowych rozkładów w pierwszym i drugim wierszu, czyli a ^ I I jJ Q . Możemy też przy każdym ustawieniu kolumn policzyć współczynnik korelacji Spearmana i znaleźć takie ustawienie, przy którym uzyskuje on największą wartość. Tę największą wartość będziemy oznaczać p'max(P2xk)· Zachodzi następujący związek:

а (П„112) = —--- P max(P2*k)·

3Pi. p 2.

D la rozkładu P2xk utworzonego z okręgów nr 1 i 15 mamy p*m^ = 0,1895 i aL = 0,2978.

Postępując analogicznie dla par okręgów (1,38) i (15,38), otrzymujemy naj­

lepsze uporządkowania partii i wartości wskaźników aL i p*^ podane w Tabeli 2.

T ak więc w przypadku rozkładu o dwóch wierszach poszukiwanie takiego ustawienia wierszy i kolumn, które maksymalizuje wskaźnik p*, m a przejrzystą interpretację i jest dobrze osadzone w tradycji statystycznej. Przy większej liczbie wierszy nie można jednak ograniczyć się do działania na parach rozkładów, bo uporządkowania kolumn bywają w każdej parze inne.

M etoda GCA dla dowolnego rozkładu Pmxk (czyli rozkładu z tabelą prawdopodobieństw p t] o m wierszach i к kolumnach) polega na wyznaczeniu takiego uporządkowania wierszy i kolumn, przy których p \P mxk) osiąga maksimum. Zastosowanie tej metody do trzech okręgów 1, 15, 38 prowadzi do uporządkowania wierszy (15, 1, 38) i do uporządkowania partii podanego w Tabeli 2, które wydaje się stanowić rozsądny kompromis między uporząd­

kowaniami dla trzech par okręgów. Intuicja jest przejrzysta: chcemy wykryć uporządkowania wierszy i kolumn, przy których, w każdej parze wierszy, wcześniejszy wiersz będzie miał tendencję do przewagi nad późniejszym w po­

(6)

54 W. SZCZĘSNY, A. CIOK, T. KOWALCZYK, E. PLESZCZYŃSKA, W. WYSOCKI

czątkowych kolumnach, przy czym ta przewaga będzie się stopniowo zmniej­

szać aż do maksymalnej przewagi wiersza późniejszego nad wcześniejszym - i analogiczna tendencja wystąpi dla par kolumn. Formalnie żąda się, żeby wskaźnik korelacji Spearmana dla rozkładu Pmyk osiągnął maksimum w zbiorze wszystkich możliwych ustawień wierszy i kolumn.

Istnieje taka klasa rozkładów Pmxk, w której rozkłady warunkowe zmieniają się w sposób płynny i regularny: przez tabelę p u przepływa jakby fala z prze­

suwającym się z góry na dół grzbietem, od którego prawdopodobieństwa opa­

dają w dół i w górę w sposób regularny. Formalnie wyraża się to tak, że wszystkie wyrażenia pod znakiem modułu we wzorze na indeks Gini’ego są nieujemne. Tę klasę rozkładów o regularnej dodatniej zależności oznacza się TP2 (total positi- vity o f order two, Lehmann [1966]). Jeśli P2yk e TP2 to metoda GCA wskaże tę właśnie parę uporządkowań, gdyż wskaźnik p* osiągnie wtedy swoją maksymal­

ną wartość. W klasie rozkładów T P2 żadne kompromisy nie są potrzebne, gdyż optymalne uporządkowania kolumn w parach wierszy są jednakowe dla wszystkich uporządkowanych par wierszy i to samo dotyczy kolumn; jest to ważna charakteryzacja klasy TP2, wynikająca natychmiast z definicji Lehmanna.

Dodajmy jeszcze, że w rozkładach Pmyk z klasy TP2 dwa sąsiednie rozkłady warunkowe (n ,.,IIi+J) są zawsze sobie bliższe niż (ПЫ,П,+/) lub (Π„ Π ί+2), со prowadzi do macierzy wskaźników aL o jednomodalnych wierszach i kolumnach.

Każde uporządkowanie wierszy (kolumn) jest pewną funkcją określoną na zbiorze wierszy (kolumn), czyli cechą w tym zbiorze. Cechy w zbiorach wierszy i kolumn tabeli określone przez parę optymalnych uporządkowań według GCA mogą być traktowane jako pewne cechy ukryte na zbiorach wierszy i kolumn.

M ożna zauważyć, jakie obserwowane zmienne są dodatnio związane z ukrytymi cechami, które mogą zawierać w sobie informacje służące do objaśnienia i interpretowania powiązań między oboma zbiorami. Cechy ukryte ujawnione za pomocą GCA w tabelach wyników wyborów mogą dopomóc nie tylko w opisaniu zmian preferencji wyborczych na przestrzeni kraju w poszczegól­

nych latach wyborczych, ale i w porównywaniu sytuacji w różnych latach (a w każdym razie dostarczają materiału do stawiania hipotez o możliwych przyczynach zaobserwowanych zmian).

U krytą cechą zadaną przez GCA na zbiorze okręgów wyborczych wydaje się być - przynajmniej w niektórych tabelach - wielkość miasta mającego w okręgu największe znaczenie (z czym wiąże się raczej zamożność okręgu). W zbiorze partii natomiast można by uznać za cechę ukrytą stopień zbliżenia programu partii do programu reform „kapitalistycznych” z hasłami liberalnymi.

Rozkład P3xI0 dla trzech okręgów wyborczych i 10 partii w ich optymalnym ustawieniu według GCA został przedstawiony na rys. 2a za pomocą mapy wskaźników nadreprezentacji. M apa m a kształt kwadratu. Komórce w i-tym wierszu i j-tej kolumnie odpowiada prostokąt R v o wymiarach (pu x p m) . Wskaźniki nadreprezentacji wylicza się dla każdej komórki tabeli dzieląc p tj

(7)

Rysunek 2a. M apa Tabeli 1 (wyniki wyborów do Sejmu RP w 1997 r. przy optymalnym usta­

wieniu 10 głównych partii 1 0 ,6 ,1 ,4 ,3 ,8 ,9 ,2 , 5,7 oraz 3 okręgów wyborczych)

PAREiR SLD UP UW R OP AWS PSL

i 6 1 4 8 9 5 7

o k rę g 15 (K a to w ic e- S o sn o w ie c)

O k rę g 1 (m iasto s to łe cz n e W arszaw a)

o k rę g 38 (rz e sz o w sk i)

Rysunek 2b. M apa regularnego odpowiednika Tabeli 1

PAREiR SLD UP UW ROP AWS PSL

i 6 1 4 8 9 5 7

o k rę g 15 (K a to w ic e- S o sn o w ie c)

O k rę g 1 (m iasto sto łe cz n e W arszaw a)

o k rę g 38 (rz e sz o w sk i)

(8)

56 W. SZCZĘSNY, A. CIOK, T. KOWALCZYK, E. PLESZCZYŃSKA, W. WYSOCKI

przez (pu x p j . Ich zbiór wskazuje, jak duże jest odstępstwo tabeli od niezależności. N a mapie zaznacza się zdyskretyzowane wartości wskaźników nadreprezentacji, oznaczone biało przy silnej niedoreprezentacji komórki (umo­

wnie określonej jako przedział [0,2/3]), jasno szaro przy słabej niedoreprezen­

tacji (przedział [2/3,0,98]), ciemno szaro przy słabej nadreprezentacji (przedział [1,02,1,5]), czarno przy silnej nadreprezentacji (wskaźnik większy niż 1,5), biało z pionowymi czarnymi kreskami przy stanie prawie równowagi ([0,98, 1,02]).

Komórki o silnej nadreprezentacji przylegają na rys. 2a do przeciwległych wierzchołków kwadratu: są to komórki dla PAREiR i SLD w okręgu Katowi- ce-Sosnowiec oraz dla AWS w okręgu rzeszowskim. Komórki o silnej niedore- Rysunek 3. M apa tabeli wyborów do Sejmu w 1997 r. przy optymalnym ustawieniu 10

głównych partii i 52 okręgów wyborczych. Kolejność partii: SLD(6), UP(1), UW(4), PAREiR(lO), UPR(8), POREiR(3), ROP(9), AWS(5), NChD(2), PSL(7). Kolejność okręgów (por. oznaczenia w Dodatku): 15,27, 20,48, 32, 13,44, 35, 52, 29,12,6, 42,10,49, 23,1,47,16, 24, 9, 50, 30,14,17,18,19, 7, 43,40, 8,4, 33,21, 5, 34, 2,25,11, 37,45,41,22, 31,39, 3, 26, 36, 51,46, 38,28

(9)

prezentacji są rozmieszczone mniej zgodnie z regularną zależnością monoto- niczną, gdyż do wierzchołków przylegają jasnoszare prostokąty (PSL w okręgu 15 i PAREiR w okręgu 38), a białe prostokąty są położone trochę dalej (AWS w okręgu 15, SLD, UP i UW w okręgu 38), a także - niezgodnie z zależnością monotoniczną - na krańcach i w środku wiersza odpowiadającego okręgowi 1.

W sumie rozkład P3xl0 wykazuje zależność monotoniczną silną (p* = 0,2735), ale mało regularną. Tę nieregularność widać najlepiej, gdy rys. 2a porówna się z rys. 2b, który jest m apą dla dyskretyzowanego rozkładu binormalnego o takich samych rozkładach brzegowych i takim samym wskaźniku p'max jak na rys. 2a. Rozkład binormalny stanowi tu wzorzec regularności. Pomimo tej nieregularności m apa na rys. 2a wydaje się poprawnie ukazywać główne kierunki zróżnicowania między trzema rozpatrywanymi okręgami.

Interesujące jest porównanie rys. 2a z rys. 3, na którym te same 10 głów­

nych partii z 1997 roku rozpatruje się dla wszystkich 52 okręgów. Okazuje się, że przekształcając rozkład PS2xI0 za pomocą GCA otrzymuje się okręg 15 na miejscu pierwszym, okręg 38 na przedostatnim, a okręg 1 blisko środka uporządkowania; a ustawienie partii jest bardzo zbliżone do ich ustawienia przy rozpatrywaniu tych trzech okręgów (por. Tabela 2).

Agregacja wierszy lub kolumn tabeli oparta na metodzie GCA

Bliskość dwóch partii w tablicy wyników wyborów przekształconej metodą GCA nie musi oczywiście oznaczać bliskości ich programów wyborczych, ideologii itp. Chodzi tylko o podobny dla obu partii rozkład nadreprezentacji i niedoreprezentacji oddanych głosów w ciągu uporządkowanych okręgów.

Podobnie jest w przypadku bliskich według GCA okręgów wyborczych.

Gdyby metoda GCA przekształcała rozkład na P52xID na rozkład klasy TP2, podobieństwo rozkładów sąsiadujących partii czy sąsiadujących okręgów byłoby wyraźnie widoczne; odstępstwo od TP2 powoduje, że prostokąt biały lub jasnoszary sąsiaduje z czarnym itp. Gdyby jednak dokonać podziału partii i okręgów na podzbiory, m apa dla zagregowanej tablicy byłaby już znacznie bliższa regularnej.

Im mniej regularna jest zależność na mapie wskaźników nadreprezentacji, tym trudniej wyróżnić większe bloki wierszy i kolumn o zbliżonym charakterze.

N a rys. 3 nawet sąsiednie wiersze (a także sąsiednie kolumny) na ogół wyraźnie się różnią. M apa pozwala jednak wychwycić pary szczególnie podobne (na przykład okręg 44 (szczeciński) i okręg 35 (poznański) oraz większe grupy o pewnych charakterystycznych cechach.

Czy takie podziały mogą mieć związek z koalicjami partii zawieranymi na okres wyborów i z dokonywaniem podziału na okręgi wyborcze? Mogłoby tak być na przykład wtedy, gdyby ordynacja wyborcza nieproporcjonalnie wysoko

(10)

58 W. SZCZĘSNY, A. α ο κ , T. KOWALCZYK, Е. PLESZCZYŃSKA, W. WYSOCKI

premiowała partie (koalicję partii) wysoko nadreprezentowane w okręgu, a całkowicie eliminowała partie niedoreprezentowane. W każdym jednak razie dokonywanie agregacji okręgów i/lub partii (wierszy i/lub kolumn tabeli) ułatwia orientację w tabeli danych i zwraca uwagę na elementy odstające. D la przykładu przedstawiamy podziały dokonane na ciągu 10 głównych partii w tabeli 52 x 10 w 1997 roku (rys. 3) przy podziale partii na n podzbiorów dla n = 2, 3 i 4. Liczby p*n dla n —2, 3 i 4 oznaczają wartości wskaźnika p*

w zagregowanej tablicy (przy połączeniu w jedną kolumnę liczb z kolumn należących do tego samego podzbioru). Zgodnie z Tabelą 2, optymalny ciąg kolumn dla niezagregowanej tabeli PS2xl0 otrzymany według GCA jest postaci

6 ,1 ,4 , 10, 8, 3, 9, 5, 2, 7 (p*, = 0,2143).

Optymalne podzbiory mają postać:

n = 2: (6, 1, 4, 10, 8, 3), (9, 5, 2, 7) (p > 0 ,1 8 5 8 ), n = 3: (6, 1, 4), (10, 8, 3, 9), (5, 2, 7) (p*3 = 0,1988), n = 4: (6, 1), (4, 10, 8), (3, 9, 5), (2, 7) (p > 0 ,2 1 0 0 ).

Jak widać, podział na 2 podzbiory mógłby powstać z podziału na 4 pod­

zbiory przez połączenie dwóch początkowych i dwóch końcowych (co by świadczyło o regularności ciągu optymalnych podziałów), gdyby nie partia nr 3 (POREiR), która przy n = 2 przyłącza się do pierwszego podzbioru, a przy и = 4 do trzeciego. Jest to jednak bardzo mała partia, której przypisanie do drugiego, a nie do trzeciego podzbioru wywiera minimalny wpływ na wartość p*. Dalsze dzielenie na drobniejsze podzbiory (и > 4 ) wniosłoby niewiele, bo różnica między 0,2100 am aksym alną wartością ρ*„,χ = 0,2143 jest już znikoma.

P rzy g ru p o w a n iu w ierszy i/łub k o lu m n tab eli p raw d o p o d o b ień stw ro z k ła d u Pmxk wysuwa się ten sam postulat, który formułowano poprzednio przy porządkowaniu wierszy i kolumn metodą GCA: zagregowana tabela powinna wykazywać możliwie silną dodatnią zależność stochastyczną. Formalizujemy to tak: mając dane m'\ k' (m’ ^ m,k' ^ k) oznaczające liczby zagregowanych wierszy i kolumn, poszukujemy takich podziałów, przy których wskaźnik pł za­

gregowanej tablicy osiąga maksimum.

Przypuśćmy najpierw, że chcemy agregować tylko wiersze lub tylko kolum­

ny. Wtedy można pokazać, że przy zadanej liczbie klas agregacja sąsiadujących wierszy w tabeli przekształconej za pomocą GCA, to jest agregacja niedopusz- czająca przeplatania (non-overlapping partition), tworzy tabelę uporządkowaną według GCA ze wskaźnikiem p* o wartości nie mniejszej niż p* dla dowolnego innego podziału. Wiadomo też, jak znajdować optymalny podział (algorytm podano w pracy Ciok 1998). Wyznaczając optymalne podziały kolejno dla liczby klas 72= 2,3,..., obliczając dla nich wartości p* (oznaczone p*) i obserwując zbliżanie się p*n do wartości ρ*^χ dla Pmxk przed agregacją, możemy dokonać wyboru odpowiadającej nam liczby klas.

(11)

N a razie nie dysponujemy jednak algorytmem optymalnego jedno­

czesnego podziału wierszy i kolumn opartego na GCA. W pracy Ciok (1998) zaproponowano pewien algorytm korzystający naprzemiennie z algorytmów optymalnego podziału samych wierszy i samych kolumn, ale jego własności nie są jeszcze zbadane. Ale nawet najprostsza metoda osobnego optymalnego dzielenia wierszy i kolumn i uwzględnienia obu tych podziałów jednocześnie wydaje się dobrze służyć praktycznym zasto­

sowaniom.

Gradacyjna analiza powiązań wyników wyborów do Sejmu RP w latach 1993 i 1997

Omówimy teraz zastosowanie GCA do pięciu tabel, z których dwie zawierają wyłącznie dane wyborcze z roku 1993, dwie dalsze - wyłącznie dane z roku 1997, a ostatnia zestawia razem wyniki z lat 1993 i 1997. Każda z tych tabel dotyczy wszystkich okręgów wyborczych w liczbie 52. Listę oznaczeń okręgów podano w Dodatku.

Rozkład liczby głosów dla 10 głównych partii z roku 1997 był już rozważany w poprzednich paragrafach jako PS2xlB (rys. 3). Obecnie uzupełniamy ten rozkład dodając trzy kolumny: z liczbą osób niegłosujących (NG), liczbą głosów nieważnych (NW) i liczbą głosów oddanych poza 10 głównymi partiami (R). Rozkład z uzupełnieniami, oznaczony PS2xl0, tworzy po przekształceniu przez GCA m apę pokazaną na rys. 4.

D la 1993 roku rozważamy aż 15 głównych partii, a mianowicie 1. PC: Zarząd Główny Porozumienie Centrum

2. OJCZ: Katolicki Komitet Wyborczy ..Ojczyzna”

3. PSL-PL: Polskie Stronictwo Ludowe - Porozumienie Ludowe 4. KPN: Konfederacja Polski Niepodległej

5. SLD: Sojusz Lewicy Demokratycznej 6. PSL: Polskie Stronictwo Ludowe

7. KL-D: Kongres Liberalno-Demokratyczny 8. S: Solidarność

9. UD: Unia Demokratyczna

10. BBWR: Bezpartyjny Blok Wspierania Reform 11. UP: Unia Pracy

12. UPR: Unia Polityki Realnej 13. KdR: Koalicja dla Rzeczpospolitej 14. X: Partia X

15. SOBR: Samoobrona

(12)

60 W. SZCZĘSNY, A. CIOK, T. KOWALCZYK, E. PLESZCZYŃSKA, W. WYSOCKI

Rysunek 4. M apa tabeli wyborów do Sejmu RP w 1997 r., przy optymalnym ustawieniu 10 głównych partii wraz z kolumnami NG, NW, R oraz 52 okręgów wyborczych. Kolejność partii: UW(4), AWS(5), UPR(8), ROP(9), NChD(2), SLD(6), UP(1), POREiR(3), NW, PAREiR(lO), NG, PSL(7), R. Kolejność okręgów (por. oznaczenia w Dodatku):

1, 11, 21, 38, 5, 28, 50, 35, 22, 27, 2, 46, 4, 15, 16, 44, 36, 17, 6, 32, 48, 13, 23, 26, 25, 52, 45, 47, 14, 9, 24, 29, 20, 42, 12, 10, 43, 37, 3, 33, 19, 31, 49, 18, 39, 40, 7, 41, 51, 8, 30, 34

UPR NChD U P PAREiR R

U W AWS R O P SLD NW NG PSL

Analogicznie jak dla 1997 roku rozpatrujemy dwa rozkłady liczby gło­

sów: rozkład P52xls dla głównych partii politycznych i rozkład PS2xl8 po uzupełnieniu tabeli wyników kolumnami NG, NW i R. Mapy tabel dla PS2xIS i P52xts po przekształceniu za pomocą GCA są przedstawione na rys. 5 i 6.

Łączna tabela dla głównych partii z lat 1993 i 1997 liczy 25 kolumn. M apa tak utworzonego rozkładuP„XJ5 po przekształceniu przez GCA jest przed­

stawiona na rys. 7.

(13)

Rysunek 5. M apa tabeli wyborów do Sejmu RP w 1993 r. przy optymalnym ustawieniu 15 głównych partii i 52 okręgów wyborczych. Kolejność partii: KL-D(7), UD(9), U P (ll), UPR(12), BBWR(IO), PC(1), KPN(4), S(8), SLD(5), KdR(13), OJCZ(2), SOBR(15), X(14), PSL(6), PSL-PL(3). Kolejność okrę­

gów (por. oznaczenia w Dodatku): 1, 16, 35, 21, 11, 17, 27, 50, 5, 44, 15, 2, 48, 30, 13, 6, 23, 29, 9, 52, 10, 20, 28, 47, 12, 4, 43, 42, 24, 32, 25, 14, 49, 33, 46, 22, 18, 38, 37, 45, 19, 41, 36, 31, 7, 40, 8, 26, 34, 39, 3, 51

U P R P C s O j c z X p s i.p l

K L D U D U P B B W R K P N SL D K d R S O B R P S L

Na mapach z rys. 3-7 uderza fakt, że w każdym przypadku w ustawieniu okręgów dominuje tendencja „od dużych do małych”. Okręgi z większą ogólną liczbą głosujących są namapie grubsze. Te grubsze grupują się na ogół na początku ciągu okręgów. Można to interpretować tak, że duże okręgi są skupione wokół dużych miast. Kolejność okręgów jest na rysunkach 4-7 bardzo zbliżona; do nielicznych wyraźnych odstępstw należy okręg opolski (30), który w 1993 roku (rys. 5 i 6) jest położony w pobliżu środka (i to samo obserwujemy na rys. 3), a na rys. 4 dla rozkładu P52xl3 znajduje się na przedostatnim miejscu ze względu na ogromną nadreprezentację głosów oddanych na R (czyli poza głównymi partiami).

N a rys. 5 i 6 ustawienia partii i okręgów są niezwykle zgodne, co oznacza, że w 1993 roku dodanie kolumn N G, NW i R prawie nie zakłóciło ani ustawienia

(14)

62 W. SZCZĘSNY, A. α ο κ , T. KOWALCZYK, Е. PLESZCZYŃSKA, W. WYSOCKI

Rysunek 6. M apa tabeli wyborów do Sejmu RP w 1993 r. przy optymalnym ustawie­

niu 15 głównych partii z dołączonymi kolumnami NG, NW, R (łącznie 18 kolumn) oraz 52 okręgów wyborczych. Kolejność partii: KL-D(7), R, UD(9), U P (ll), UPR(12), BBWR(IO), PC(1), K PN (4), S(8), SLD(5), KdR(13), N G , OJCZ(2), NW, X(14), SOBR(15), PSL(6), PSL-PL(3).

Kolejność okręgów (por. oznaczenia w Dodatku): 1, 11, 35, 21, 27, 15, 16, 17, 50, 5, 30, 44, 6, 48, 2, 13, 23, 9, 4, 29, 52, 10, 20, 47, 12, 25, 49, 42, 32, 28, 24, 14, 43, 33, 18, 38, 37, 22, 45, 46, 41, 19, 7, 36, 40, 31, 8, 39, 3, 26, 34, 51

pozostałych kolumn ani ustawienia okręgów. Wielka kolumna niegłosujących na rys. 6 budzi respekt i jakby zmniejsza w świadomości patrzącego na mapę różnice między rywalizującymi partiami, ale brak udziału w wyborach dokonuje się w 1993 roku niezależnie od sfery wpływów poszczególnych partii. Rozkład kolumn NG na rys. 6 wykazuje nieco większą tendencję udziału w głosowaniu w dużych okręgach na czele listy, ale jest to trend bardzo słaby, nie mający prawie znaczenia dla relacji partie - okręgi wyborcze.

W 1997 roku kolejność głównych partii na rys. 3 jest inna niż na rys. 4, tj. po dołączeniu N G, NW, R, a to zakłóca oczywiście dość znacznie także kolejność okręgów. Kolumna NG jest równie imponująca jak w 1993 roku, ale rozkład

(15)

Rysunek 7. M apa tabeli wyborów do Sejmu RP w 1993 i 1997 r. łącznie przy optymal­

nym ustawieniu 25 partii (10 kolumn z Rys. 3 i 15 kolumn z Rys. 4) oraz 52 okręgów wyborczych. Kolejność partii: KLD(7), UD(9), UW(19), UP3 (11), UPR3(12), UPR7(23), SLD7(21), SLD3(5), UP7 (16), PC(1), BBWR(IO), K PN(4), S(8), PAREiR(25), POREiR(18), SOBR(15), ROP(24), AWS(20), KdR(13), X(14), Ojcz(2), NChD(17), PSL3(6), PSL7(22), PSL-PL(3). Kolej­

ność okręgów (por. oznaczenia w Dodatku): 1, 35,16, 27,15, 44, 50,17, 48, 13, 21, 20, 6, 29, 11, 52, 30, 23, 10, 12, 32, 47, 42, 5, 2, 9, 24, 49,14, 43, 4,18, 19, 25, 33, 7, 37, 40, 41, 45, 22, 8, 28, 34, 31, 46, 36, 38, 39, 3, 26, 51

i WWWSK IIIIIIIIII

X пип 1штт\

i и ·:·» :·:« ·» ; ι

i ι

ι ι

I S» l l l l l l ι « ш ш я

“ ■ IIIIIIIIII IIIII — Ш::::: ■ ·Λ·: ййй I

m Ш ЯШ inn i $ ■ ш ι

<*χ·χ*χ·χ·χ·χ·χ·χ·χ·χ·: m

Шх lllll ■ I ■

ι m v « > ;■ :·;·;· - х а м

im i i ·

N C h D .P S L ,, P S L ,,P S L -P L R O P .A W S , K dR , X

,O jcz

1

»

■ ■

1

w tej kolumnie jest w 1997 inny, gdyż koncentracja odmowy udziału w głosowaniu na dolnej połowie uporządkowania okręgów (a więc w miarę oddalania się od dużych miast) jest teraz wyraźna. Włączenie kolumn NG, NW, R (rys. 4) w znacznym stopniu przywraca to uporządkowanie okręgów, które obserwowano poprzednio na rys. 5 i 6 dla 1993 roku. Tak więc

u p r7,s l d7, S L D 3, U P7

P C , B B W R , K PN , S, P A R E iR , P O R E iR ,

SO B R

(16)

64 W. SZCZĘSNY, A. α ο κ , T. KOWALCZYK, Е. PLESZCZYŃSKA, W. WYSOCKI

niegłosujący odegrali w 1997 roku inną rolę niż w 1993 roku, stali się przez swój nierównomierny rozkład pośrednio politycznie zaangażowani.

M apa z rys. 3 ukazuje, że przy ograniczeniu się w 1997 roku do 10 głównych partii powstaje uporządkowanie okręgów bardzo silnie związane z położeniem geograficznym. Okręgi w pierwszej połowie uporządkowania tworzą zwarty obszar obejmujący całą zachodnią Polskę z jedyną „dziurą”

w postaci okręgu gdańskiego (11) i dwoma „wyspami” : m.st. Warszawa (I) i okręgiem łódzkim (27).

D la rozkładu P52xI3 (rys. 4) wyznaczono (w sposób opisany w § 3) optymalny podział okręgów na 12 uporządkowanych podzbiorów:

(1) m.st. Warszawa

(2) gdańskie, krakowskie, rzeszowskie, bielskie, nowosądeckie (3) wrocławskie, poznańskie, krośnieńskie, łódzkie

(4) warszawskie bez m.st., tarnowskie, białostockie

(5) Katowice-Sosnowiec, Katowice-Katowice, szczecińskie, przemyskie, Ka- towice-Gliwice

(6) bydgoskie, pilskie, wałbrzyskie, jeleniogórskie (7) legnickie, łomżyńskie, lubelskie, zielonogórskie

(8) tarnobrzeskie, toruńskie, kaliskie, częstochowskie, leszczyńskie, olsz­

tyńskie

(9) koszalińskie, słupskie, gorzowskie, elbląskie, suwalskie

(10) radomskie, bialskopodlaskie, piotrkowskie, konińskie, ostrołęckie (II) włocławskie, kieleckie, siedleckie, sieradzkie

(12) chełmskie, skierniewickie, zamojskie, ciechanowskie, opolskie, płockie.

Otrzymano wtedy p* = 0,1500, a więc liczbę bardzo bliską p,max(PS2xI5) = 0,1508. Z rys. 4 widać, że wyłonione podzbiory są dosyć jednorodne i można łatwo opisać, czym się charakteryzują. Optymalny podział na 6 podzbiorów (p* = 0,1468) niemal dokładnie pokrywa się z podziałem powstałym z łączenia dwu sąsiednich podzbiorów w podziale na 12 części. Gdyby natomiast agregacji okręgów dokonano na podstawie PS2xl0 (rys. 3), powstałyby podzbiory dość wyraźnie różne od przedstawionych wyżej (jednak z zachowaniem ogólnej tendencji „od dużych do małych”).

Ustawienie partii wypada ciekawie na mapie rozkładu P52x2S (rys. 7), na któ­

rej rozpatruje się razem główne partie z 1993 i 1997 roku w łącznej liczbie 25.

Partie, które przetrwały od roku 1993 w niezmienionej postaci, noszą tu subskrypty 3 (od 1993) lub 7 (od 1997). Mamy więc SLD3 i SLD7, U P3 i U P7, PSL3 i PSL7, U PR 3 i U PR r Wyznaczamy optymalne ustawienia metodą GCA (rys. 7), z którego widzimy, że partie z roku 1993 ciążą ku swoim odpowied­

nikom z roku 1997: np. KL-D i UD plasują się obok UW, U PR3 obok U PR 7, SLD3 obok SLD7, itd. Następnie wyznaczamy (w sposób opisany w § 3) optymalny podział zbioru 25 partii na 5 podzbiorów. Poprzestajemy na n = 5,

(17)

gdyż mamy p*5==0,2376 wobec p \P S2x2S) = 0,2425. Podzbiory są w postaci (przypominamy, że chodzi o bliskość profili nadreprezentacji w okręgach, która może nie mieć nic wspólnego z bliskością programów i haseł):

(1) KL-D, UD, UW, U P3, U PR 3 (2) U PR7, s l d7, SLD3, U P7

(3) PC, BBWR, K PN , S, PAREiR, POREiR, SOBR (4) ROP, AWS, KdR, X, Ojcz

(5) NChD, PSL3, PSL?, PSL-PL

Szczególnie stabilny jest pierwszy podzbiór (KL-D, U D, UW, UP3, U PR 3), który zachowuje się jako pierwszy także przy podziale na 4 i na 3 części. Partie KL-D i UD połączyły się po 1993 tworząc UW i zachowały zapewne elektorat tych partii. Partie, które weszły w wyborach 1997 roku do AWS, plasują się razem z AWS w trzecim i czwartym podzbiorze (z wyjątkiem PSL-PL). Bardzo blisko siebie są: U PR 3 i U PR 7, SLD7 i SLD3, ROP i K dR, PSL3 i PSL7; tylko U P3 i U P7 zachowują pewien dystans. Rozkłady „bliźniaków” i „trojaczków”

z wyborów 1993 i 1997 są bardzo do siebie zbliżone: ((KL-D, UD, UW), (SLD3, SLD,), (PSL3, PSL,)). Ustawienie okręgów (poza takimi specyficznymi dla 1997 roku wyjątkami jak opolskie) jest bardzo bliskie zaobserwowanemu w 1993 roku dla PS2xI5.

Tak więc dzięki połączeniu w jedną tabelę wyników wyborów z lat 1993 i 1997 stwierdzamy, że relacja partie-okręgi nie uległa w 1997 roku wyraźnej zmianie w porównaniu z rokiem 1993. Jednakże ustalenie, co wpłynęło na zaobserwowane ukształtowanie tej relacji, nie leży już w kompetencjach statystyków - chociaż trudno nie zauważyć związku między sytuacją gospodar­

czą okręgów a deklaracjami partii dotyczącymi reform gospodarczych.

Uwagi końcowe

Relację najsilniejszej monotonicznej zależności między parą uporządkowań wierszy i kolumn tabeli klasyfikacyjnej powinno się uzupełnić dalszą analizą tabeli, polegającą na wyszukaniu elementów odstających i wyznaczeniu dwu­

wymiarowych reprezentacji dla wierszy i dla kolumn.

Elementami odstającymi są w tym przypadku te wiersze i/lub te kolumny, które wyraźnie „odstają” od monotonicznej relacji wyznaczonej za pomocą GCA. Wstępna analiza dokonana przez W. Szczęsnego wykazała, że w tabelach wyborczych dotyczy to przede wszystkim partii SOBR (Samoobrona). Wskaź­

nik aL(SOBR,P) jest bardzo wysoki dla dowolnej partii P i nie różnicuje się zgodnie z położeniem SOBR w ciągu partii uporządkowanym według GCA.

Dwuwymiarowa reprezentacja 25 partii na podstawie macierzy wskaźników zróżnicowania aL w rozkładzie P,2x2S (rys. 7) została także wstępnie zrobiona

(18)

66 W. SZCZĘSNY, A. CIOK, T. KOWALCZYK, E. PLESZCZYŃSKA, W. WYSOCKI

przez Olafa Matyję we współpracy z W. Szczęsnym. Okazało się, że, po odrzuceniu dwóch elementów odstających (w tym Samoobrony), otrzymuje się reprezentację zgodną w głównym zarysie z podziałem 25 partii na 5 podzbiorów za pomocą GCA.

Jest to ważny wynik, gdyż wiadomo, że w dotychczasowej analizie danych próby łączenia metody skalowania jednowymiarowego (seriacji) i dwuwymiaro­

wego nie prowadziły na ogół do zgodnych ze sobą wyników.

Prace Szczęsnego i Matyji nie są jeszcze zakończone, mamy jednak nadzieję, że w najbliższym czasie będą mogły być zgłoszone do publikacji.

Wyszukiwanie elementów odstających tabeli i odstępstwa od jednowymiaro­

wych reprezentacji jej wierszy i kolumn m a duże znaczenie. Jest rzeczą ważną, aby narzędzia używane do tego celu tworzyły jednolity koncepcyjnie i spójny system.

Literatura

Cifarelli, D .M ., E. Regazzini. 1987. On a general definition o f concentration function. „Sankhya” В 49, 307-319.

Ciok, A., T. Kowalczyk, Е. Pleszczyńska, W. Szczęsny. 1995a. Algorithms o f grade correspondence-cluster analysis. „Archiwum Informatyki Teoretycznej i Stosowanej” 7, 5-22.

Ciok, A., T. Kowalczyk, E. Pleszczyńska, W. Szczęsny. 1995b. Gradacyjna analiza statystyczna badań nad pojmowaniem demokracji. W: J. Reykowski (red.) Potoczne wyobrażenia o demokracji. Psychologiczne uwarunkowania i konsek­

wencje. Warszawa: Wydawnictwo Instytutu Psychologii PAN, s. 275-307.

Ciok, A. 1998. Discretization as a tool in cluster analysis. W: Rizzi A., Vichi M., Bock H.-H (eds.) Advances in Data Science and Classification, Proceedings o f the 6th Conference o f the International Federation o f Classification Societies, Rome, July 21-24 1998, Springer.

Ciok, A., T. Kowalczyk, E. Pleszczyńska. 1998. How a new statistical infrastruc­

ture induces a new computing trend in data analysis. W: L. Polkowski, A.

Skowron (red.): Rough Sets and Current Trends in Computing, RSCTC’98, First International Conference, Warsaw, Poland, June 1998, Proceedings.

Springer, Heidelberg, 75-82.

Fogelson, S. 1933. Measures o f concentration and their applications. „K w artal­

nik Statystyczny” 10, 149-197.

Govaert, G. 1984. Classification simultanee de tableaux binaires. W: E. Diday i inni (eds.), Data Analysis and Informatics, III. Elsevier Science Publishers B.V. (North-Holland), 223-236.

Kowalczyk, Т., A. Ciok, E. Pleszczyńska, W. Szczęsny. 1996. Grade dependence in bivariate case. A uniform approach based on concentration curves. Prace IPI PAN nr 815, 1-32.

(19)

Kowalczyk, T. 1994. A unified Lorenz-type approach to divergence and dependen­

ce. „Dissertationes M athematicae” CCCXXXV, 1-54.

Kowalczyk, T. 1997. Properties o f the standard concepts o f monotone dependence based on separation curves. „Discussiones Mathematicae, Algebra and Stochastic M ethods” 17, 143-156.

Kowalczyk, T. 1998. Decomposition o f the concentration index and Gini dependence measures. „Statistics in Transition” 3, No 3, 503-521.

Lehmann, E.L. 1966. Some concepts o f dependence. „Ann. M ath. Statist.” 37, 1137-1153.

Meulman, J.J. 1992. The integration o f multidimensional scaling and multivariate analysis with optimal transformations. „Psychometrika” 57, 539-565.

Rao, C.R. 1982. Analysis o f diversity: a unified approach. „Statist. Dec. Theory and Rel. Topics” III, 2, 233-250.

Schriever, B.F. 1985. Order Dependence. Vrije Universitet te Amsterdam.

Szczęsny, W., A. Ciok, E. Pleszczyńska. 1998. Clustering land districts according to their farm magnitude repartition. „Statistics in Transition” 3, No 4, Szczęsny, W., A. Ciok, T. Kowalczyk, E. Pleszczyńska, W. Wysocki. 1998.

Porównanie wyników wyborów do Sejmu RP w 1993 i 1997. Prace IPI PAN, nr 851, 1-39.

Yitzhaki, S., Olkin, I. 1991. Concentration indices and concentration curves.

„Stochastic Orders and Decision under Risk” , IMS Lecture Notes - M ono­

graph Series, 380-392.

Oznaczenia okręgów wyborczych w wyborach do Sejmu RP w latach 1993 i 1997 757-768.

DODATEK

1 st. Warszawa 27 łódzkie

2 warszawskie z wył. m. st. Warszawy 28 nowosądeckie 3 bialskopodlaskie

4 białostockie 5 bielskie 6 bydgoskie 7 chełmskie 8 ciechanowskie 9 częstochowskie 10 elbląskie 11 gdańskie 12 gorzowskie 13 jeleniogórskie 14 kaliskie

35 poznańskie 36 przemyskie 37 radomskie 38 rzeszowskie 39 siedleckie 40 sieradzkie 29 olsztyńskie 30 opolskie 31 ostrołęckie 32 pilskie 33 piotrkowskie 34 płockie

(20)

68 W. SZCZĘSNY, A. CIOK, T. KOWALCZYK, E. PLESZCZYŃSKA, W. WYSOCKI

15 katow. - Sosnowiec 16 katow. - Katowice 17 katow. - Gliwice 18 kieleckie

19 konińskie 20 koszalińskie 21 krakowskie 22 krośnieńskie 23 legnickie 24 leszczyńskie 25 lubelskie 26 łomżyńskie

41 skierniewickie 42 słupskie 43 suwalskie 44 szczecińskie 45 tarnobrzeskie 46 tarnowskie 47 toruńskie 48 wałbrzyskie 49 włocławskie 50 wrocławskie 51 zamojskie 52 zielonogórskie

The Grade Correspondence Analysis in Contingency Tables. Applications in Analysis of Elcetion Results in Voting to Parliament in 1993 and 1997

Summary

We present, here, grade correspondence analysis (GCA), which is some variant of standard correspondence analysis. GCA aims at maximizing the grade correlation coefficient in two-way contingency table consisting of a set of ordered pairs of its rows and columns. We also show how to aggregate rows and columns after transformation of the table by means of GCA. We perform these aggregations on tables concerning results on voting to the Polish parliament in 1993 and 1997 - it documents changes in voting preferences in Poland in this way. In addition, we carry out comparisons in time to evidence basic similarity in geography of voting preferences between 1993 and 1997.

Градационный анализ связей в таблицах контингенции.

Виды применений по отношению к анализу результатов голосования в Сейм Речи Посполитой за 1993 и 1997 годы

Резюме

В статье представляется градационный анализ связей (сокр. GCA, grade correspondence analysis), являющийся определенным типом стандартного анализа связей (correspondence analysis), в котором максимализируется градационный коэффициент корреляции двухдельной таблицы контингенции в совокупности пар упорядочений ее строк и колонн. Мы показываем также, как агрегировать строки и колонны после переработки таблицы с помощью GCA. Упорядочению и агрегации поддаются таблицы результатов выборов в Сейм в 1993 и 1997 гг., указывая изменения выборных предпочтений в стране. Мы проводим также сравнительный анализ результатов выборов и отмечаем сходство географии выборных предпочтений в 1993 и 1997 гг.

Cytaty

Powiązane dokumenty

Centralny Okręg Przemysłowy (wypisz ważniejsze ośrodki przemysłowe str.137 i wyślij).. Znaczenie COP dla rozwoju

Na niekorzyśš sondaży wpływa chociażby fakt, że stały się one towarem, dobrem które może zamówiš niemal każdy dysponujący pewną sumą pieniędzy, a że

Z takiego założenia wyszła grupa naukowców-humanistów z Wy- działu Filozoficzno-Historycznego Uniwersytetu Łódzkiego, którzy zainicjowali cykl spotkań

Prace w roku bleżąoym miały na celus zbadanie konstrukcji wału półnoonego i sprawdzenie ozy Istniał w tej częśol mur obwodowy zam­ ku.. Założono 2 wykopy o

Dekomunizacja to prawna ochrona społeczeństwa przed dominacją funkcjonariuszy partii komunistycznej w politycznym, prawnym i gos­ podarczym aparacie państwa.. Od trzech

Sea level rise, storm surge and high river discharge would increase water levels in the Huangpu River, the improvement of the floodwall (keep protection level of 1000 years

Nie w pełni rozwinięte wydają się niektóre postulaty badawcze: najdotkliwsze braki można odczuwać w pierwszym rozdziale, w którym — pod dosyć ogólniko- wym hasłem