Katarzyna Wawrzyniak
Zachodniopomorski Uniwersytet Technologiczny w Szczecinie
ANALIZA PORÓWNAWCZA WYNIKÓW DIAGNOZOWANIA ILOŚCIOWEGO W MAKROSKALI
Streszczenie: Celem artykułu było wykazanie, że metody ilościowe służące do klasyfi - kacji obiektów realizują zarówno funkcję analityczną, jak i funkcję diagnostyczną. Do klasyfi kacji województw w Polsce pod względem sytuacji gospodarczej w 2009 roku wy- korzystano: parametry położenia i dyspersji charakteryzujące strukturę zbiorowości ze względu na poziom zmiennych diagnostycznych, taksonomiczny miernik rozwoju oraz analizę korespondencji z procedurą podwajania obserwacji.
Dla każdego z wymienionych sposobów klasyfi kacji przeanalizowano stopień wyko- rzystania elementów procesu diagnozowania wartościującego, czyli normy, odchylenia od normy oraz tolerancji odchylenia od normy. Ponadto porównano otrzymane wyniki klasyfi kacji.
Słowa kluczowe: diagnozowanie ilościowe, parametry położenia i dyspersji, taksono- miczny miernik rozwoju, klasyczna analiza korespondencji z procedurą podwajania ob- serwacji.
Wstęp
W pracy Wawrzyniak [2007] zwrócono uwagę, że diagnozowanie (diagnoza) może być rozumiane jako rozpoznanie w sensie opisu (charakterystyki, identyfi - kacji) albo jako rozpoznanie wartościujące, dające podstawy do oceny ze wzglę- du na przyjęty punkt odniesienia – normę. Połączenie obu znaczeń diagnozowa- nia z funkcjami metod ilościowych [Hozer i Zawadzki 1990, s. 158]1 pozwala utożsamiać pierwsze znaczenie diagnozowania z funkcją analityczno-opisową,
1 W cytowanej pracy autorzy przypisują wymienione funkcje tylko modelom ekonometrycz- nym, jednak jest zasadne, by te funkcje uogólnić na metody ilościowe i w dalszej części artykułu zostało przyjęte takie uogólnienie.
a drugie – z funkcją diagnostyczno-kontrolną. To z kolei daje podstawy do stwier- dzenia, że wykorzystując metody ilościowe w ich funkcji analitycznej, realizuje- my cel poznawczy tych metod, natomiast wykorzystując metody ilościowe w ich funkcji diagnostycznej, realizujemy cel instrumentalny2.
Głównym celem artykułu jest wykazanie, że metody ilościowe służące do kla- syfi kacji obiektów realizują zarówno funkcję analityczną, jak i funkcję diagno- styczną, przy czym ostateczna klasyfi kacja obiektów (diagnoza końcowa) łączy w sobie aspekt opisowy oraz wartościujący. Dla przedstawionych w artykule spo- sobów klasyfi kacji porównano stopień wykorzystania przy formułowaniu diagno- zy końcowej elementów procesu diagnozowania wartościującego, czyli normy, odchylenia od normy oraz tolerancji odchylenia od normy3. Ponadto porównano wyniki klasyfi kacji.
Do klasyfi kacji województw w Polsce pod względem sytuacji gospodarczej w 2009 roku, czyli do sformułowania ostatecznej diagnozy, wykorzystano:
– parametry położenia i dyspersji charakteryzujące strukturę zbiorowości ze względu na poziom zmiennej diagnostycznej,
– taksonomiczny miernik rozwoju,
– analizę korespondencji z procedurą podwajania obserwacji.
1. Charakterystyka materiału statystycznego
W procesie diagnozowania wykorzystano następujące zmienne charakteryzujące sytuację gospodarczą województw4: stopę bezrobocia – SB (w %), udział pracują- cych w sektorze III (usługowym) – UP (w %), przeciętny miesięczny dochód na osobę – MD (w zł), produkcję sprzedaną przemysłu na mieszkańca – PS (w zł), liczbę jednostek nowo zarejestrowanych w rejestrze REGON na 10 tys. ludności – PN, sprzedaż detaliczną na 1 mieszkańca – SD (w zł), nakłady inwestycyjne na mieszkańca – NI (w zł), liczbę mieszkań oddanych do użytku na 10 tys. miesz- kańców – MO. Wśród zmiennych diagnostycznych tylko stopa bezrobocia jest destymulantą, a pozostałe zmienne to stymulanty. Wartości zmiennych diagno- stycznych dla poszczególnych województw oraz dla Polski ogółem zaprezento- wano w tabeli 1.
2 W artykule Czerwińskiego [1976] zostały podane dwa ogólne cele budowy modeli ekonome- trycznych, mianowicie cel poznawczy oraz cel instrumentalny. Cel poznawczy przejawia się w wy- krywaniu „prawidłowości rządzących systemem”, natomiast cel instrumentalny w „trafnym przewi- dywaniu stanu systemu w przyszłości” oraz w „sterowaniu systemem”.
3 Diagnozowanie ekonometryczne jako proces składający się z czterech elementów zdefi nio- wał Hozer [Hozer 1989; Hozer i Zawadzki 1990, s. 162].
4 Skrócone nazwy zmiennych będą wykorzystywane w dalszej części artykułu przy prezentacji wyników w tabelach i na wykresie.
Tabela 1. Wartości zmiennych diagnostycznych dla województw i Polski w 2009 roku*
Województwo SB UP MD PS PN SD NI MO
Dolnośląskie
(DŚ) 10,1 57,4 1130,16 27 429 102 13 521 6519 49,2
Kujawsko-po-
morskie (KP) 10,4 53,0 979,17 19 030 88 9 928 5375 32,4 Lubelskie (LB) 9,7 50,1 861,42 9 960 69 8 579 3673 28,2 Lubuskie (LS) 9,6 58,0 1056,64 21 416 104 9 617 4380 36,9 Łódzkie (ŁD) 7,6 53,5 1065,07 19 163 88 10 378 5250 24,9 Małopolskie
(MP) 8,0 54,3 1006,51 16 611 95 16 453 4526 57,0
Mazowieckie
(MZ) 6,0 65,1 1385,09 34 825 100 35 109 8723 74,8
Opolskie (OP) 9,8 51,3 1020,84 20 081 76 7 340 4409 17,1 Podkarpackie
(PK) 10,0 49,3 795,52 13 157 68 8 897 4064 26,0
Podlaskie (PL) 7,1 49,2 978,20 13 701 75 10 362 3892 35,5 Pomorskie (PM) 6,4 58,8 1127,69 25 000 113 12 019 7903 64,6 Śląskie (ŚL) 6,7 56,9 1068,09 35 480 85 10 698 6117 22,9 Świętokrzyskie
(ŚW) 10,9 48,2 909,40 15 726 71 9 481 4861 14,9
Warmińsko-ma-
zurskie (WM) 8,5 57,0 1042,17 14 234 89 8 211 4101 34,0 Wielkopolskie
(WP) 7,5 48,4 1063,78 28 906 98 21 490 5390 42,0
Zachodniopo-
morskie (ZP) 10,3 61,7 1104,08 15 481 118 11 539 5034 45,7
Polska 8,2 55,6 1071,70 23 494 92 15 275 5729 42,0
* Przy nazwach województw w nawiasach podano ich skrócone oznaczenia, które będą wykorzystywane w dal- szej części artykułu w tabelach i na wykresie.
Źródło: Bank danych lokalnych, a dla zmiennych UP i MD – Wskaźniki monitorujące – Strategia Rozwoju Kra- ju, GUS (www.stat.gov.pl).
2. Diagnozowanie ilościowe z wykorzystaniem miar położenia i miar dyspersji
Pierwszy zaproponowany w artykule sposób klasyfi kacji polegał na wykorzy- staniu jako narzędzia diagnostycznego parametrów położenia i dyspersji charak- teryzujących strukturę zbiorowości ze względu na wybraną zmienną. Diagnozy cząstkowe (ocena z punktu widzenia jednej zmiennej diagnostycznej) dla po- szczególnych województw wyznaczono w trójelementowym procesie diagnozo-
wania, czyli obok prawidłowości zaobserwowanej (xij – wartość j-tej zmiennej w i-tym obiekcie; j = 1, 2, …, k; i = 1, 2, …, n) i prawidłowości normatywnej (Mj – mediana przestrzenna Webera5 dla j-tej zmiennej) uwzględniono odchyle- nie od normy (Qj – medianowe odchylenie bezwzględne6 dla j-tej zmiennej). Za- stosowanie w badaniu miar pozycyjnych wynikało z asymetryczności rozkładów zmiennych diagnostycznych (dla 6 zmiennych diagnostycznych klasyczna miara skośności wskazywała na silną lub umiarkowaną asymetrię – tabela 2)7.
Tabela 2. Parametry rozkładu wykorzystane do sformułowania diagnoz cząstkowych
Parametr
struktury SB UP MD PS PN SD NI MO
Skośność –0,28 0,50 0,74 0,76 0,16 2,63 1,32 0,77
Mediana przestrzenna
Webera (Mj) 8,41 53,60 1040,2 19 041,3 88,5 10 400,3 5186,6 28,37 Medianowe od-
chylenie bez-
względne (Qj) 1,49 4,05 61,5 5073,8 12,9 1561,0 868,5 9,90 Źródło: obliczenia własne na podstawie tabeli 1.
Diagnozy cząstkowe (dczij – diagnoza i-tego obiektu ze względu na j-tą zmien- ną diagnostyczną) sformułowano według zasady:
dla stymulant dla destymulant
1 dla , 4 dla ,
2 dla , 3 dla ,
3 dla , 2 dla ,
4 dla , 1 dla .
ij j j ij j j
j j ij j j j ij j
ij ij
j ij j j j ij j j
ij j j ij j j
x M Q x M Q
M Q x M M Q x M
dcz dcz
M x M Q M x M Q
x M Q x M Q
d
° d ° d
° °
® d ® d
° °
° ! ° t
¯ ¯
5 Mediana przestrzenna Webera została obliczona z wykorzystaniem pakietu pcaPP w pro- gramie R. Interesujące rozważania teoretyczne dotyczące mediany przestrzennej Webera oraz jej praktycznego wykorzystania do klasyfi kacji pozycyjnej powiatów województwa wielkopolskie- go ze względu na stan ochrony środowiska w 2002 roku znajdują się w pracy Młodaka [2006, s. 131–160].
6 Medianowe odchylenie bezwzględne zostało wyznaczone zgodnie z propozycją zamieszczo- ną w pracy Liry, Wagnera i Wysockiego [2002, s. 91], czyli jako mediana z bezwzględnych odchy- leń wartości j-tej zmiennej od mediany przestrzennej Webera dla tej zmiennej.
7 Silna asymetria rozkładu uzasadnia zastosowanie klasyfi kacji pozycyjnej opartej na medianie przestrzennej Webera [Lira, Wagner i Wysocki 2002, s. 99]. Rozważania dotyczące wykorzystania klasycznych oraz pozycyjnych miar położenia i dyspersji w procesie diagnozowania można znaleźć w pracy Wawrzyniak [2000].
Wynika z tego, że najlepiej oceniono ten obiekt, któremu przyporządkowano liczbę 4, a najgorzej ten, któremu przyporządkowano liczbę 1. Diagnozę koń- cową sformułowano, wykorzystując medianę obliczoną na podstawie diagnoz cząstkowych dla i-tego obiektu:
mediana{ }
i j ij
M dcz . (1)
Wyniki diagnozowania zaprezentowano w tabeli 3.
Tabela 3. Diagnozy cząstkowe i diagnoza końcowa sytuacji gospodarczej województw w Polsce w 2009 roku
Województwo SB UP MD PS PN SD NI MO
Mi Diagnoza końcowa dczi1 dczi2 dczi3 dczi4 dczi5 dczi6 dczi7 dczi8
Dolnośląskie 1 3 4 4 4 4 4 4 4 bardzo dobra
sytuacja gospodarcza
Mazowieckie 4 4 4 4 3 4 4 4 4
Pomorskie 4 4 4 4 4 4 4 4 4
Zachodniopomorskie 1 4 4 2 4 3 3 4 3,5
dobra sytuacja gospodarcza
Lubuskie 2 4 3 3 4 3 3 3 3
Łódzkie 3 2 3 3 2 3 3 3 3
Małopolskie 3 3 2 2 3 4 3 4 3
Śląskie 4 3 3 4 2 3 4 3 3
Wielkopolskie 3 1 3 4 3 4 3 4 3
Warmińsko-mazurskie 2 3 3 2 3 1 1 3 2,5
zła sytuacja gospodarcza
Kujawsko-pomorskie 1 2 2 2 2 3 3 3 2
Opolskie 2 2 2 3 2 1 3 1 2
Lubelskie 2 2 1 1 1 1 1 2 1
bardzo zła sytuacja gospodarcza
Podkarpackie 1 1 1 1 1 3 1 3 1
Podlaskie 3 1 1 1 1 3 1 3 1
Świętokrzyskie 1 1 1 2 1 3 3 1 1
Źródło: Obliczenia własne na podstawie danych tabeli 1.
3. Diagnozowanie ilościowe z wykorzystaniem taksonomicznego miernika rozwoju
Stosując ten sposób klasyfi kacji do wydzielenia czterech grup typologicznych, czyli do sformułowania ostatecznej diagnozy sytuacji gospodarczej województw, wykorzystano taksonomiczny miernik rozwoju obliczony według wzoru8:
8 Taką formułę agregacji wartości zmiennych diagnostycznych wybrano ze względu na to, że wszystkie zmienne są mierzone na skali ilorazowej. Do zamiany destymulant na stymulanty wy- korzystano formułę ilorazową, a normalizacji wartości zmiennych dokonano, wykorzystując prze- kształcenie ilorazowe [Gatnar i Walesiak 2004, s. 355].
Tabela 4. Taksonomiczny miernik rozwoju, grupy typologiczne i diagnoza końcowa sytuacji gospodarczej województw w Polsce w 2009 roku
Województwo TMRi Grupa
typologiczna Diagnoza końcowa
Dolnośląskie 1,046 4
bardzo dobra sytuacja gospodarcza
Mazowieckie 1,500 4
Pomorskie 1,173 4
Wielkopolskie 1,075 4
Lubuskie 0,900 3
dobra sytuacja gospodarcza
Małopolskie 0,988 3
Śląskie 0,999 3
Zachodniopomorskie 0,950 3
Kujawsko-pomorskie 0,848 2
zła sytuacja gospodarcza
Łódzkie 0,874 2
Podlaskie 0,819 2
Warmińsko-mazurskie 0,825 2
Lubelskie 0,700 1
bardzo zła sytuacja gospodarcza
Opolskie 0,756 1
Podkarpackie 0,707 1
Świętokrzyskie 0,717 1
Skośność 1,416
Kwartyl 1 (Q1) 0,788
Mediana (M) 0,887
Kwartyl 3 (Q3) 1,023
Odchylenie ćwiartkowe (Q) 0,118
M – Q 0,769
M + Q 1,005
Źródło: Obliczenia własne.
1
1 k
i ij
j
TMR z
k
¦
, (2)gdzie:
zij – znormalizowana wartość j-tej zmiennej w i-tym obiekcie (xij), i = 1, 2, …, n;
j = 1, 2, …, k,
n – liczba obiektów (województw), k – liczba zmiennych diagnostycznych.
W zbiorze zmiennych diagnostycznych znajduje się jedna destymulanta (stopa bezrobocia – SB), którą przekształcono w stymulantę według wzoru:
1
i D
i
SB SB . (3)
Normalizacji wartości zmiennych diagnostycznych dokonano według formuły:
ij ij
j
z x
x , (4)
gdzie xj – wartość średnia j-tej zmiennej równa w tym badaniu wartości tej zmien- nej w Polsce (tab. 1).
Do wydzielenia czterech grup typologicznych województw wykorzystano dwa parametry charakteryzujące rozkład taksonomicznego miernika rozwoju: media- nę (MTMR) oraz odchylenie ćwiartkowe (QTMR)9, a podziału województw dokona- no według zasady:
– grupa 1 – dla TMRi ≤ MTMR – QTMR,
– grupa 2 – dla MTMR – QTMR < TMRi ≤ MTMR, – grupa 3 – dla MTMR < TMRi ≤ MTMR + QTMR, – grupa 4 – dla TMRi > MTMR + QTMR.
Wyniki diagnozowania z wykorzystaniem taksonomicznego miernika rozwoju przedstawiono w tabeli 4.
4. Diagnozowanie ilościowe z wykorzystaniem klasycznej analizy korespondencji z procedurą podwajania obserwacji
Trzecim sposobem klasyfi kacji wykorzystanym w artykule jest klasyczna analiza korespondencji z procedurą podwajania obserwacji10. Z diagnostycznego punktu widzenia istotnym walorem tego sposobu jest możliwość przedstawienia w jednej przestrzeni rzutowania zarówno obiektów (województw), jak i wariantów zmien- nych diagnostycznych (rang i antyrang). To z kolei daje podstawy do sformuło- wania ostatecznej diagnozy łączącej aspekt analityczny i wartościujący11.
Tabela 5 przedstawia macierz rang i antyrang nadanych wartościom poszcze- gólnych zmiennych. Dla stymulant rangę najniższą przyznano najmniejszej wartości zmiennej, a rangę najwyższą – wartości największej. Dla destymulant najniższą rangę otrzymała największa wartość zmiennej, a najwyższą rangę –
9 W artykule wykorzystano propozycję wydzielenia grup typologicznych obiektów na podsta- wie wartości taksonomicznego miernika rozwoju przedstawioną w pracy Nowaka [1990, s. 93], przy czym klasyczne parametry położenia i dyspersji zastąpiono ich odpowiednikami pozycyjnymi ze względu na silną asymetrię rozkładu wartości taksonomicznego miernika rozwoju.
10 Klasyczna analiza korespondencji jest stosowana zazwyczaj do dużych prób scharakteryzo- wanych za pomocą współistniejących zmiennych niemetrycznych, a punktem wyjścia do obliczeń jest tablica kontyngencji. Rozszerzeniem możliwości aplikacyjnych klasycznej analizy korespon- dencji dla małych prób jest zastosowanie złożonej macierzy znaczników albo procedury podwaja- nia obserwacji [Stanimir 2005, s. 108–110].
11 Diagnostyczny charakter klasycznej analizy korespondencji z procedurą podwajania obser- wacji został przedstawiony w pracach Wawrzyniak [2011a, 2011b].
wartość najmniejsza. Antyrangi przyznano na zasadzie całkowitego przeciwień- stwa w stosunku do rang pierwotnych. Jeżeli dla badanej zmiennej wystąpiły ta- kie same wartości, to zastosowano rangi i antyrangi powiązane. Dla macierzy rang i antyrang przeprowadzono klasyczną analizę korespondencji, wykorzystu- jąc pakiet Statistica 9.0 – moduł Analiza korespondencji12.
W tabeli 6 zamieszczono najważniejsze wyniki pozwalające ocenić jakość od- wzorowania rzeczywistej przestrzeni rzutowania (K = 15)13 w przestrzeni dwuwy- miarowej. Pełne wyjaśnienie inercji całkowitej nastąpiło w przestrzeni ośmiowy- miarowej, natomiast w przestrzeni dwuwymiarowej stopień wyjaśnienia wynosi 76,4811%. Świadczy to o bardzo dobrym odzwierciedleniu powiązań między ka- tegoriami zmiennych z rzeczywistej przestrzeni rzutowania w przestrzeni dwu- wymiarowej. Na podstawie wartości zamieszczonych w tabeli 7 można stwier-
12 Szczegółowy opis metodologii dotyczącej klasycznej analizy korespondencji znajduje się w pracy Stanimira [2005, s. 21–29].
13 Wymiar rzeczywistej przestrzeni rzutowania obliczamy ze wzoru K = min{r – 1, c – 1}, gdzie r oznacza liczbę kategorii pierwszej zmiennej (r = 16 województw), natomiast c oznacza liczbę ka- tegorii drugiej zmiennej (c = 16 – rangi i antyrangi dla 8 zmiennych diagnostycznych).
Tabela 5. Macierz rang (r) i antyrang (ar) dla zmiennych diagnostycznych Woje-
wódz- two
SB UP MD PS PN SD NI MO
Sumar ar r ar r ar r Ar r ar r ar r ar r ar
DŚ 4 13 12 5 15 2 13 4 13 4 13 4 14 3 13 4 136
KP 2 15 7 10 5 12 8 9 7,5 9,5 7 10 11 6 7 10 136
LB 7 10 5 12 2 15 1 16 2 15 3 14 1 16 6 11 136
LS 8 9 13 4 9 8 11 6 14 3 6 11 5 12 10 7 136
ŁD 11 6 8 9 11 6 9 8 7,5 9,5 9 8 10 7 4 13 136
MP 10 7 9 8 6 11 7 10 10 7 14 3 7 10 14 3 136
MZ 16 1 16 1 16 1 15 2 12 5 16 1 16 1 16 1 136
OP 6 11 6 11 7 10 10 7 5 12 1 16 6 11 2 15 136
PK 5 12 4 13 1 16 2 15 1 16 4 13 3 14 5 12 136
PL 13 4 3 14 4 13 3 14 4 13 8 9 2 15 9 8 136
PM 15 2 14 3 14 3 12 5 15 2 12 5 15 2 15 2 136
ŚL 14 3 10 7 12 5 16 1 6 11 10 7 13 4 3 14 136
ŚW 1 16 1 16 3 14 6 11 3 14 5 12 8 9 1 16 136
WM 9 8 11 6 8 9 4 13 9 8 2 15 4 13 8 9 136
WP 12 5 2 15 10 7 14 3 11 6 15 2 12 5 11 6 136
ZP 3 14 15 2 13 4 5 12 16 1 11 6 9 8 12 5 136
Suma 136 136 136 136 136 136 136 136 136 136 136 136 136 136 136 136 2176 Skróty wyjaśniono w tabeli 1.
Źródło: Obliczenia własne na podstawie danych z tabeli 1.
Tabela 6. Wartości osobliwe, wartości własne i stopień wyjaśnienia inercji całkowitej w rzeczywistej przestrzeni rzutowania
k Wartości osobliwe (γk)
Wartości własne (λk = γk2)
Procentowy udział wartości własnych w inercji całkowitej
(λk / λ· 100%)
Skumulowany procentowy udział wartości własnych w inercji całkowitej
(τk · 100%)
1 0,429649 0,184599 62,77505 62,7751
2 0,200760 0,040305 13,70609 76,4811
3 0,178390 0,031823 10,82181 87,3030
4 0,149528 0,022359 7,60334 94,9063
5 0,081600 0,006659 2,26434 97,1706
6 0,063123 0,003985 1,35499 98,5256
7 0,051381 0,002640 0,89778 99,4234
8 0,041177 0,001696 0,57659 100,0000
9 0,000000 0,000000 0,00000 100,0000
10 0,000000 0,000000 0,00000 100,0000
11 0,000000 0,000000 0,00000 100,0000
12 0,000000 0,000000 0,00000 100,0000
13 0,000000 0,000000 0,00000 100,0000
14 0,000000 0,000000 0,00000 100,0000
15 0,000000 0,000000 0,00000 100,0000
Inercja całkowita (λ) 0,304197 Źródło: Obliczenia własne na podstawie danych z tabeli 5.
Tabela 7. Jakość odwzorowania punktów obrazujących kategorie zmiennych (rang i antyrangi oraz województw) w przestrzeni dwuwymiarowej
Kolumny
tabeli 5 Jakość odwzorowania Wiersze
tabeli 5 Jakość odwzorowania
SB_r 0,403738 DŚ 0,715040
SB_ar 0,403738 KP 0,253777
UP_r 0,777326 LB 0,934375
UP_ar 0,777326 LS 0,438734
MD_r 0,878056 ŁD 0,492637
MD_ar 0,878056 MP 0,239575
PS_r 0,866130 MZ 0,940552
PS_ar 0,866130 OP 0,650695
PN_r 0,895957 PK 0,961702
PN_ar 0,895957 PL 0,468926
SD_r 0,708679 PM 0,922739
SD_ar 0,708679 ŚL 0,799537
NI_r 0,821079 ŚW 0,802804
NI_ar 0,821079 WM 0,593908
MO_r 0,767718 WP 0,583671
MO_ar 0,767718 ZP 0,829160
Źródło: Obliczenia własne na podstawie danych z tabeli 5.
dzić, że również jakość odwzorowania poszczególnych punktów obrazujących kategorie zmiennych (rang i antyrang oraz województw) jest bardzo wysoka. Wy- jątkiem są punkty obrazujące województwa kujawsko-pomorskie i małopolskie, dla których jakość odwzorowania jest na poziomie 0,24–0,25. Niska jakość od- wzorowania świadczy o tym, że punkty te leżą blisko centrum rzutowania, a więc ich profi le są zbliżone do wartości profi li średnich, czyli ocena ich przynależności do danej grupy obiektów nie jest jednoznaczna. Grafi czne przedstawienie wyni- ków analizy korespondencji z procedurą podwajania obserwacji daje podstawy do wydzielenia czterech grup województw. Grupy te różnią się między sobą ze względu na te kategorie zmiennych diagnostycznych (rangi i antyrangi), które znajdują się w tej samej ćwiartce układu współrzędnych, a to z kolei umożliwia wskazanie słabych i mocnych stron województw ze względu na poziom zmien- nych diagnostycznych.
Prezentację wyników klasycznej analizy korespondencji w przestrzeni dwu- wymiarowej przedstawiono na rysunku, a w tabeli 8 sformułowano ostateczną diagnozę sytuacji gospodarczej województw.
Grafi czna prezentacja wyników analizy korespondencji
Źródło: Obliczenia własne wykonane w Excelu -0,5 -0,4 -0,3 -0,2 -0,1 0,0 0,1 0,2 0,3 0,4 0,5
–0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0
:\PLDUZDUWRĞüZáDVQDLQHUFMLFDáNRZLWHM :\PLDU±ZDUWRĞüZáDVQD LQHUFMLFDáNRZLWHM
ZP
PN_r
'ĝ PM MP
LS
UP_r MO_r
MZ MD_r
SD_r NI_r
PS_r SB_r
WP
ĝ/
à' SB_arWM
PS_ar
SD_ar KP NI_ar
MD_ar LB PK
PL ĝ: OP
PN_ar UP_ar MO_ar
grupa 4 grupa 3
grupa 2 grupa 1
Zakończenie
Z przeprowadzonych badań wynika, że każdy z zaprezentowanych w artykule sposobów klasyfi kacji umożliwia wydzielenie czterech grup województw różnią- cych się między sobą poziomem zmiennych diagnostycznych i uporządkowanie ich od najlepszej do najgorszej pod względem sytuacji gospodarczej. Potwier- dza to, że sformułowanie końcowej diagnozy łączy aspekt opisowy (analityczny) i wartościujący.
Przy zastosowaniu pierwszego sposobu klasyfi kacji funkcja analityczna jest realizowana już przy formułowaniu diagnoz cząstkowych, w których warunkiem koniecznym jest identyfi kacja rozkładu zmiennych diagnostycznych. Dopiero na tej podstawie są określane parametry struktury, będące elementami procesu diagnozowania. Diagnozy cząstkowe sformułowano w trzyelementowym pro- cesie diagnozowania, czyli wartości rzeczywiste zmiennych diagnostycznych Tabela 8. Diagnoza końcowa sytuacji gospodarczej województw w Polsce w 2009 roku
Numer
grupy Województwo Mocne/słabe strony w grupie województw Diagnoza końcowa
4
mazowieckie śląskie wielkopolskie łódzkie
mocne strony: niska stopa bezrobocia oraz wyso- ki poziom takich zmiennych, jak przeciętny mie- sięczny dochód na osobę, nakłady inwestycyjne na mieszkańca, produkcja sprzedana przemysłu na mieszkańca, sprzedaż detaliczna na mieszkańca
bardzo dobra sytuacja gospodar-
cza
3
dolnośląskie pomorskie
zachodniopomorskie małopolskie lubuskie
mocne strony: wysoki poziom takich zmiennych, jak udział pracujących w usługach, mieszkania od- dane do użytku na 10 tys. ludności, jednostki nowo zarejestrowane w rejestrze REGON na 10 tys. lud- ności
dobra sytuacja gospodar-
cza
2
opolskie świętokrzyskie podlaskie
słabe strony: niski poziom takich zmiennych, jak udział pracujących w usługach, mieszkania odda- ne do użytku na 10 tys. ludności, jednostki nowo zarejestrowane w rejestrze REGON na 10 tys. lud- ności
zła sytuacja gospodar-
cza
1
lubelskie
kujawsko-pomorskie podkarpackie warmińsko-mazurskie
słabe strony: wysoka stopa bezrobocia oraz ni- ski poziom takich zmiennych, jak przeciętny mie- sięczny dochód na osobę, nakłady inwestycyjne na mieszkańca, produkcja sprzedana przemysłu na mieszkańca, sprzedaż detaliczna na mieszkańca
bardzo zła sytuacja gospodar-
cza Źródło: opracowanie własne na podstawie rysunku 1.
dla poszczególnych województw porównano z normą i odchyleniem od normy.
Na tej podstawie sformułowano diagnozę końcową, która ma przede wszystkim charakter wartościujący. Identyfi kację województw należących do danej grupy można uznać za częściową realizację funkcji analitycznej. Pełna realizacja tej funkcji miałaby miejsce wówczas, gdyby można było scharakteryzować szcze- gółowo poszczególne grupy województw pod względem poziomu zmiennych diagnostycznych, ale w tym wypadku wymaga to przeanalizowania diagnoz cząstkowych.
Jeżeli klasyfi kacja jest przeprowadzana za pomocą drugiego i trzeciego sposo- bu, aspekt analityczny uwidacznia się dopiero przy formułowaniu diagnozy koń- cowej, przy czym w wypadku sposobu drugiego ma miejsce częściowa realizacja funkcji analitycznej (analogicznie do pierwszego sposobu), natomiast w wypad- ku trzeciego pełna – oprócz identyfi kacji województw należących do danej gru- py możliwa jest bezpośrednia charakterystyka tych grup ze względu na poziom zmiennych diagnostycznych (określenie słabych i mocnych stron). Aspekt war- tościujący tych sposobów klasyfi kacji uwidacznia się przy formułowaniu zarów- no diagnoz cząstkowych, jak i diagnozy końcowej (uporządkowanie grup woje- wództw od najlepszej do najgorszej sytuacji gospodarczej). Przy formułowaniu diagnoz cząstkowych drugim sposobem wykorzystano dwuelementowy proces diagnozowania (normalizację zmiennych diagnostycznych), czyli wartości rze- czywiste zmiennych diagnostycznych dla poszczególnych województw porów- nano tylko ze średnią danej zmiennej dla Polski. Natomiast przy zastosowaniu sposobu trzeciego diagnozy cząstkowe otrzymano przez nadanie rang i antyrang wartościom zmiennych diagnostycznych i nie można wyróżnić elementów pro- cesu diagnozowania, ale na pewno można stwierdzić, że rangi i antyrangi mają charakter wartościujący.
Na zakończenie badań porównano otrzymane klasyfi kacje14 i okazało się, że zastosowanie dwóch pierwszych sposobów daje bardzo zbliżone wyniki, natomiast różni się od nich klasyfi kacja uzyskana sposobem 3. Rozbieżności spowodowane są tym, że w dwóch pierwszych metodach diagnoza końcowa formułowana jest na podstawie wszystkich diagnoz cząstkowych, natomiast w metodzie 3 diagnoza końcowa jest wypadkową tylko tych diagnoz cząstko- wych, które pozwalają zidentyfi kować mocne i słabe strony badanych woje- wództw.
14 Współczynniki korelacji rang Spearmana obliczone pomiędzy wynikami otrzymany- mi poszczególnymi sposobami klasyfi kacji wynoszą odpowiednio: R12 = 0,897, R13 = 0,728, R23 = 0,721.
Bibliografi a
Czerwiński, Z., 1976, Przyczynek do dyskusji nad problemem „dobrego” modelu ekono- metrycznego, Przegląd Statystyczny, nr 4.
Gatnar, E., Walesiak, M. (red.), 2004, Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wydawnictwo Akademii Ekonomicznej im. O. Lange- go we Wrocławiu, Wrocław.
Hozer, J., 1989, Funkcja diagnostyczna modeli ekonometrycznych, Wiadomości Staty- styczne, nr 2.
Hozer, J., Zawadzki, J., 1990, Zmienna czasowa i jej rola w badaniach ekonometrycz- nych, PWN, Warszawa.
Lira, J., Wagner, W., Wysocki, F., 2002, Mediana w zagadnieniach porządkowania obiek- tów wielocechowych, w: Paradysz, J. (red.), Statystyka regionalna w służbie samorzą- du lokalnego i biznesu, Internetowa Ofi cyna Wydawnicza, Centrum Statystyki Regio- nalnej, Poznań.
Młodak, A., 2006, Analiza taksonomiczna w statystyce regionalnej, Difi n, Warszawa.
Nowak, E., 1990, Metody taksonomiczne w klasyfi kacji obiektów społeczno-gospodar- czych, PWE, Warszawa.
Stanimir, A., 2005, Analiza korespondencji jako narzędzie do badania zjawisk ekonomicz- nych, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław.
Wawrzyniak, K., 2000, Klasyczne i pozycyjne parametry struktury jako normy w procesie oceny działalności przedsiębiorstwa, w: Hozer, J. (red.), Metody ilościowe w ekono- mii, Zeszyty Naukowe nr 269, Prace Katedry Ekonometrii i Statystyki nr 8, Wydaw- nictwo Naukowe Uniwersytetu Szczecińskiego, Szczecin.
Wawrzyniak, K., 2007, Diagnozowanie ilościowe procesów i obiektów gospodarczych – podstawowe pojęcia, w: Hozer, J. (red.), Metody ilościowe w ekonomii, Zeszyty Na- ukowe nr 450, Prace Katedry Ekonometrii i Statystyki nr 17, Wydawnictwo Naukowe Uniwersytetu Szczecińskiego, Szczecin.
Wawrzyniak, K., 2011a, Analiza korespondencji jako narzędzie diagnostyczne w makro- skali, w: Dziechciarz, J. (red.), Ekonometria. Zastosowania metod ilościowych, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu nr 30, Wydawnictwo Uniwer- sytetu Ekonomicznego im. O. Langego, Wrocław.
Wawrzyniak, K., 2011b, Diagnoza sytuacji fi nansowo-ekonomicznej spółek giełdowych z wykorzystaniem klasycznej analizy korespondencji, Oeconomica, nr 287 (63), Folia Pomeranae Universitatis Technologiae Stetinensis, Wydawnictwo Uczelniane Zachod- niopomorskiego Uniwersytetu Technologicznego w Szczecinie, Szczecin.
THE COMPARATIVE ANALYSIS OF THE RESULTS OF QUANTITATIVE DIAGNOSING IN MACROECONOMICS
Summary: The aim of this article is to show that classifi cation methods fulfi ll both the analytic and the diagnostic tasks. For classifi cation of Polish voivodships according to their economic situation in 2009 the following approaches were applied:
1) measures of central tendency and dispersion of the diagnostic variables, 2) taxonomic measure of development,
3) simple correspondence analysis with doubling.
For every approach the following elements of the diagnostic process were analyzed:
norm, deviation from the norm and tolerance of the deviation from the norm. The clas- sifi cation results obtained by means of the three mentioned approaches were compared with each other.