Ekonometria 25 2009
Elżbieta Sobczak
Uniwersytet Ekonomiczny we Wrocławiu
ZASTOSOWANIE ANALIZY DYSKRYMINACYJNEJ DO PROFILOWANIA SEGMENTÓW W EUROPEJSKIEJ PRZESTRZENI REGIONALNEJ
Streszczenie: Cele opracowania to wykorzystanie deskryptywnej analizy dyskryminacyjnej do identyfikacji zmiennych profilowych przyczyniających się do największego zróżnicowa
nia segmentów oraz określenie ich profili. Podstawę badań stanowią wyniki segmentacji re
gionalnej ze względu na poziom i dynamikę rozwoju gospodarczego bazujące na podziale krajów Unii Europejskiej na jednostki administracyjne NUTS 2. Zestaw „kandydatek” na zmienne profilowe obejmuje wybrane wskaźniki konkurencyjności.
Słowa kluczowe: analiza dyskryminacyjna, segmentacja regionalna, profilowanie.
1. Wstęp
Analiza dyskryminacyjna zaliczana jest do metod segmentacji a p r i o r iStanowi jedną z podstawowych metod klasyfikacji wzorcowej. Można wyodrębnić dwa najważniejsze etapy analizy: dyskryminację - inaczej etap uczenia - i klasyfika
cję - etap rozpoznawania. Każdy z nich spełnia inny cel badawczy odpowiadający jednemu z następujących nurtów analizy dyskryminacyjnej [Huberty, Olejnik 2006,
s. 5-9; Kiecka 1980, s. 8-9; Johnson, W ichem 2002, s. 581]:
- opisowa analiza dyskryminacyjna, której podstawowym celem jest interpreta
cja różnic między wyodrębnionymi wcześniej segmentami, pozwala określić, czy przynależność do segmentów rynku wydzielonych ze względu na przyjęte kryterium (lub kryteria) segmentacji wiąże się z występowaniem różnic w war
tościach zmiennych profilowych;
- predyktywna analiza dyskryminacyjna, zajmująca się przewidywaniem przyna
leżności nowych obiektów do wyłonionych wcześniej segmentów za pom ocą określonych reguł postępowania, przy możliwie małych błędach klasyfikacji.
Opisowa analiza dyskryminacyjna umożliwia identyfikację zmiennych profilo
wych różnicujących segmenty rynku, określenie ich łącznego wpływu na wyniki segmentacji oraz ich uporządkowanie według mocy dyskryminacyjnej.
1 Szerzej o analizie dyskryminacyjnej traktują m.in. prace: [Huberty 1994; Morrison 1990; Rao 1982; Krzyśko 1990; Kiecka 1980; Huberty, Olejnik 2006],
Analiza dyskryminacyjna wymaga wyodrębnienia jednej zmiennej zależnej mierzonej na skali niemetrycznej oraz zestawu niezależnych zmiennych m etrycz
nych [Malhotra 2007, s. 576]. W badaniach segmentacyjnych wykorzystujących analizę dyskrym inacyjną warianty zmiennej zależnej odpowiadają uprzednio w y
odrębnionym segmentom rynkowym, natomiast zmienne profilowe pełnią funkcję zmiennych niezależnych. Wyróżnia się metody analizy dyskryminacyjnej bazujące m.in. na funkcjach liniowych, kwadratowych, logistycznych. Najczęściej stosowane w praktyce są liniowe funkcje dyskryminacyjne, dlatego do nich zostaną ograniczo
ne dalsze rozważania.
Celem opracowania jest wykorzystanie deskryptywnej analizy dyskryminacyjnej do identyfikacji zmiennych profilowych mających najw iększą moc dyskryminacyjną oraz funkcji dyskryminacyjnych najlepiej rozróżniających wyodrębnione segmenty.
Podstawę informacyjną analizy stanowią wyniki segmentacji regionalnej a priori ze względu na poziom i dynamikę rozwoju gospodarczego bazujące na podziale krajów Unii Europejskiej na jednostki administracyjne NUTS 2. Zestaw „kandydatek” na zmienne profilowe obejmuje wybrane wskaźniki konkurencyjności.
2. Podstawy metodologiczne badań
Dany jest zbiór regionów O = {Or 0 2, . --,0 N} stanowiących przedmiot segmentacji.
Każdy region opisany jest za pom ocą następujących zbiorów zmiennych:
1. Y= {fj, Y2} kryteria segmentacji, przy czym Y reprezentuje poziom rozwoju gospodarczego, a Y2- tempo rozwoju gospodarczego regionu. Ideę określenia kryte
riów segmentacji zaczerpnięto z m etod analizy portfelowej konkurencyjności przed
siębiorstwa ze szczególnym uwzględnieniem macierzy rozwoju i udziału w rynku BCG (Boston Consulting Group).
2 . X = (Aj, Xv ..., Xp) - zbiór zmiennych profilowych (deskryptorów).
Proponowana procedura badawcza obejmuje następujące etapy.
Etap I. Dobór i formalno-statystyczna weryfikacja kryteriów segmentacji. Obej
muje dwustopniową dyskryminację kryteriów segmentacji Y= {fj, Y2} ze względu na dostępność informacyjną i zmienność. Eliminacji podlegają zmienne, dla których poziom brakujących informacji statystycznych przekracza 15%, a współczynnik zmienności jest mniejszy od 10%.
Etap II. Arbitralne wyznaczenie wartości progowych dla poszczególnych kry
teriów segmentacji: y \ - wartość krytyczna dla kryterium Y{ (poziom rozwoju go
spodarczego), y \ — wartość krytyczna dla kryterium Y2 (tempo rozwoju gospodar
czego).
Etap III. Podział regionów Or (r= 1 ,..., N) na cztery segmenty i opis wyników segmentacji:
1. Segment nadkonkurencyjny S { tw orzą regiony Or, dla których wartości zmien
nych fj i Y2 są większe od odpowiednich wartości krytycznych y \ i y\ .
2. Segment stabilny S2 tw orzą regiony Or, dla których wartość zmiennej Y] jest większa od wartości krytycznej y *, a wartość zmiennej T, jest mniejsza lub równa
y 2'
3. Segment „z szansą na rozwój” S} tw orzą regiony Or, dla których wartość zmiennej Yx jest równa wartości krytycznej y* lub od niej mniejsza, a wartość zmiennej Y2 większa od y\ .
4. Segment nierozwojowy SĄ tw orzą regiony Or, dla których wartości zmiennych Y i Y2 przyjm ują wartości równe odpowiednim wartościom krytycznym i y \ lub od nich mniejsze.
Etap IV. Dobór i formalno-statystyczna weryfikacja potencjalnych zmiennych profilowych. Do zbioru zmiennych profilowych X = {Xr X2, Xp} m ogą należeć zmienne spełniające następujące kryteria formalno-statystyczne. Pierwsze dwa kry
teria są takie same jak w przypadku weryfikacji poprawności formalno-statystycznej kryteriów segmentacji. Kryterium trzecie to silne skorelowanie z kryteriami seg
mentacji, co wyraża się spełnieniem relacji:
gdzie: r, - współczynnik korelacji p-tej zmiennej profilowej z £-tym kryterium seg- mentacji (p = 1 P, k = 1, 2), rx - wartość progowa współczynnika korelacji zmiennych profilowych z kryteriami segmentacji.
Etap V. Selekcja finalnych zmiennych profilowych z wykorzystaniem opisowej analizy dyskryminacyjnej.
Etap VI. Określenie profili segmentów.
3. Segmentacja i profilowanie regionów europejskich
Segmentację przeprowadzono, bazując na regionalnym podziale krajów Unii Euro
pejskiej na jednostki NUTS 2. Po modyfikacji, która miała miejsce w lutym 2007 r., klasyfikacja NUTS 2 obejmuje 271 regionów. Segmentacja wszystkich regionów okazała się niemożliwa ze względu na niedostępność informacji statystycznych.
W związku z tym segmentacji regionalnej poddano próbę obejm ującą 229 regionów europejskich NUTS 2, na które składają się jednostki wybrane z niezależnych popu
lacji regionów nadkonkurencyjnych, stabilnych, „z szansą na rozwój” i nierozwojo- wych. W segmentacji regionalnej a priori założono bowiem, że zostaną wydzielone cztery segmenty odpowiadające wymienionym populacjom. Segmentacja ta zosta
ła przeprowadzona jednocześnie ze względu na poziom i tempo rozwoju regionów w odniesieniu do przeciętnego poziomu i tempa rozwoju w Unii Europejskiej.
Zrealizowano segmentację statyczną w odniesieniu do 2005 r. Zastosowano na
stępujące kryteria segmentacji reprezentujące poziom rozwoju regionów: fj - pro
dukt krajowy brutto/1 mieszkańca w jednostkach PPS (Purchasing Power Standards) (UE 27 = 100), Y2 - tempo przyrostu produktu krajowego brutto w % (w cenach bieżących) w 2005 r. w relacji do roku 2002.
Zaproponowano następujący zestaw „kandydatek” na zmienne profilowe, obej
mujący cechy statystyczne odrębne dla każdego czynnika konkurencyjności regio
nów:
I - czynniki produkcji:
X — udział pracujących z wyższym wykształceniem w ogólnej liczbie pracują
cych w wieku 25-64 lata (w %), X2 - udział pracujących z wyższym wykształceniem w ogólnej liczbie ludności w wieku 25-64 lata (w %), X2 - udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata (w %), XĄ - zasoby ludzkie w nauce i technologii jako % ogółu ludności, X5 - zasoby ludzkie w nauce i technologii jako % ludności aktywnej zawodowo w wieku 25-64 lata, X6 - liczba patentów zgłoszonych do Europejskiego Urzędu Patentowego na 1 min zasobów siły roboczej,
II - klimat społeczno-gospodarczy:
X7 - udział pracujących w usługach dotyczących pośrednictwa finansowego, ob
sługi nieruchomości, wynajmu i działalności związanej z prowadzeniem interesów w ogóle pracujących (w %), X$ - stopa bezrobocia (w %), X9 - bezrobocie długo
trwałe (co najmniej 12 miesięcy) jako % bezrobocia ogółem, III - sektory pokrewne i wspomagające:
X |0 - udział pracujących w sektorach wysokich technologii (przemyśle i usłu
gach wysokich technologii oraz usługach opartych na wiedzy) w ogóle pracujących (w %), X u - udział pracujących w przemyśle wysokich i średnio wysokich techno
logii w ogóle pracujących (w %), X n - udział pracujących w usługach opartych na wiedzy i usługach wysokich technologii w ogóle pracujących (w %), X - udział pracujących w usługach opartych na wiedzy w ogóle pracujących (w %), X [Ą- udział pracujących w usługach rynkowych opartych na wiedzy w ogóle pracujących (w %), X ls— udział pracujących w usługach finansowych opartych na wiedzy w ogóle pra
cujących (w %), X l6- wydajność pracy (produkt krajowy brutto na 1 pracującego) w tys. PPS.
Po przeprowadzeniu analizy dostępności informacji statystycznych z poten
cjalnego zbioru zmiennych profilowych usunięto zmienne X l0, X l2, X iy Pozostałe
„kandydatki” na zmienne profilowe cechowały się dostępnością informacyjną oraz wystarczającą zmiennością. Wartość krytyczną współczynnika korelacji ustalono na poziomie rx = 0 ,1 3 . Jest to wartość graniczna, powyżej której współczynnik kore
lacji jest istotny statystycznie na poziomie istotności a = 0,05, dla N-2 = 227 stopni swobody.
W tabeli 1 przedstawiono współczynniki korelacji „kandydatek” na zmienne profilowe (z wyłączeniem „kandydatek” niedostępnych: X ]Q, X l2, X l5) z kryteriami segmentacji 7, i Yr Jedyną potencjalną zm ienną profilow ą nieistotnie skorelowaną
z oboma kryteriami okazała się zmienna X6 - liczba patentów zgłoszonych do Eu
ropejskiego Urzędu Patentowego na 1 min zasobów siły roboczej. Nieistotnie sko
relowana z Y (poziom PKB per capita (UE = 100)) była zmienna X n, a z E, (tempo wzrostu PKB w 2005 r. w stosunku do roku 2002 (w %)) - zmienne X p X2, Xs i Xr
Tabela 1. Korelacja potencjalnych zmiennych profilowych z kryteriami segmentacji
Potencjalne zmienne profilowe
Kryteria segmentacji
Kryteria segmentacji istotnie skorelowane z potencjalnymi zmiennymi profilowymi Yi
0,544 -0,033
X 0,595 -0,023
0,489 -0,151
X t 0,714 -0,155 Y Ł 1» / 2Y
* 5 0,734 -0,197 Y Y 1 1’ 1 2
X t 0,019 0,071 -
X 7 0,836 -0,268
X , -0,413 -0,012
r,
X 9 -0,429 0,078
X„ 0,085 -0,162
n
X „ 0,700 -0,343 Y Y
X\4 0,781 -0,286 Y Y 1
1» 1 2
X 0,957 -0,303 Y Y 1 1» J2
Źródło: obliczenia własne.
Ostatecznie wybrano następujące zmienne profilowe spełniające warunki do
stępności, zmienności i istotnej korelacji z kryteriami segmentacji: X} - udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata (w %), XĄ - zasoby ludzkie w nauce i technologii jako % ogółu ludności, X5 - zasoby ludzkie w nauce i technologii jako odsetek ludności aktywnej zawodowo w wieku 25-64 lata, X? - udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wy
najmem i działalnością zw iązaną z prowadzeniem interesów w ogóle pracujących (w % ),XI}- udział pracujących w usługach opartych na wiedzy w ogóle pracujących (w %), X l4- udział pracujących w usługach rynkowych opartych na wiedzy w ogóle pracujących (w %), X l6- wydajność pracy (produkt krajowy brutto na 1 pracujące
go) w tys. PPS.
W badanej próbie współczynnik zmienności dla produktu krajowego brutto/1 mieszkańca wynosił 39,8%, tempo przyrostu produktu krajowego brutto w 2005 r.
w relacji do roku 2002 cechowało się większą zm iennością wynoszącą 54,5%. War-
Tabela 2. Segmentacja wybranych regionów NUTS 2 Unii Europejskiej w 2005 r.
M e z o -
s e g m e n ty R e g i o n y N U T S 2
N a d - k o n k u r e n c y j n y
P ro v . B r a b a n t W a llo n ( B E ) , P r a h a ( C Z ) , S a a r l a n d ( D E ) , B o r d e r , M id la n d s a n d W e s te r n ( I E ) , S o u th e r n a n d E a s t e r n ( I E ) , A tti k i ( G R ) , C a n t a b r ia ( E S ) , P a is V a s c o ( E S ) , C o m u n i d a d F o r a i d e N a v a r r a ( E S ) , L a R io j a ( E S ) , A r a g o n ( E S ) , C o m u n i d a d d e M a d r id ( E S ) , C a t a lu i ïa ( E S ) , I lle s B a l e a r s ( E S ) , L u x e m b o u r g ( G r a n d - D u c h é ) ( L U ) , K ô z é p - M a g y a r o r s z â g ( H U ) , G r o n i n g e n ( N L ) , K ä r n te n (A T ), O b e r ö s te r r e i c h (A T ), S a lz b u r g (A T ), T i r o l (A T ), V o r a r lb e r g (A T ), B r a t i s l a v s k y k r a j ( S K ) , S to c k h o l m ( S E ) , V ä s ts v e r ig e (S E ) , Ô v r e N o r r la n d ( S E ) , D e r b y s h i r e a n d N o t t i n g h a m s h i r e ( U K ) , L e ic e s te r s h i r e , R u tl a n d a n d N o r th a n t s (U K ) , H e r e f o r d s h ir e , W o r c e s t e r s h ir e a n d W a rk s ( U K ) , E a s t A n g l i a ( U K ) , I n n e r L o n d o n ( U K ) , B e r k s h ir e , B u c k s a n d O x f o r d s h i r e ( U K ) , H a m p s h ir e a n d I s le o f W i g h t ( U K ) , K e n t ( U K ) , D o r s e t a n d S o m e r s e t ( U K ) , E a s te r n S c o tl a n d ( U K )
S ta b i ln y R é g i o n d e B r u x e l l e s - C a p i t a l e ( B E ) , P ro v . A n t w e r p e n ( B E ) , P ro v . O o s t - V l a a n d e r e n ( B E ) , P ro v . V la a m s B r a b a n t ( B E ) , P ro v . W e s t - V l a a n d e r e n ( B E ) , S t u t t g a r t ( D E ) , K a r ls r u h e ( D E ) , F r e ib u r g ( D E ) , T ü b i n g e n ( D E ) , O b e r b a y e m ( D E ) , N i e d e r b a y e m ( D E ) , O b e r p f a l z ( D E ) , O b e r f r a n k e n ( D E ) , M itt e lf i a n k e n ( D E ) , U n te r f r a n k e n ( D E ) , S c h w a b e n ( D E ) , B r e m e n ( D E ) , H a m b u r g ( D E ) , D a r m s ta d t ( D E ) , G ie ß e n ( D E ) , K a s s e l ( D E ) , B r a u n s c h w e i g ( D E ) , H a n n o v e r ( D E ) , D ü s s e l d o r f ( D E ) , K ö ln ( D E ) , D e tm o ld ( D E ) , A r n s b e r g ( D E ) , R h e i n h e s s e n - P f a l z ( D E ) , S c h le s w ig - H o ls te in ( D E ) , S te r e a E l la d a ( G R ) , î l e d e F r a n c e ( F R ) , C h a m p a g n e - A r d e n n e ( F R ) , H a u te - N o r m a n d ie ( F R ) , C e n t r e ( F R ) , A l s a c e ( F R ) , P a y s d e la L o i r e ( F R ) , A q u ita in e ( F R ) , M id i- P y r é n é e s ( F R ) , R h ô n e - A lp e s ( F R ) , P r o v e n c e - A l p e s - C ô t e d ’A z u r ( F R ) , P ie m o n te ( I T ) , L i g u r ia ( I T ) , L o m b a r d ia ( I T ) , P r o v i n c i a A u to n o m a B o l z a n o - B o z e n ( I T ) , P r o v in c i a A u t o n o m a T r e n to ( I T ) , V e n e to ( I T ) , F r iu li - V e n e z ia G i u l i a ( I T ) , E m ili a - R o m a g n a ( I T ) , T o s c a n a ( I T ) , M a r c h e ( I T ) , L a z io ( I T ) , F r ie s la n d ( N L ) , D r e n th e ( N L ) , O v e r i j s s e l ( N L ) , G e ld e r l a n d ( N L ) , U t r e c h t ( N L ) , N o o r d - H o l l a n d ( N L ) , Z u i d - H o l la n d ( N L ) , Z e e l a n d ( N L ) , N o o r d - B r a b a n t ( N L ) , L i m b u r g ( N L ) , N ie d e r ö s t e iT e ic h (A T ), W ie n (A T ), L i s b o a ( P T ) , E te lä - S u o m i ( F I ) , L ä n s i - S u o m i ( F I ) , Ö s t r a M e l l a n s v e r i g e ( S E ) , S m ä l a n d m e d ö a m a ( S E ) , S y d s v e r ig e ( S E ) , N o n a M e ll a n s v e r ig e ( S E ) , M e ll e r s ta N o n l a n d ( S E ) , N o r t h u m b e r l a n d , T y n e a n d W e a r ( U K ) , C h e s h ir e ( U K ) , G r e a t e r M a n c h e s t e r ( U K ) , W e s t Y o r k s h i r e ( U K ) , W e s t M i d la n d s ( U K ) , B e d f o r d s h ir e , H e r tf o r d s h ir e ( U K ) , O u t e r L o n d o n ( U K ) , S u n e y , E a s t a n d W e s t S u s s e x ( U K ) , G lo u c e s t e r s h i r e , W i lts h ir e a n d B r is to l / B a th a r e a ( U K ) , E a s t W a le s ( U K ) , S o u th W e s t e r n S c o t l a n d ( U K )
Z s z a n s ą n a r o z w ó j
S e v e r o i z lo c h e n ( B G ) , Y u g o iz t o c h e n ( B G ) , Y u g o z a p a d e n ( B G ) , Y u z h e n ts e n t r a le n ( B G ) , S tr e d n i C e c h y ( C Z ) , J i h o z ä p a d ( C Z ) , S e v e r o z a p a d ( C Z ) , S e v e r o v y c h o d ( C Z ) , J i h o v y c h o d ( C Z ) , S tr e d n i M o r a v a ( C Z ) , M o r a v s k o s l e z s k o ( C Z ) , E s to n i a ( E E ) , K e n tr i k i M a k e d o n i a ( G R ) , P e lo p o n n i s o s ( G R ) , G a li c ia ( E S ) , P r in c i p a d o d e A s t u r i a s ( E S ) , C a s ti lla y L e ó n ( E S ) , C a s t i l l a - l a M a n c h a ( E S ) E x t r e m a d u r a ( E S ) , C o m u n i d a d V a le n c ia n a ( E S ) , A n d a lu c ia ( E S ) , R e g i o n d e M u r c i a ( E S ) , C a n a r ia s ( E S ) , C y p r u s ( C Y ) , L a tv i a (L V ), L i t h u a n i a (L T ), K ô z é p - D u n a n tû l ( H U ) , É s z a k - M a g y a r o r s z a g ( H U ) , F le v o l a n d ( N L ) , Ł ó d z k ie ( P L ) , M a z o w ie c k ie ( P L ) , M a ło p o l s k i e ( P L ) , Ś lą s k ie ( P L ) , P o d k a r p a c k i e ( P L ) , W i e lk o p o l s k i e (P L ) , L u b u s k ie ( P L ) , W a r m iń s k o - M a z u r s k ie ( P L ) , P o m o r s k i e ( P L ) , N o r d - V e s t ( R O ) , C e n t r u ( R O ) , N o r d - E s t ( R O ) , S u d - E s t ( R O ) , S u d - M u n t e n ia ( R O ) , B u c u r e s t i - I l f o v ( R O ) , S u d - V e s t O l te n ia ( R O ) , V e st ( R O ) , Z a p a d n ę S lo v e n s k o ( S K ) , V ÿ c h o d n é S lo v e n s k o ( S K ) , T e e s V a lle y a n d D u r h a m ( U K ) , C u m b r i a ( U K ) , S o u th Y o r k s h i r e ( U K ) , E s s e x ( U K ) , C o r n w a ll a n d I s le s o f S c il ly ( U K ) , D e v o n ( U K ) , N o r th e r n I r e la n d ( U K ) N i e r o z w o j o w y P ro v . L i m b u r g ( B E ) , P ro v . H a i n a u t ( B E ) , P ro v . L i è g e ( B E ) , P ro v . N a m u r ( B E ) , S e v e r o z a p a d e n ( B G ) , S e -
v e r e n ts e n t r a le n ( B G ) , B e r l in ( D E ) , B r a n d e n b u r g - N o r d o s t ( D E ) , B r a n d e n b u r g - S ü d w e s t ( D E ) , M e c k l e n b u r g - V o r p o m m e r n ( D E ) , L ü n e b u r g ( D E ) , W e s e r - E m s ( D E ) , M ü n s t e r ( D E ) , K o b le n z ( D E ) , C h e m n itz ( D E ) , D y tik i H e l l a d a ( G R ) , P ic a r d ie ( F R ) , B a s s e - N o r m a n d i e ( F R ) , B o u r g o g n e ( F R ) , N o r d - P a s - d e - C a la i s ( F R ) , L o r r a i n e ( F R ) , F r a n c h e - C o m té ( F R ) , L i m o u s i n ( F R ) , A u v e r g n e ( F R ) , L a n g u e d o c - R o u s s i ll o n ( F R ) , U m b r ia ( I T ) , A b r u z z o ( I T ) , M o lis e ( I T ) , C a m p a n i a ( I T ) , P u g l i a ( I T ) , B a s il ic a ta ( I T ) , C a l a b r ia ( I T ) , S i c i l i a ( I T ) , S a r d e g n a ( I T ) , N y u g a t - D u n a n t u l ( H U ) , D é l - D u n â n t ü l ( H U ) , É s z a k - A lf o l d ( H U ) , D e l- A lf ö l d ( H U ) , M a lt a ( M T ) , B u r g e n l a n d ( A T ), L u b e ls k ie ( P L ) , Ś w i ę t o k r z y s k i e ( P L ) , P o d la s k ie ( P L ) , Z a c h o d n io p o m o r s k ie ( P L ) , K u j a w s k o - P o m o r s k i e ( P L ) , N o r t e ( P T ) , A l g a r v e ( P T ) , C e n t r o ( P T ) , A le n t e jo ( P T ) , S tr e d n é S lo v e n s k o ( S K ) , I tä - S u o m i ( F I ) , P o h jo is - S u o m i ( F I ) , L a n c a s h ir e ( U K ) , L i n c o ln s h ir e ( U K ) , S h r o p s h i r e a n d S ta f f o r d s h ir e ( U K ) , W e s t W a le s a n d T h e V a lle y s ( U K )
BE - Belgia, BG - Bułgaria, CZ - Republika Czeska, DE - Niemcy, EE - Estonia, IE - Irlandia, GR - Grecja, ES - Hiszpania, FR - Francja, IT - Włochy, CY - Cypr, LV - Łotwa, LT - Litwa, LU - Luksemburg, HU - Węgry, MT - Malta, N L - Niderlandy, AT -Austria, P L - Polska, PT - Portugalia, RO - Rumunia, SI - Słowenia, SK - Słowacja, FI - Finlandia, SE - Szwecja, UK - W. Brytania.
Źródło: opracowanie własne na podstawie bazy danych Eurostatu.
tości progowe kryteriów segmentacji przyjęte na poziomie przeciętnych wartości w UE wyniosły odpowiednio y* = 100% i y \ = 12,7%. Wyniki segmentacji przed
stawiono w tab. 2.
Segment nadkonkurencyjny grupujący regiony cechujące się poziomem PKB per capita i dynam iką PKB przekraczającymi średnią unijną okazał się najmniej liczny. W jego skład weszło 36 regionów, co stanowiło 15,7% liczebności badanej próby. Dominowały regiony tworzące mezosegment stabilny (poziom PKB per ca
pita przekraczał średnią unijną, lecz tempo wzrostu było niższe od przeciętnego), składający się z 82 regionów, co stanowiło 35,8% liczebności badanej próby. Li
czebności segmentów „z szansą na rozwój” i nierozwojowego były zbliżone i wy
nosiły odpowiednio: 55 i 56 regionów (24 i 24,5%). Nieznaczna większość regio
nów NUTS 2 poddanych analizie cechowała się poziomem PKB na 1 mieszkańca wyższym od średniej unijnej (51,5%) oraz dominowały regiony, w których tempo wzrostu PKB było niższe od przeciętnego (60,3%).
Identyfikacji finalnych zmiennych profilowych o największej sile dyskrymina
cyjnej dokonano z wykorzystaniem analizy dyskryminacyjnej po uprzedniej wery
fikacji jej założeń. Segmentacja regionalna a priori ma charakter rozłączny, poten
cjalne zmienne profilowe zostały zmierzone na skali metrycznej (ilorazowej) i żadna z uwzględnionych zmiennych nie stanowi kombinacji liniowej pozostałych. Kolej
ne założenie wymaga, aby potencjalne zmienne profilowe wykazały w segmentach łącznie wielowymiarowy rozkład normalny. Do weryfikacji hipotezy o normalności wykorzystano test Shapiro-Wilka. Rozkłady empiryczne nie wszystkich analizowa
nych zmiennych w otrzymanych segmentach okazały się rozkładami normalnymi, stąd założenie to nie zostało spełnione. Następnie, korzystając z wielowymiarowego testu Boxa, ocenie poddano kolejne założenie analizy dyskryminacyjnej wymagają
ce równości macierzy wariancji i kowariancji zmiennych profilowych w wyłonio
nych segmentach. To założenie również nie zostało spełnione. W badaniach empi
rycznych taka sytuacja często ma miejsce. Ponieważ założenia te nie są krytyczne, analiza dyskryminacyjna często jest stosowana z pozytywnym skutkiem, mimo ich niespełnienia.
Analizę dyskrym inacyjną wstępnie przeprowadzono dla wszystkich zmiennych profilowych: X3, X4, X5, Xv X ]}, X l4, X l6. Zastosowano procedurę krokowej postępu
jącej analizy dyskryminacyjnej, zgodnie z którą w modelu nie znalazła się zmienna X n. Do oceny istotności zmiennych w dyskryminowaniu segmentów na podstawie cząstkowych współczynników Ap W ilksa wykorzystano statystykę F^ m ającą roz
kład Fishera-Snedecora. Wyniki weryfikacji zestawiono w tab. 3.
Statystyka teoretyczna dla poziom u istotności a = 0,05 i G - 1 = 3 i N - G - P + 1 = 220 stopni sw obody (N, G, P - liczba regionów, segmentów, zm ien
nych profilow ych) w ynosi w przybliżeniu F = 2,65, co oznacza, że zm ienna X s okazała się nieistotna (statystyka em piryczna F nie przekracza statystyki teo
retycznej, w artość statystyki testowej p-value je s t w iększa od założonego po-
Tabela 3. Podsumowanie analizy funkcji dyskryminacyjnej dla 6 zmiennych
Zmienne profilowe Cząstkowy współczynnik An Wilksa Statystyka empiryczna Fn p-value
0,8643 11,5113 0,0000
0,9604 3,0272 0,0304
0,8310 14,9087 0,0000
X, 0,8836 9,6574 0,0000
X» 0,9572 3,2766 0,0219
X, 0,9833 1,2437 0,2947
Źródło: obliczenia własne z wykorzystaniem pakietu statystycznego STATISTICA 8 PL.
ziom u istotności a ) . Ponow nie przeprow adzono postępującą analizę krokow ą dla 5 zm iennych profilow ych (bez zm iennej X 5). Do m odelu rów nież nie w eszła zm ienna X iy W yniki oceny istotności zmiennych profilowych wprowadzonych do modelu znajdują się w tab. 4.
Tabela 4. Podsumowanie analizy funkcji dyskryminacyjnej dla 5 zmiennych
Zmienne profilowe Cząstkowy współczynnik A Wilksa Statystyka empiryczna Fp p-value
x lt 0,8721 10,8004 0,0000
* 4 0,9215 6,2767 0,0004
0,8258 15,5403 0,0000
* 3 0,8622 11,7773 0,0000
* , 4 0,9583 3,2067 0,0240
Źródło: obliczenia własne z wykorzystaniem pakietu statystycznego STATISTICA 8 PL.
Statystyka teoretyczna dla poziomu istotności a = 0,05 i G - 1 = 3 i N - G - P + 1 = 221 stopni swobody również wynosi w przybliżeniu F = 2,65, co oznacza, że wszystkie zmienne istotnie wpływ ają na dyskryminację segmentów (statystyka em piryczna Fp w każdym przypadku przekracza wartość statystyki teoretycznej, war
tość statystyki testowej p-value jest m niejsza od założonego poziomu istotności a).
Uznano zatem, że zmienne X5 (zasoby ludzkie w nauce i technologii jako odse
tek ludności aktywnej zawodowo w wieku 25-64 lata) oraz X n (udział pracujących w usługach opartych na wiedzy w ogóle pracujących (w %)) nie m ają udziału w dys
kryminacji regionów europejskich ze względu na poziom i tempo rozwoju.
Kolejnym etapem analizy dyskryminacyjnej jest określenie istotności poszcze
gólnych funkcji dyskryminacyjnych. Tabela 5 zawiera wyniki weryfikacji istotności trzech otrzymanych funkcji dyskryminacyjnych. Jak z niej wynika, zdecydowanie największy udział w ogólnej mocy dyskryminacyjnej całego modelu ma funkcja pierwsza (80,3%), dużo niższy (chociaż znaczący) jest udział drugiej funkcji (18,8%).
Natomiast trzecia funkcja nie ma większego znaczenia. Do podobnych wniosków prowadzi ocena wartości współczynników korelacji kanonicznej wyliczonych dla poszczególnych funkcji dyskryminacyjnych. Przeprowadzono również ocenę staty
stycznej istotności otrzymanych funkcji z wykorzystaniem współczynnika lambda Wilksa, z której wynika, że jedynie dwie pierwsze funkcje dyskryminacyjne są istot
ne statystycznie, a więc cechuje je zdolność do separacji wydzielonych segmentów.
Trzecia funkcja dyskryminacyjna okazała się nieużyteczna
(x~
< Zó.m-j )> dlatego w dalszej części analizy nie będzie poddawana interpretacji.Tabela 5. Weryfikacja istotności funkcji dyskryminacyjnych
Funkcja
dyskryminacyjna R ; U. (w %) A Wilksa X2
Stopnie swobody
d f
Zn.Dy.Jf p-value
*>. 0,7035 80,3 0,4063 201,2754 15 25,00 0,0000
d2 0,4320 18,8 0,8044 48,6376 8 15,50 0,0000
0,1047 0,9 0,9890 2,4654 3 7,81 0,4816
R _ - współczynnik korelacji kanonicznej z-tej funkcji dyskryminacyjnej, Uz - współczynnik udziału z-tej fiinkcii w ogólnej mocy dyskryminacyjnej wszystkich funkcji, y 2- statystyka empiryczna chi-kwadrat, Zń.o>:di - statystyka teoretyczna rozkładu chi-kwadrat dla poziomu istotności a = 0,05 i d f stopni swobody, p-value - statystyka testowa.
Źródło: obliczenia własne z wykorzystaniem pakietu statystycznego STATISTICA 8 PL.
Dwie pierwsze funkcje dyskryminacyjne oszacowane na podstawie standaryzo
wanych wartości zmiennych profilowych przyjętych do analizy przybrały następu
jąc ą postać:
D, = 0,3543*, + 0,4433*, - 0,2666*4 + 0,1136*6 + 0,6909*?, (2) D2 = 1,1477*, + 0,5380*, - 2,0873*4 + 0,7939*6 - 0,1686*r (3) Standaryzowane współczynniki dyskryminacyjne oszacowanych funkcji sta
now ią podstawę identyfikacji zmiennych profilowych o największym znaczeniu w rozróżnianiu wyodrębnionych segmentów. Na pierwszą funkcję dyskryminacyjną zdecydowanie największy i dodatni wpływ wywierają zmienne * , 6 (wydajność pra
cy w tys. PPS) i X4 (zasoby ludzkie w nauce i technologii jako % ogółu ludności).
Na drugą funkcję największy wpływ (ujemny) wywiera zmienna * 7 (udział pracują
cych w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością zw iązaną z prowadzeniem interesów w ogóle pracują
cych (w %)) i dodatni - zmienna * 3 (udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25- -64 lata)).
Analogiczną analizę można przeprowadzić na podstawie tzw. współczynników struktury czynnikowej będących współczynnikami korelacji liniowej zmiennych
profilowych z wartościami funkcji dyskryminacyjnych. Macierz współczynników struktury czynnikowej dla dwóch istotnych funkcji dyskryminacyjnych przedstawia tab. 6.
Najsilniejszy związek (dodatni) z pierwszą funkcją dyskryminacyjną wykazały kolejno zmienne: X ]6, X l4 (udział pracujących w usłu
gach rynkowych opartych na wiedzy w ogóle pracujących (w %)) i XĄ. Z drugą funkcją dys
kryminacyjną najsilniej związane są zmienne:
X1 (ujemnie), X ]b (ujemnie) i X3 (dodatnio).
Identyfikacja segmentów rozróżnianych przez poszczególne funkcje dyskryminacyjne została przeprowadzona na podstawie analizy średnich wartości zmiennych dyskryminacyj
nych (por. tab. 7). Pierwsza funkcja dyskry
minacyjna w największym stopniu rozróżnia segmenty nadkonkurencyjny i stabilny od seg
mentów z szansą na rozwój i nierozwoj owego, czyli segmenty charakteryzujące się wysokim i niskim poziomem rozwoju. Wykazywane tak
że są różnice zarówno między segmentem nadkonkurencyjnym a stabilnym, jak i z szansą na rozwój a nierozwojowym. Druga funkcja dyskryminacyjna najbardziej separuje segmenty nadkonkurencyjny i z szansą na rozwój od nierozwoj owego i sta
bilnego, a więc segmenty cechujące się wysokim i niskim tempem rozwoju. Nie rozróżnia w zasadzie segmentu nadkonkurencyjnego od z szansą na rozwój. Istot
ność tej separowalności jest znacznie niniejsza niż w przypadku pierwszej funkcji dyskryminacyjnej.
Na podstawie wyników analizy dyskryminacyjnej zdecydowano, że finalny
mi zmiennymi profilowymi zostaną te zmienne, których istotny wpływ na funkcje dyskryminacyjne wynikał zarówno z analizy współczynników standaryzowanych, jak i ze struktury czynnikowej. N ależą do nich X i6 i XĄ dla pierwszej funkcji oraz X1 i X} - dla drugiej. Należy przypomnieć, że pierwsza funkcja dyskryminacyjna wyjaśnia 80,3% wariancji międzygrupowej, a druga - jedynie 18,8%, stąd segmen
ty będą bardziej rozróżnialne ze względu na finalne zmienne profilowe X ]6 i X4 niż X1 i Xy Tym samym najistotniejszymi finalnymi zmiennymi profilowymi okazały się kolejno: wydajność pracy na 1 pracującego i zasoby ludzkie w nauce i techno
logii jako procent ogółu ludności oraz udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością związaną z prowadzeniem interesów w ogóle pracujących (w %) i udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata.
Tabela 6. Macierz współczynników struktury czynnikowej
Zmienne profilowe
Funkcje dyskryminacyjne
D 2
* 3 0,4926 0,1943
* 4 0,7379 -0,0027
* 7 0,6908 -0,3872
* ,4 0,7866 -0,0869
0,8586 -0,2330 Źródło: obliczenia własne z wykorzys
taniem pakietu statystycznego STATISTICA 8 PL.
Tabela 7. Średnie wartości zmiennych dyskryminacyjnych w wyodrębnionych segmentach
Segmenty
Zmienne dyskryminacyjne
D t D,
Nadkonkurencyj ny 1,2474 0,5779
Stabilny 0,7921 -0,2354
Z szansą na rozwój -1,1863 0,5534
Nierozwojowy -0,7967 -0,5703
Źródło: obliczenia własne z wykorzystaniem pakietu statystycznego STATISTICA 8 PL.
Profile wyodrębnionych segmentów zestawiono w tab. 8.
Tabela 8. Profile wyodrębnionych segmentów
Segmenty
Średnie wartości finalnych zmiennych profilowych
*4 * 7 *3
Nadkonkurencyjny 64,14 30,08 12,21 14,36
Stabilny 61,02 28,59 11,65 11,53
Z szansą na rozwój 33,81 19,93 6,68 6,85
Nierozwojowy 42,57 21,33 7,71 7,09
Źródło: obliczenia własne na podstawie bazy danych Eurostatu.
Finalne zmienne profilowe przyjm ująnajw iększe przeciętne wartości w segmen
cie nadkonkurencyjnym, następnie w stabilnym i nierozwojowym, a najmniejsze w segmencie z szansą na rozwój.
4. Zakończenie
Z przeprowadzonych badań wynika, że w regionach europejskich między wskaźnika
mi konkurencyjności a poziomem PKB per capita w 2005 r. występowała zazwyczaj silniejsza zależność niż z tempem wzrostu PKB. Istotny wpływ na zróżnicowanie segmentów wywarło jedynie pięć wskaźników konkurencyjności, do których nale
żą: udział ludności dorosłej uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata, zasoby ludzkie w nauce i technologii jako pro
cent ogółu ludności, udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością związaną z prowa
dzeniem interesów w ogóle pracujących, udział pracujących w usługach rynkowych opartych na wiedzy w ogóle pracujących, wydajność pracy na 1 pracującego.
Wydajność pracy na 1 pracującego i zasoby ludzkie w nauce i technologii (jako odsetek ogółu ludności) w największym stopniu różnicują regiony o niskim i w y
sokim poziomie rozwoju. Natomiast udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością związaną z prowadzeniem interesów w ogóle pracujących i udział ludności doro
słej uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata dyskrym inują najlepiej regiony cechujące się niskim i wysokim tempem wzrostu. W ymienione wskaźniki przyjm ują najwyższe wartości w regionach nad- konkurencyjnych (wysoki poziom i dynamika rozwoju), a najniższe - w regionach z szansą na rozwój cechujących się niskim poziomem i w ysoką dynamiką rozwoju.
Analiza dyskryminacyjna okazała się efektywnym narzędziem wspomagającym profilowanie w segmentacji regionalnej.
Literatura
Huberty C.J., Applied discriminant analysis, John Wiley & Sons, New York 1994.
Huberty J., Olejnik S., Applied MANOVA and discriminant analysis, John Wiley & Sons, New Jersey 2006.
Johnson R.A., Wichem D.W., Applied multivariate statistical analysis, Prentice-Hall, Upper Saddle River, 2002.
Kiecka W.R., Discriminant analysis, Sage Publication, London 1980.
Krzyśko M., Analiza dyskryminacyjna, Wydawnictwo Naukowo-Techniczne, Warszawa, 1990.
Malhotra N.K., Marketing research. An applied orientation, Prentice-Hall, Upper Saddle River 2007.
Morrison D.F., Wielowymiarowa analiza statystyczna, PWN, Warszawa 1990.
Rao C.R., Modele liniowe statystyki matematycznej, PWN, Warszawa 1982.
T H E A P PL IC A T IO N O F D ISC R IM IN A T IO N ANALYSIS F O R P R O F IL IN G SEG M EN TS
IN T H E E U R O PEA N R E G IO N A L SPACE
Summary: The objective o f the study is to apply the descriptive discrimination analysis for identifying profile variables which influence the biggest diversification of segments and to define their profiles. Regional segmentation results with regard to the level and dynamics of economic development, based on the European Union countries division into NUTS 2 admin
istrative units, have become the basis for the study. The set o f candidates for profile variables includes the selected indicators o f competitiveness.