ZASTOSOWANIE ANALIZY DYSKRYMINACYJNEJ DO PROFILOWANIA SEGMENTÓW W EUROPEJSKIEJ PRZESTRZENI REGIONALNEJ

(1)

Ekonometria 25 2009

Elżbieta Sobczak

Uniwersytet Ekonomiczny we Wrocławiu

ZASTOSOWANIE ANALIZY DYSKRYMINACYJNEJ DO PROFILOWANIA SEGMENTÓW W EUROPEJSKIEJ PRZESTRZENI REGIONALNEJ

Streszczenie: Cele opracowania to wykorzystanie deskryptywnej analizy dyskryminacyjnej do identyfikacji zmiennych profilowych przyczyniających się do największego zróżnicowa

nia segmentów oraz określenie ich profili. Podstawę badań stanowią wyniki segmentacji re

gionalnej ze względu na poziom i dynamikę rozwoju gospodarczego bazujące na podziale krajów Unii Europejskiej na jednostki administracyjne NUTS 2. Zestaw „kandydatek” na zmienne profilowe obejmuje wybrane wskaźniki konkurencyjności.

Słowa kluczowe: analiza dyskryminacyjna, segmentacja regionalna, profilowanie.

1. Wstęp

Analiza dyskryminacyjna zaliczana jest do metod segmentacji a p r i o r iStanowi jedną z podstawowych metod klasyfikacji wzorcowej. Można wyodrębnić dwa najważniejsze etapy analizy: dyskryminację - inaczej etap uczenia - i klasyfika

cję - etap rozpoznawania. Każdy z nich spełnia inny cel badawczy odpowiadający jednemu z następujących nurtów analizy dyskryminacyjnej [Huberty, Olejnik 2006,

s. 5-9; Kiecka 1980, s. 8-9; Johnson, W ichem 2002, s. 581]:

- opisowa analiza dyskryminacyjna, której podstawowym celem jest interpreta

cja różnic między wyodrębnionymi wcześniej segmentami, pozwala określić, czy przynależność do segmentów rynku wydzielonych ze względu na przyjęte kryterium (lub kryteria) segmentacji wiąże się z występowaniem różnic w war

tościach zmiennych profilowych;

- predyktywna analiza dyskryminacyjna, zajmująca się przewidywaniem przyna

leżności nowych obiektów do wyłonionych wcześniej segmentów za pom ocą określonych reguł postępowania, przy możliwie małych błędach klasyfikacji.

Opisowa analiza dyskryminacyjna umożliwia identyfikację zmiennych profilo

wych różnicujących segmenty rynku, określenie ich łącznego wpływu na wyniki segmentacji oraz ich uporządkowanie według mocy dyskryminacyjnej.

1 Szerzej o analizie dyskryminacyjnej traktują m.in. prace: [Huberty 1994; Morrison 1990; Rao 1982; Krzyśko 1990; Kiecka 1980; Huberty, Olejnik 2006],

(2)

Analiza dyskryminacyjna wymaga wyodrębnienia jednej zmiennej zależnej mierzonej na skali niemetrycznej oraz zestawu niezależnych zmiennych m etrycz

nych [Malhotra 2007, s. 576]. W badaniach segmentacyjnych wykorzystujących analizę dyskrym inacyjną warianty zmiennej zależnej odpowiadają uprzednio w y

odrębnionym segmentom rynkowym, natomiast zmienne profilowe pełnią funkcję zmiennych niezależnych. Wyróżnia się metody analizy dyskryminacyjnej bazujące m.in. na funkcjach liniowych, kwadratowych, logistycznych. Najczęściej stosowane w praktyce są liniowe funkcje dyskryminacyjne, dlatego do nich zostaną ograniczo

ne dalsze rozważania.

Celem opracowania jest wykorzystanie deskryptywnej analizy dyskryminacyjnej do identyfikacji zmiennych profilowych mających najw iększą moc dyskryminacyjną oraz funkcji dyskryminacyjnych najlepiej rozróżniających wyodrębnione segmenty.

Podstawę informacyjną analizy stanowią wyniki segmentacji regionalnej a priori ze względu na poziom i dynamikę rozwoju gospodarczego bazujące na podziale krajów Unii Europejskiej na jednostki administracyjne NUTS 2. Zestaw „kandydatek” na zmienne profilowe obejmuje wybrane wskaźniki konkurencyjności.

2. Podstawy metodologiczne badań

Dany jest zbiór regionów O = {Or 0 2, . --,0 N} stanowiących przedmiot segmentacji.

Każdy region opisany jest za pom ocą następujących zbiorów zmiennych:

1. Y= {fj, Y2} kryteria segmentacji, przy czym Y reprezentuje poziom rozwoju gospodarczego, a Y2- tempo rozwoju gospodarczego regionu. Ideę określenia kryte

riów segmentacji zaczerpnięto z m etod analizy portfelowej konkurencyjności przed

siębiorstwa ze szczególnym uwzględnieniem macierzy rozwoju i udziału w rynku BCG (Boston Consulting Group).

2 . X = (Aj, Xv ..., Xp) - zbiór zmiennych profilowych (deskryptorów).

Proponowana procedura badawcza obejmuje następujące etapy.

Etap I. Dobór i formalno-statystyczna weryfikacja kryteriów segmentacji. Obej

muje dwustopniową dyskryminację kryteriów segmentacji Y= {fj, Y2} ze względu na dostępność informacyjną i zmienność. Eliminacji podlegają zmienne, dla których poziom brakujących informacji statystycznych przekracza 15%, a współczynnik zmienności jest mniejszy od 10%.

Etap II. Arbitralne wyznaczenie wartości progowych dla poszczególnych kry

teriów segmentacji: y \ - wartość krytyczna dla kryterium Y{ (poziom rozwoju go

spodarczego), y \ — wartość krytyczna dla kryterium Y2 (tempo rozwoju gospodar

czego).

Etap III. Podział regionów Or (r= 1 ,..., N) na cztery segmenty i opis wyników segmentacji:

1. Segment nadkonkurencyjny S { tw orzą regiony Or, dla których wartości zmien

nych fj i Y2 są większe od odpowiednich wartości krytycznych y \ i y\ .

(3)

2. Segment stabilny S2 tw orzą regiony Or, dla których wartość zmiennej Y] jest większa od wartości krytycznej y *, a wartość zmiennej T, jest mniejsza lub równa

y 2'

3. Segment „z szansą na rozwój” S} tw orzą regiony Or, dla których wartość zmiennej Yx jest równa wartości krytycznej y* lub od niej mniejsza, a wartość zmiennej Y2 większa od y\ .

4. Segment nierozwojowy SĄ tw orzą regiony Or, dla których wartości zmiennych Y i Y2 przyjm ują wartości równe odpowiednim wartościom krytycznym i y \ lub od nich mniejsze.

Etap IV. Dobór i formalno-statystyczna weryfikacja potencjalnych zmiennych profilowych. Do zbioru zmiennych profilowych X = {Xr X2, Xp} m ogą należeć zmienne spełniające następujące kryteria formalno-statystyczne. Pierwsze dwa kry

teria są takie same jak w przypadku weryfikacji poprawności formalno-statystycznej kryteriów segmentacji. Kryterium trzecie to silne skorelowanie z kryteriami seg

mentacji, co wyraża się spełnieniem relacji:

gdzie: r, - współczynnik korelacji p-tej zmiennej profilowej z £-tym kryterium segmentacji (p = 1 P, k = 1, 2), rx - wartość progowa współczynnika korelacji zmiennych profilowych z kryteriami segmentacji.

Etap V. Selekcja finalnych zmiennych profilowych z wykorzystaniem opisowej analizy dyskryminacyjnej.

Etap VI. Określenie profili segmentów.

3. Segmentacja i profilowanie regionów europejskich

Segmentację przeprowadzono, bazując na regionalnym podziale krajów Unii Euro

pejskiej na jednostki NUTS 2. Po modyfikacji, która miała miejsce w lutym 2007 r., klasyfikacja NUTS 2 obejmuje 271 regionów. Segmentacja wszystkich regionów okazała się niemożliwa ze względu na niedostępność informacji statystycznych.

W związku z tym segmentacji regionalnej poddano próbę obejm ującą 229 regionów europejskich NUTS 2, na które składają się jednostki wybrane z niezależnych popu

lacji regionów nadkonkurencyjnych, stabilnych, „z szansą na rozwój” i nierozwojo- wych. W segmentacji regionalnej a priori założono bowiem, że zostaną wydzielone cztery segmenty odpowiadające wymienionym populacjom. Segmentacja ta zosta

ła przeprowadzona jednocześnie ze względu na poziom i tempo rozwoju regionów w odniesieniu do przeciętnego poziomu i tempa rozwoju w Unii Europejskiej.

Zrealizowano segmentację statyczną w odniesieniu do 2005 r. Zastosowano na

stępujące kryteria segmentacji reprezentujące poziom rozwoju regionów: fj - pro

(4)

dukt krajowy brutto/1 mieszkańca w jednostkach PPS (Purchasing Power Standards) (UE 27 = 100), Y2 - tempo przyrostu produktu krajowego brutto w % (w cenach bieżących) w 2005 r. w relacji do roku 2002.

Zaproponowano następujący zestaw „kandydatek” na zmienne profilowe, obej

mujący cechy statystyczne odrębne dla każdego czynnika konkurencyjności regio

nów:

I - czynniki produkcji:

X — udział pracujących z wyższym wykształceniem w ogólnej liczbie pracują

cych w wieku 25-64 lata (w %), X2 - udział pracujących z wyższym wykształceniem w ogólnej liczbie ludności w wieku 25-64 lata (w %), X2 - udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata (w %), XĄ - zasoby ludzkie w nauce i technologii jako % ogółu ludności, X5 - zasoby ludzkie w nauce i technologii jako % ludności aktywnej zawodowo w wieku 25-64 lata, X6 - liczba patentów zgłoszonych do Europejskiego Urzędu Patentowego na 1 min zasobów siły roboczej,

II - klimat społeczno-gospodarczy:

X7 - udział pracujących w usługach dotyczących pośrednictwa finansowego, ob

sługi nieruchomości, wynajmu i działalności związanej z prowadzeniem interesów w ogóle pracujących (w %), X$ - stopa bezrobocia (w %), X9 - bezrobocie długo

trwałe (co najmniej 12 miesięcy) jako % bezrobocia ogółem, III - sektory pokrewne i wspomagające:

X |0 - udział pracujących w sektorach wysokich technologii (przemyśle i usłu

gach wysokich technologii oraz usługach opartych na wiedzy) w ogóle pracujących (w %), X u - udział pracujących w przemyśle wysokich i średnio wysokich techno

logii w ogóle pracujących (w %), X n - udział pracujących w usługach opartych na wiedzy i usługach wysokich technologii w ogóle pracujących (w %), X - udział pracujących w usługach opartych na wiedzy w ogóle pracujących (w %), X [Ą- udział pracujących w usługach rynkowych opartych na wiedzy w ogóle pracujących (w %), X ls— udział pracujących w usługach finansowych opartych na wiedzy w ogóle pra

cujących (w %), X l6- wydajność pracy (produkt krajowy brutto na 1 pracującego) w tys. PPS.

Po przeprowadzeniu analizy dostępności informacji statystycznych z poten

cjalnego zbioru zmiennych profilowych usunięto zmienne X l0, X l2, X iy Pozostałe

„kandydatki” na zmienne profilowe cechowały się dostępnością informacyjną oraz wystarczającą zmiennością. Wartość krytyczną współczynnika korelacji ustalono na poziomie rx = 0 ,1 3 . Jest to wartość graniczna, powyżej której współczynnik kore

lacji jest istotny statystycznie na poziomie istotności a = 0,05, dla N-2 = 227 stopni swobody.

W tabeli 1 przedstawiono współczynniki korelacji „kandydatek” na zmienne profilowe (z wyłączeniem „kandydatek” niedostępnych: X ]Q, X l2, X l5) z kryteriami segmentacji 7, i Yr Jedyną potencjalną zm ienną profilow ą nieistotnie skorelowaną

(5)

z oboma kryteriami okazała się zmienna X6 - liczba patentów zgłoszonych do Eu

ropejskiego Urzędu Patentowego na 1 min zasobów siły roboczej. Nieistotnie sko

relowana z Y (poziom PKB per capita (UE = 100)) była zmienna X n, a z E, (tempo wzrostu PKB w 2005 r. w stosunku do roku 2002 (w %)) - zmienne X p X2, Xs i Xr

Tabela 1. Korelacja potencjalnych zmiennych profilowych z kryteriami segmentacji

Potencjalne zmienne profilowe

Kryteria segmentacji

Kryteria segmentacji istotnie skorelowane z potencjalnymi zmiennymi profilowymi Yi

0,544 -0,033

X 0,595 -0,023

0,489 -0,151

X t 0,714 -0,155 Y _Ł_{1» / 2}Y

* 5 0,734 -0,197 Y Y ₁_1’₁₂

X t 0,019 0,071 -

X 7 0,836 -0,268

X , -0,413 -0,012

r,

X 9 -0,429 0,078

X„ 0,085 -0,162

n

X „ 0,700 -0,343 Y Y

X\4 0,781 -0,286 Y Y ₁

1» 1 2

X 0,957 -0,303 Y Y 1 1» J2

Źródło: obliczenia własne.

Ostatecznie wybrano następujące zmienne profilowe spełniające warunki do

stępności, zmienności i istotnej korelacji z kryteriami segmentacji: X} - udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata (w %), XĄ - zasoby ludzkie w nauce i technologii jako % ogółu ludności, X5 - zasoby ludzkie w nauce i technologii jako odsetek ludności aktywnej zawodowo w wieku 25-64 lata, X? - udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wy

najmem i działalnością zw iązaną z prowadzeniem interesów w ogóle pracujących (w % ),XI}- udział pracujących w usługach opartych na wiedzy w ogóle pracujących (w %), X l4- udział pracujących w usługach rynkowych opartych na wiedzy w ogóle pracujących (w %), X l6- wydajność pracy (produkt krajowy brutto na 1 pracujące

go) w tys. PPS.

W badanej próbie współczynnik zmienności dla produktu krajowego brutto/1 mieszkańca wynosił 39,8%, tempo przyrostu produktu krajowego brutto w 2005 r.

w relacji do roku 2002 cechowało się większą zm iennością wynoszącą 54,5%. War-

(6)

Tabela 2. Segmentacja wybranych regionów NUTS 2 Unii Europejskiej w 2005 r.

M e z o -

s e g m e n ty R e g i o n y N U T S 2

N a d - k o n k u r e n c y j n y

P ro v . B r a b a n t W a llo n ( B E ) , P r a h a ( C Z ) , S a a r l a n d ( D E ) , B o r d e r , M id la n d s a n d W e s te r n ( I E ) , S o u th e r n a n d E a s t e r n ( I E ) , A tti k i ( G R ) , C a n t a b r ia ( E S ) , P a is V a s c o ( E S ) , C o m u n i d a d F o r a i d e N a v a r r a ( E S ) , L a R io j a ( E S ) , A r a g o n ( E S ) , C o m u n i d a d d e M a d r id ( E S ) , C a t a lu i ïa ( E S ) , I lle s B a l e a r s ( E S ) , L u x e m b o u r g ( G r a n d - D u c h é ) ( L U ) , K ô z é p - M a g y a r o r s z â g ( H U ) , G r o n i n g e n ( N L ) , K ä r n te n (A T ), O b e r ö s te r r e i c h (A T ), S a lz b u r g (A T ), T i r o l (A T ), V o r a r lb e r g (A T ), B r a t i s l a v s k y k r a j ( S K ) , S to c k h o l m ( S E ) , V ä s ts v e r ig e (S E ) , Ô v r e N o r r la n d ( S E ) , D e r b y s h i r e a n d N o t t i n g h a m s h i r e ( U K ) , L e ic e s te r s h i r e , R u tl a n d a n d N o r th a n t s (U K ) , H e r e f o r d s h ir e , W o r c e s t e r s h ir e a n d W a rk s ( U K ) , E a s t A n g l i a ( U K ) , I n n e r L o n d o n ( U K ) , B e r k s h ir e , B u c k s a n d O x f o r d s h i r e ( U K ) , H a m p s h ir e a n d I s le o f W i g h t ( U K ) , K e n t ( U K ) , D o r s e t a n d S o m e r s e t ( U K ) , E a s te r n S c o tl a n d ( U K )

S ta b i ln y R é g i o n d e B r u x e l l e s - C a p i t a l e ( B E ) , P ro v . A n t w e r p e n ( B E ) , P ro v . O o s t - V l a a n d e r e n ( B E ) , P ro v . V la a m s B r a b a n t ( B E ) , P ro v . W e s t - V l a a n d e r e n ( B E ) , S t u t t g a r t ( D E ) , K a r ls r u h e ( D E ) , F r e ib u r g ( D E ) , T ü b i n g e n ( D E ) , O b e r b a y e m ( D E ) , N i e d e r b a y e m ( D E ) , O b e r p f a l z ( D E ) , O b e r f r a n k e n ( D E ) , M itt e lf i a n k e n ( D E ) , U n te r f r a n k e n ( D E ) , S c h w a b e n ( D E ) , B r e m e n ( D E ) , H a m b u r g ( D E ) , D a r m s ta d t ( D E ) , G ie ß e n ( D E ) , K a s s e l ( D E ) , B r a u n s c h w e i g ( D E ) , H a n n o v e r ( D E ) , D ü s s e l d o r f ( D E ) , K ö ln ( D E ) , D e tm o ld ( D E ) , A r n s b e r g ( D E ) , R h e i n h e s s e n - P f a l z ( D E ) , S c h le s w ig - H o ls te in ( D E ) , S te r e a E l la d a ( G R ) , î l e d e F r a n c e ( F R ) , C h a m p a g n e - A r d e n n e ( F R ) , H a u te - N o r m a n d ie ( F R ) , C e n t r e ( F R ) , A l s a c e ( F R ) , P a y s d e la L o i r e ( F R ) , A q u ita in e ( F R ) , M id i- P y r é n é e s ( F R ) , R h ô n e - A lp e s ( F R ) , P r o v e n c e - A l p e s - C ô t e d ’A z u r ( F R ) , P ie m o n te ( I T ) , L i g u r ia ( I T ) , L o m b a r d ia ( I T ) , P r o v i n c i a A u to n o m a B o l z a n o - B o z e n ( I T ) , P r o v in c i a A u t o n o m a T r e n to ( I T ) , V e n e to ( I T ) , F r iu li - V e n e z ia G i u l i a ( I T ) , E m ili a - R o m a g n a ( I T ) , T o s c a n a ( I T ) , M a r c h e ( I T ) , L a z io ( I T ) , F r ie s la n d ( N L ) , D r e n th e ( N L ) , O v e r i j s s e l ( N L ) , G e ld e r l a n d ( N L ) , U t r e c h t ( N L ) , N o o r d - H o l l a n d ( N L ) , Z u i d - H o l la n d ( N L ) , Z e e l a n d ( N L ) , N o o r d - B r a b a n t ( N L ) , L i m b u r g ( N L ) , N ie d e r ö s t e iT e ic h (A T ), W ie n (A T ), L i s b o a ( P T ) , E te lä - S u o m i ( F I ) , L ä n s i - S u o m i ( F I ) , Ö s t r a M e l l a n s v e r i g e ( S E ) , S m ä l a n d m e d ö a m a ( S E ) , S y d s v e r ig e ( S E ) , N o n a M e ll a n s v e r ig e ( S E ) , M e ll e r s ta N o n l a n d ( S E ) , N o r t h u m b e r l a n d , T y n e a n d W e a r ( U K ) , C h e s h ir e ( U K ) , G r e a t e r M a n c h e s t e r ( U K ) , W e s t Y o r k s h i r e ( U K ) , W e s t M i d la n d s ( U K ) , B e d f o r d s h ir e , H e r tf o r d s h ir e ( U K ) , O u t e r L o n d o n ( U K ) , S u n e y , E a s t a n d W e s t S u s s e x ( U K ) , G lo u c e s t e r s h i r e , W i lts h ir e a n d B r is to l / B a th a r e a ( U K ) , E a s t W a le s ( U K ) , S o u th W e s t e r n S c o t l a n d ( U K )

Z s z a n s ą n a r o z w ó j

S e v e r o i z lo c h e n ( B G ) , Y u g o iz t o c h e n ( B G ) , Y u g o z a p a d e n ( B G ) , Y u z h e n ts e n t r a le n ( B G ) , S tr e d n i C e c h y ( C Z ) , J i h o z ä p a d ( C Z ) , S e v e r o z a p a d ( C Z ) , S e v e r o v y c h o d ( C Z ) , J i h o v y c h o d ( C Z ) , S tr e d n i M o r a v a ( C Z ) , M o r a v s k o s l e z s k o ( C Z ) , E s to n i a ( E E ) , K e n tr i k i M a k e d o n i a ( G R ) , P e lo p o n n i s o s ( G R ) , G a li c ia ( E S ) , P r in c i p a d o d e A s t u r i a s ( E S ) , C a s ti lla y L e ó n ( E S ) , C a s t i l l a - l a M a n c h a ( E S ) E x t r e m a d u r a ( E S ) , C o m u n i d a d V a le n c ia n a ( E S ) , A n d a lu c ia ( E S ) , R e g i o n d e M u r c i a ( E S ) , C a n a r ia s ( E S ) , C y p r u s ( C Y ) , L a tv i a (L V ), L i t h u a n i a (L T ), K ô z é p - D u n a n tû l ( H U ) , É s z a k - M a g y a r o r s z a g ( H U ) , F le v o l a n d ( N L ) , Ł ó d z k ie ( P L ) , M a z o w ie c k ie ( P L ) , M a ło p o l s k i e ( P L ) , Ś lą s k ie ( P L ) , P o d k a r p a c k i e ( P L ) , W i e lk o p o l s k i e (P L ) , L u b u s k ie ( P L ) , W a r m iń s k o - M a z u r s k ie ( P L ) , P o m o r s k i e ( P L ) , N o r d - V e s t ( R O ) , C e n t r u ( R O ) , N o r d - E s t ( R O ) , S u d - E s t ( R O ) , S u d - M u n t e n ia ( R O ) , B u c u r e s t i - I l f o v ( R O ) , S u d - V e s t O l te n ia ( R O ) , V e st ( R O ) , Z a p a d n ę S lo v e n s k o ( S K ) , V ÿ c h o d n é S lo v e n s k o ( S K ) , T e e s V a lle y a n d D u r h a m ( U K ) , C u m b r i a ( U K ) , S o u th Y o r k s h i r e ( U K ) , E s s e x ( U K ) , C o r n w a ll a n d I s le s o f S c il ly ( U K ) , D e v o n ( U K ) , N o r th e r n I r e la n d ( U K ) N i e r o z w o j o w y P ro v . L i m b u r g ( B E ) , P ro v . H a i n a u t ( B E ) , P ro v . L i è g e ( B E ) , P ro v . N a m u r ( B E ) , S e v e r o z a p a d e n ( B G ) , S e -

v e r e n ts e n t r a le n ( B G ) , B e r l in ( D E ) , B r a n d e n b u r g - N o r d o s t ( D E ) , B r a n d e n b u r g - S ü d w e s t ( D E ) , M e c k l e n b u r g - V o r p o m m e r n ( D E ) , L ü n e b u r g ( D E ) , W e s e r - E m s ( D E ) , M ü n s t e r ( D E ) , K o b le n z ( D E ) , C h e m n itz ( D E ) , D y tik i H e l l a d a ( G R ) , P ic a r d ie ( F R ) , B a s s e - N o r m a n d i e ( F R ) , B o u r g o g n e ( F R ) , N o r d - P a s - d e - C a la i s ( F R ) , L o r r a i n e ( F R ) , F r a n c h e - C o m té ( F R ) , L i m o u s i n ( F R ) , A u v e r g n e ( F R ) , L a n g u e d o c - R o u s s i ll o n ( F R ) , U m b r ia ( I T ) , A b r u z z o ( I T ) , M o lis e ( I T ) , C a m p a n i a ( I T ) , P u g l i a ( I T ) , B a s il ic a ta ( I T ) , C a l a b r ia ( I T ) , S i c i l i a ( I T ) , S a r d e g n a ( I T ) , N y u g a t - D u n a n t u l ( H U ) , D é l - D u n â n t ü l ( H U ) , É s z a k - A lf o l d ( H U ) , D e l- A lf ö l d ( H U ) , M a lt a ( M T ) , B u r g e n l a n d ( A T ), L u b e ls k ie ( P L ) , Ś w i ę t o k r z y s k i e ( P L ) , P o d la s k ie ( P L ) , Z a c h o d n io p o m o r s k ie ( P L ) , K u j a w s k o - P o m o r s k i e ( P L ) , N o r t e ( P T ) , A l g a r v e ( P T ) , C e n t r o ( P T ) , A le n t e jo ( P T ) , S tr e d n é S lo v e n s k o ( S K ) , I tä - S u o m i ( F I ) , P o h jo is - S u o m i ( F I ) , L a n c a s h ir e ( U K ) , L i n c o ln s h ir e ( U K ) , S h r o p s h i r e a n d S ta f f o r d s h ir e ( U K ) , W e s t W a le s a n d T h e V a lle y s ( U K )

BE - Belgia, BG - Bułgaria, CZ - Republika Czeska, DE - Niemcy, EE - Estonia, IE - Irlandia, GR - Grecja, ES - Hiszpania, FR - Francja, IT - Włochy, CY - Cypr, LV - Łotwa, LT - Litwa, LU - Luksemburg, HU - Węgry, MT - Malta, N L - Niderlandy, AT -Austria, P L - Polska, PT - Portugalia, RO - Rumunia, SI - Słowenia, SK - Słowacja, FI - Finlandia, SE - Szwecja, UK - W. Brytania.

Źródło: opracowanie własne na podstawie bazy danych Eurostatu.

(7)

tości progowe kryteriów segmentacji przyjęte na poziomie przeciętnych wartości w UE wyniosły odpowiednio y* = 100% i y \ = 12,7%. Wyniki segmentacji przed

stawiono w tab. 2.

Segment nadkonkurencyjny grupujący regiony cechujące się poziomem PKB per capita i dynam iką PKB przekraczającymi średnią unijną okazał się najmniej liczny. W jego skład weszło 36 regionów, co stanowiło 15,7% liczebności badanej próby. Dominowały regiony tworzące mezosegment stabilny (poziom PKB per ca

pita przekraczał średnią unijną, lecz tempo wzrostu było niższe od przeciętnego), składający się z 82 regionów, co stanowiło 35,8% liczebności badanej próby. Li

czebności segmentów „z szansą na rozwój” i nierozwojowego były zbliżone i wy

nosiły odpowiednio: 55 i 56 regionów (24 i 24,5%). Nieznaczna większość regio

nów NUTS 2 poddanych analizie cechowała się poziomem PKB na 1 mieszkańca wyższym od średniej unijnej (51,5%) oraz dominowały regiony, w których tempo wzrostu PKB było niższe od przeciętnego (60,3%).

Identyfikacji finalnych zmiennych profilowych o największej sile dyskrymina

cyjnej dokonano z wykorzystaniem analizy dyskryminacyjnej po uprzedniej wery

fikacji jej założeń. Segmentacja regionalna a priori ma charakter rozłączny, poten

cjalne zmienne profilowe zostały zmierzone na skali metrycznej (ilorazowej) i żadna z uwzględnionych zmiennych nie stanowi kombinacji liniowej pozostałych. Kolej

ne założenie wymaga, aby potencjalne zmienne profilowe wykazały w segmentach łącznie wielowymiarowy rozkład normalny. Do weryfikacji hipotezy o normalności wykorzystano test Shapiro-Wilka. Rozkłady empiryczne nie wszystkich analizowa

nych zmiennych w otrzymanych segmentach okazały się rozkładami normalnymi, stąd założenie to nie zostało spełnione. Następnie, korzystając z wielowymiarowego testu Boxa, ocenie poddano kolejne założenie analizy dyskryminacyjnej wymagają

ce równości macierzy wariancji i kowariancji zmiennych profilowych w wyłonio

nych segmentach. To założenie również nie zostało spełnione. W badaniach empi

rycznych taka sytuacja często ma miejsce. Ponieważ założenia te nie są krytyczne, analiza dyskryminacyjna często jest stosowana z pozytywnym skutkiem, mimo ich niespełnienia.

Analizę dyskrym inacyjną wstępnie przeprowadzono dla wszystkich zmiennych profilowych: X3, X4, X5, Xv X ]}, X l4, X l6. Zastosowano procedurę krokowej postępu

jącej analizy dyskryminacyjnej, zgodnie z którą w modelu nie znalazła się zmienna X n. Do oceny istotności zmiennych w dyskryminowaniu segmentów na podstawie cząstkowych współczynników Ap W ilksa wykorzystano statystykę F^ m ającą roz

kład Fishera-Snedecora. Wyniki weryfikacji zestawiono w tab. 3.

Statystyka teoretyczna dla poziom u istotności a = 0,05 i G - 1 = 3 i N - G - P + 1 = 220 stopni sw obody (N, G, P - liczba regionów, segmentów, zm ien

nych profilow ych) w ynosi w przybliżeniu F = 2,65, co oznacza, że zm ienna X s okazała się nieistotna (statystyka em piryczna F nie przekracza statystyki teo

retycznej, w artość statystyki testowej p-value je s t w iększa od założonego po-

(8)

Tabela 3. Podsumowanie analizy funkcji dyskryminacyjnej dla 6 zmiennych

Zmienne profilowe Cząstkowy współczynnik An Wilksa Statystyka empiryczna Fn p-value

0,8643 11,5113 0,0000

0,9604 3,0272 0,0304

0,8310 14,9087 0,0000

X, 0,8836 9,6574 0,0000

X» 0,9572 3,2766 0,0219

X, 0,9833 1,2437 0,2947

Źródło: obliczenia własne z wykorzystaniem pakietu statystycznego STATISTICA 8 PL.

ziom u istotności a ) . Ponow nie przeprow adzono postępującą analizę krokow ą dla 5 zm iennych profilow ych (bez zm iennej X 5). Do m odelu rów nież nie w eszła zm ienna X iy W yniki oceny istotności zmiennych profilowych wprowadzonych do modelu znajdują się w tab. 4.

Tabela 4. Podsumowanie analizy funkcji dyskryminacyjnej dla 5 zmiennych

Zmienne profilowe Cząstkowy współczynnik A Wilksa Statystyka empiryczna Fp p-value

x lt ^0,8721 ^10,8004 ^0,0000

* 4 0,9215 6,2767 0,0004

0,8258 15,5403 0,0000

* 3 0,8622 11,7773 0,0000

* , 4 0,9583 3,2067 0,0240

Statystyka teoretyczna dla poziomu istotności a = 0,05 i G - 1 = 3 i N - G - P + 1 = 221 stopni swobody również wynosi w przybliżeniu F = 2,65, co oznacza, że wszystkie zmienne istotnie wpływ ają na dyskryminację segmentów (statystyka em piryczna Fp w każdym przypadku przekracza wartość statystyki teoretycznej, war

tość statystyki testowej p-value jest m niejsza od założonego poziomu istotności a).

Uznano zatem, że zmienne X5 (zasoby ludzkie w nauce i technologii jako odse

tek ludności aktywnej zawodowo w wieku 25-64 lata) oraz X n (udział pracujących w usługach opartych na wiedzy w ogóle pracujących (w %)) nie m ają udziału w dys

kryminacji regionów europejskich ze względu na poziom i tempo rozwoju.

Kolejnym etapem analizy dyskryminacyjnej jest określenie istotności poszcze

gólnych funkcji dyskryminacyjnych. Tabela 5 zawiera wyniki weryfikacji istotności trzech otrzymanych funkcji dyskryminacyjnych. Jak z niej wynika, zdecydowanie największy udział w ogólnej mocy dyskryminacyjnej całego modelu ma funkcja pierwsza (80,3%), dużo niższy (chociaż znaczący) jest udział drugiej funkcji (18,8%).

(9)

Natomiast trzecia funkcja nie ma większego znaczenia. Do podobnych wniosków prowadzi ocena wartości współczynników korelacji kanonicznej wyliczonych dla poszczególnych funkcji dyskryminacyjnych. Przeprowadzono również ocenę staty

stycznej istotności otrzymanych funkcji z wykorzystaniem współczynnika lambda Wilksa, z której wynika, że jedynie dwie pierwsze funkcje dyskryminacyjne są istot

ne statystycznie, a więc cechuje je zdolność do separacji wydzielonych segmentów.

Trzecia funkcja dyskryminacyjna okazała się nieużyteczna

(x~

< Zó.m-j )> dlatego w dalszej części analizy nie będzie poddawana interpretacji.

Tabela 5. Weryfikacja istotności funkcji dyskryminacyjnych

Funkcja

dyskryminacyjna R ; U. (w %) A Wilksa X2

Stopnie swobody

d f

Zn.Dy.Jf p-value

*>. 0,7035 80,3 0,4063 201,2754 15 25,00 0,0000

d2 0,4320 18,8 0,8044 48,6376 8 15,50 0,0000

0,1047 0,9 0,9890 2,4654 3 7,81 0,4816

R _ - współczynnik korelacji kanonicznej z-tej funkcji dyskryminacyjnej, Uz - współczynnik udziału z-tej fiinkcii w ogólnej mocy dyskryminacyjnej wszystkich funkcji, y 2- statystyka empiryczna chi-kwadrat, Zń.o>:di - statystyka teoretyczna rozkładu chi-kwadrat dla poziomu istotności a = 0,05 i d f stopni swobody, p-value - statystyka testowa.

Dwie pierwsze funkcje dyskryminacyjne oszacowane na podstawie standaryzo

wanych wartości zmiennych profilowych przyjętych do analizy przybrały następu

jąc ą postać:

D, = 0,3543*, + 0,4433*, - 0,2666*4 + 0,1136*6 + 0,6909*?, (2) D2 = 1,1477*, + 0,5380*, - 2,0873*4 + 0,7939*6 - 0,1686*r (3) Standaryzowane współczynniki dyskryminacyjne oszacowanych funkcji sta

now ią podstawę identyfikacji zmiennych profilowych o największym znaczeniu w rozróżnianiu wyodrębnionych segmentów. Na pierwszą funkcję dyskryminacyjną zdecydowanie największy i dodatni wpływ wywierają zmienne * , 6 (wydajność pra

cy w tys. PPS) i X4 (zasoby ludzkie w nauce i technologii jako % ogółu ludności).

Na drugą funkcję największy wpływ (ujemny) wywiera zmienna * 7 (udział pracują

cych w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością zw iązaną z prowadzeniem interesów w ogóle pracują

cych (w %)) i dodatni - zmienna * 3 (udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25- -64 lata)).

Analogiczną analizę można przeprowadzić na podstawie tzw. współczynników struktury czynnikowej będących współczynnikami korelacji liniowej zmiennych

(10)

profilowych z wartościami funkcji dyskryminacyjnych. Macierz współczynników struktury czynnikowej dla dwóch istotnych funkcji dyskryminacyjnych przedstawia tab. 6.

Najsilniejszy związek (dodatni) z pierwszą funkcją dyskryminacyjną wykazały kolejno zmienne: X ]6, X l4 (udział pracujących w usłu

gach rynkowych opartych na wiedzy w ogóle pracujących (w %)) i XĄ. Z drugą funkcją dys

kryminacyjną najsilniej związane są zmienne:

X1 (ujemnie), X ]b (ujemnie) i X3 (dodatnio).

Identyfikacja segmentów rozróżnianych przez poszczególne funkcje dyskryminacyjne została przeprowadzona na podstawie analizy średnich wartości zmiennych dyskryminacyj

nych (por. tab. 7). Pierwsza funkcja dyskry

minacyjna w największym stopniu rozróżnia segmenty nadkonkurencyjny i stabilny od seg

mentów z szansą na rozwój i nierozwoj owego, czyli segmenty charakteryzujące się wysokim i niskim poziomem rozwoju. Wykazywane tak

że są różnice zarówno między segmentem nadkonkurencyjnym a stabilnym, jak i z szansą na rozwój a nierozwojowym. Druga funkcja dyskryminacyjna najbardziej separuje segmenty nadkonkurencyjny i z szansą na rozwój od nierozwoj owego i sta

bilnego, a więc segmenty cechujące się wysokim i niskim tempem rozwoju. Nie rozróżnia w zasadzie segmentu nadkonkurencyjnego od z szansą na rozwój. Istot

ność tej separowalności jest znacznie niniejsza niż w przypadku pierwszej funkcji dyskryminacyjnej.

Na podstawie wyników analizy dyskryminacyjnej zdecydowano, że finalny

mi zmiennymi profilowymi zostaną te zmienne, których istotny wpływ na funkcje dyskryminacyjne wynikał zarówno z analizy współczynników standaryzowanych, jak i ze struktury czynnikowej. N ależą do nich X i6 i XĄ dla pierwszej funkcji oraz X1 i X} - dla drugiej. Należy przypomnieć, że pierwsza funkcja dyskryminacyjna wyjaśnia 80,3% wariancji międzygrupowej, a druga - jedynie 18,8%, stąd segmen

ty będą bardziej rozróżnialne ze względu na finalne zmienne profilowe X ]6 i X4 niż X1 i Xy Tym samym najistotniejszymi finalnymi zmiennymi profilowymi okazały się kolejno: wydajność pracy na 1 pracującego i zasoby ludzkie w nauce i techno

logii jako procent ogółu ludności oraz udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością związaną z prowadzeniem interesów w ogóle pracujących (w %) i udział ludności dorosłej (w wieku 25-64 lata) uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata.

Tabela 6. Macierz współczynników struktury czynnikowej

Zmienne profilowe

Funkcje dyskryminacyjne

D 2

* 3 0,4926 0,1943

* 4 0,7379 -0,0027

* 7 0,6908 -0,3872

* ,4 0,7866 -0,0869

0,8586 -0,2330 Źródło: obliczenia własne z wykorzys

taniem pakietu statystycznego STATISTICA 8 PL.

(11)

Tabela 7. Średnie wartości zmiennych dyskryminacyjnych w wyodrębnionych segmentach

Segmenty

Zmienne dyskryminacyjne

D t D,

Nadkonkurencyj ny 1,2474 0,5779

Stabilny 0,7921 -0,2354

Z szansą na rozwój -1,1863 0,5534

Nierozwojowy -0,7967 -0,5703

Profile wyodrębnionych segmentów zestawiono w tab. 8.

Tabela 8. Profile wyodrębnionych segmentów

Segmenty

Średnie wartości finalnych zmiennych profilowych

*4 * 7 *3

Nadkonkurencyjny 64,14 30,08 12,21 14,36

Stabilny 61,02 28,59 11,65 11,53

Z szansą na rozwój 33,81 19,93 6,68 6,85

Nierozwojowy 42,57 21,33 7,71 7,09

Źródło: obliczenia własne na podstawie bazy danych Eurostatu.

Finalne zmienne profilowe przyjm ująnajw iększe przeciętne wartości w segmen

cie nadkonkurencyjnym, następnie w stabilnym i nierozwojowym, a najmniejsze w segmencie z szansą na rozwój.

4. Zakończenie

Z przeprowadzonych badań wynika, że w regionach europejskich między wskaźnika

mi konkurencyjności a poziomem PKB per capita w 2005 r. występowała zazwyczaj silniejsza zależność niż z tempem wzrostu PKB. Istotny wpływ na zróżnicowanie segmentów wywarło jedynie pięć wskaźników konkurencyjności, do których nale

żą: udział ludności dorosłej uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata, zasoby ludzkie w nauce i technologii jako pro

cent ogółu ludności, udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością związaną z prowa

dzeniem interesów w ogóle pracujących, udział pracujących w usługach rynkowych opartych na wiedzy w ogóle pracujących, wydajność pracy na 1 pracującego.

(12)

Wydajność pracy na 1 pracującego i zasoby ludzkie w nauce i technologii (jako odsetek ogółu ludności) w największym stopniu różnicują regiony o niskim i w y

sokim poziomie rozwoju. Natomiast udział pracujących w usługach związanych z pośrednictwem finansowym, obsługą nieruchomości, wynajmem i działalnością związaną z prowadzeniem interesów w ogóle pracujących i udział ludności doro

słej uczestniczącej w kształceniu ustawicznym w ogólnej liczbie ludności w wieku 25-64 lata dyskrym inują najlepiej regiony cechujące się niskim i wysokim tempem wzrostu. W ymienione wskaźniki przyjm ują najwyższe wartości w regionach nadkonkurencyjnych (wysoki poziom i dynamika rozwoju), a najniższe - w regionach z szansą na rozwój cechujących się niskim poziomem i w ysoką dynamiką rozwoju.

Analiza dyskryminacyjna okazała się efektywnym narzędziem wspomagającym profilowanie w segmentacji regionalnej.

Literatura

Huberty C.J., Applied discriminant analysis, John Wiley & Sons, New York 1994.

Huberty J., Olejnik S., Applied MANOVA and discriminant analysis, John Wiley & Sons, New Jersey 2006.

Johnson R.A., Wichem D.W., Applied multivariate statistical analysis, Prentice-Hall, Upper Saddle River, 2002.

Kiecka W.R., Discriminant analysis, Sage Publication, London 1980.

Krzyśko M., Analiza dyskryminacyjna, Wydawnictwo Naukowo-Techniczne, Warszawa, 1990.

Malhotra N.K., Marketing research. An applied orientation, Prentice-Hall, Upper Saddle River 2007.

Morrison D.F., Wielowymiarowa analiza statystyczna, PWN, Warszawa 1990.

Rao C.R., Modele liniowe statystyki matematycznej, PWN, Warszawa 1982.

T H E A P PL IC A T IO N O F D ISC R IM IN A T IO N ANALYSIS F O R P R O F IL IN G SEG M EN TS

IN T H E E U R O PEA N R E G IO N A L SPACE

Summary: The objective o f the study is to apply the descriptive discrimination analysis for identifying profile variables which influence the biggest diversification of segments and to define their profiles. Regional segmentation results with regard to the level and dynamics of economic development, based on the European Union countries division into NUTS 2 admin

istrative units, have become the basis for the study. The set o f candidates for profile variables includes the selected indicators o f competitiveness.