• Nie Znaleziono Wyników

Dolny biegun rozwoju – współrzędne wzorca (patternType=″lower″) stanowią najmniej korzystne wartości zmiennych stymulant i destymulant:

UOGÓLNIONEJ MIARY ODLEGŁOŚCI GDM W STATYSTYCZNEJ ANALIZIE

6.2. Dolny biegun rozwoju – współrzędne wzorca (patternType=″lower″) stanowią najmniej korzystne wartości zmiennych stymulant i destymulant:

a. patternCoordinates=″dataBounds″ – współrzędne obiektu−wzorca dla stymulanty i destymulanty to odpowiednio wartość minimalna i maksymalna w zbiorze danych,

b. patternCoordinates=″manual″ – współrzędne obiektu−wzorca ba-dacz podaje sam w pliku patternManual.

7. W przypadku zastosowania miary odległości GDM1 z wagami zróżnicowany-mi (weightsType=″different1″ lub weightsType=″different2″) należy podać wektor wag (weights) wj spełniających warunki: wj∈[0;1],

1 1

m j= wj =

lub wj[0; ],m 1 m

j= wj =m

.

76 3. OBSZARY ZASTOSOWAŃ UOGÓLNIONEJ MIARY ODLEGŁOŚCI GDM...

8. Wyznacza się odległości poszczególnych obiektów od obiektu−wzorca za po-mocą uogólnionej miary odległości GDM1 dla danych metrycznych:

1 1 1

gdzie: diw – miara odległości GDM1 obiektu i-tego od obiektu−wzorca w, ,

x x – i-ta (l-ta) obserwacja na j-tej zmiennej.

9. Porządkujemy elementy zbioru obiektów A według rosnących wartości odleg-łości GDM1 (górny biegun rozwoju) lub według malejących wartości odlegodleg-łości GDM1 (dolny biegun rozwoju).

10. Prezentacja graficzna wyników porządkowania liniowego zbioru obiektów A.

B. Procedura porządkowania liniowego zbioru obiektów z wykorzystaniem odległości GDM2 dla danych porządkowych – funkcja pattern.GDM2 pakietu clusterSim

Procedura porządkowania liniowego zbioru obiektów z wykorzystaniem odleg-łości GDM2 dla danych porządkowych obejmuje następujące kroki:

1. Punktem wyjścia jest macierz danych [xij], gdzie xij oznacza obserwację j-tej zmiennej porządkowej w i-tym obiekcie.

2. Badacz wyróżnia, biorąc pod uwagę syntetyczne kryterium porządkowania elementów zbioru obiektów, zmienne stymulanty, destymulanty i nominanty. Dla kategorii poszczególnych typów zmiennych porządkowych badacz określa porzą-dek, np.:

dla stymulanty „poziom wykształcenia” obejmującej kategorie podstawowe, –

średnie i wyższe porządek jest następujący (w nawiasach podano kody): podsta-wowe (1) < średnie (2) < wyższe (3),

dla destymulanty „położenie nieruchomości gruntowej, z którą związany jest –

lokal mieszkalny, w strefie miasta” obejmującej kategorie centralna, ska, pośrednia i peryferyjna porządek jest następujący: centralna (1) > śródmiej-ska (2) > pośrednia (3) > peryferyjna (4),

3.3. UOGÓLNIONA MIARA ODLEGŁOŚCI GDM... 77 dla nominanty „położenie lokalu mieszkalnego w budynku 4-piętrowym bez –

windy” porządek jest następujący: parter (1) < I piętro (2) > II piętro (3) > III piętro (4) > IV piętro (5) – kategoria nominalna: I piętro.

performanceVariable=c(″s″,″s″,″s″,″d″,″d″,″n″) nomOptValues=c(NA,NA,NA,NA,NA,3)

3. Obiektem−wzorcem w badaniach empirycznych jest górny bądź dolny biegun rozwoju.

3.1. Górny biegun rozwoju obejmuje najkorzystniejsze kategorie zmiennych sty-mulant, destymulant i nominant. Współrzędne obiektu−wzorca wyznacza się nastę-pująco:

a. patternCoordinates=″dataBounds″ – biorąc pod uwagę kryteria merytoryczne, badacz określa współrzędne dla każdej nominanty, a dla stymulant i destymulant są to kategorie odpowiednio maksymalna i minimalna spośród obser-wowanych w zbiorze danych,

b. patternCoordinates=″manual″ – dla stymulant, destymulant i nomi-nant badacz określa współrzędne, biorąc pod uwagę kryteria merytoryczne.

3.2. Dolny biegun rozwoju – współrzędne wzorca stanowią najmniej korzystne kategorie zmiennych.

W kroku wstępnym zamienia się nominanty na destymulanty z wykorzystaniem metod:

metoda I z powtórzeniami (

– d-database). Osobno dla każdej nominanty

obli-cza się odległości GDM2 każdej obserwowanej kategorii od kategorii najko-rzystniejszej (nominalnej). Następnie poszczególne kategorie zmiennej są zastę-powane przez odpowiednie odległości,

metoda II bez powtórzeń (

– s-symmetrical). Dla każdej nominanty ustala się

typy kategorii (np. (1, 2, 3, 4, 5) lub (12, 17, 34, 45, 49)) występujące w zbiorze obserwacji oraz kategorię najkorzystniejszą (np. 3 lub 34). Oblicza się odległo-ści GDM2 ustalonych i niepowtarzających się kategorii od kategorii najkorzyst-niejszej (3 lub 34). Wszystkie kategorie w zbiorze danych są zastępowane przez odpowiednie odległości.

Współrzędne obiektu−wzorca wyznacza się następująco:

a. patternCoordinates=″dataBounds″ – dla stymulanty i destymulan-ty jest to kategoria odpowiednio minimalna i maksymalna spośród obserwowanych w zbiorze danych, dla nominanty zaś współrzędną wzorca rozwoju jest największa z odległości GDM2 (po przekształceniu nominanty na destymulantę),

b. patternCoordinates=″manual″ – dla stymulanty i destymulanty ba-dacz określa współrzędne, biorąc pod uwagę kryteria merytoryczne, dla nominanty zaś współrzędną wzorca rozwoju jest największa z odległości GDM2 (po przekształ-ceniu nominanty na destymulantę).

4. W przypadku zastosowania miary odległości GDM2 z wagami zróżnicowany-mi należy podać wagi wj spełniające warunki: wj∈[0;1],

mj=1wj =1 lub wj[0; ],m

1 .

m

j= wj =m

78 3. OBSZARY ZASTOSOWAŃ UOGÓLNIONEJ MIARY ODLEGŁOŚCI GDM...

5. Wyznacza się odległości poszczególnych obiektów od obiektu−wzorca za po-mocą uogólnionej miary odległości GDM2 dla danych porządkowych o postaci:

1 1 1

gdzie: diw – miara odległości GDM2 obiektu i-tego od obiektu−wzorca w, ,

6. Porządkujemy elementy zbioru obiektów A według rosnących wartości odle-głości GDM2 (górny biegun rozwoju) oraz według malejących wartości odleodle-głości GDM2 (dolny biegun rozwoju).

7. Prezentacja graficzna wyników porządkowania liniowego zbioru obiektów A.

3.4

OCENA PODOBIEŃSTWA WYNIKÓW PORZĄDKOWANIA LINIOWEGO ZBIORU OBIEKTÓW W CZASIE

Problem porównywania wyników dwóch różnych uporządkowań danego zbioru obiektów jest ważny nie tylko z metodologicznego punktu widzenia, ale również z punktu widzenia zastosowań metod porządkowania liniowego.

Mierniki podobieństwa dwóch uporządkowań zbioru obiektów w czasie znajdu-ją zastosowanie w ocenie zmian pozycji produktu w stosunku do produktów konku-rencyjnych. W ten sposób firma może sprawdzić, jak zmienia się w czasie usytuowa-nie na rynku jej produktu w stosunku do produktów konkurencyjnych. Badania tego typu mogą być prowadzone również w odniesieniu do innych obiektów (np. przed-siębiorstw, krajów), pozwalają one bowiem na określenie oddalenia międzyokreso-wego badanego obiektu (obiektów) na tle obiektów konkurencyjnych lub przemiesz-czenia w hierarchii obiektów w miarę upływu czasu.

Ocena podobieństwa dwóch różnych uporządkowań obiektów może być prze-prowadzana w ujęciu statycznym. W procesie postępowania konsumenta przy zaku-pie dóbr i usług istotną fazą jest ocena wariantów produktów przez konsumenta.

Otrzymujemy wtedy dla każdego konsumenta różne uporządkowania badanych

3.4. OCENA PODOBIEŃSTWA WYNIKÓW PORZĄDKOWANIA... 79 produktów. Oceniając podobieństwo uporządkowań produktów, możemy określić, w jakim stopniu konsumenci różnią się między sobą.

Ocenę podobieństwa wyników porządkowania liniowego zbioru obiektów w cza-sie przeprowadza się na podstawie wartości zmiennych syntetycznych. Walesiak [1993c] zaproponował dwa mierniki podobieństwa zbioru obiektów w czasie, któ-rych stosowanie zależy od skali pomiaru wartości zmiennych syntetycznych. Kon-strukcja pierwszego z nich (wykorzystująca ideę miernika rzędu dokładności prognoz typu ex post H. Theila) zakłada, że wartości zmiennych syntetycznych są mierzone na skali ilorazowej lub przedziałowej. Za jego pomocą mierzy się zmiany w czasie w wartościach porównywanych zmiennych syntetycznych, a więc mierzy się oddalenie międzyokresowe obiektów. Cenną zaletą tego miernika jest to, że można go rozłożyć na sumę kilku składników, mających jasną interpretację, jeśli idzie o rząd i charakter odchyleń w wartościach porównywanych zmiennych syntetycznych.

Wykorzystanie drugiego z nich, będącego współczynnikiem korelacji tau Ken-dalla, zakłada, że wartości zmiennych syntetycznych są mierzone na skali porząd-kowej. Współczynnik ten pozwala mierzyć stopień podobieństwa dwóch uporząd-kowań obiektów, wskazując na stopień przemieszczenia w hierarchii obiektów w miarę upływu czasu.

Dany jest niepusty zbiór obiektów badania A o elementach Ai (i = 1, …, n). Niech pit i piq (t, q = 1, …, T), wyznaczone za pomocą syntetycznego miernika rozwoju (SMR), oznaczają wartości zmiennych syntetycznych odpowiednio Mt i Mq ustalone dla i-tego obiektu w porównywanych okresach t i q.

Wartości zmiennych syntetycznych Mt i Mq są ze sobą bezpośrednio porówny-walne, wyznaczono je bowiem za pomocą tej samej konstrukcji SMR i na podstawie tego samego zespołu zmiennych.

Całe postępowanie porządkowania liniowego zbioru obiektów, na podstawie którego wyznacza się wartości zmiennych syntetycznych Mt i Mq, jest jednolite w odniesieniu do obu porównywanych okresów. Postępowanie to obejmuje:

a) dla bezwzorcowych formuł ujednolicenie charakteru zmiennych będących przedmiotem agregacji poprzez formuły zamiany destymulant i nominant na stymu-lanty (dla formuł wzorcowych na ogół zachodzi potrzeba zamiany nominant na sty-mulanty),

b) wprowadzenie niemianowania wartości zmiennych i ujednolicenie rzędów ich wielkości poprzez normalizację (normalizacja dotyczy zmiennych ze wspólnej macierzy danych z okresów t i q),

c) ustalenie jednego wspólnego wzorca (dla formuł wzorcowych) na podstawie macierzy obejmującej dane z okresów t i q,

d) konstrukcję SMR, obejmującą ustalenie postaci analitycznej SMR, systemu wag oraz formy wprowadzenia tego systemu do SMR.

Najpierw zostanie przedstawiona konstrukcja miernika podobieństwa zbioru obiektów w czasie, oparta na wartościach zmiennych syntetycznych Mt i Mq, mierzo-nych na skali przedziałowej lub ilorazowej. Zakłada się, że miernik będzie mierzył nie tylko rząd odchyleń od wartości porównywanych zmiennych syntetycznych Mt i Mq, ale również rząd odchyleń będący rezultatem [Walesiak 1993c]:

80 3. OBSZARY ZASTOSOWAŃ UOGÓLNIONEJ MIARY ODLEGŁOŚCI GDM...

1) różnicy między średnimi wartościami zmiennych syntetycznych Mt i Mq, 2) różnicy w dyspersji wartości zmiennych syntetycznych Mt i Mq,

3) niezgodności kierunku zmian wartości zmiennych syntetycznych Mt i Mq. Miernik mający te wszystkie cechy przybiera następującą postać:

( ) ( )

2

Miernik (3.14) przyjmuje wartość 0 wtedy, gdy nie ma żadnych różnic w warto-ściach zmiennych syntetycznych Mt i Mq. Pierwiastek kwadratowy z wyrażenia (3.12) informuje, jaki jest przeciętny rząd odchyleń wartości porównywanych zmien-nych syntetyczzmien-nych z okresów t i q.

Wielkość wyrażoną wzorem (3.14) można rozłożyć na sumę trzech składników:

2 2 2 2

1 2 3 ,

Wt q =W +W +W (3.15)

pozwalających określić bliżej „rząd” i „charakter” różnic w wartościach zmiennych syntetycznych Mt i Mq.

Mierniki cząstkowe W W12, 22 i W32 (niosące informacje, o których mowa w punktach 1, 2 i 3) określają wzory:

( )

2 standar-dowe wartości t-tej (q-tej) zmiennej syntetycznej;

r – współczynnik korelacji liniowej Pearsona między

(

1t, , nt

)

pt = pp i p. q =

(

p1q, ,… pnq

)

.

Rozbicie wzoru (3.14) na trzy składniki zostało zaczerpnięte ze wzoru Theila na miernik rzędu dokładności prognozy typu ex post (por. [Pawłowski 1973, s. 119;

Zeliaś 1984, s. 184]).

Jeśli wartości zmiennej syntetycznej są mierzone na skali porządkowej lub świa-domie zdecydujemy się na utratę informacji i otrzymane wartości pit i piq zmiennych syntetycznych Mt i Mq potraktujemy tak, jakby były mierzone na skali porządkowej, to stosując współczynnik tau Kendalla o postaci (2.1) z podstawieniem (2.4), może-my ocenić podobieństwo uporządkowań zbioru obiektów w miarę upływu czasu (por. [Walesiak 1991; 1993c]).

Można zadać pytanie, dlaczego w pracy preferuje się współczynnik tau Kendal-la, a nie powszechnie znany i stosowany współczynnik korelacji rang Spearmana.

Współczynnik korelacji rang Spearmana jest w szczególny sposób

transformowa-3.4. OCENA PODOBIEŃSTWA WYNIKÓW PORZĄDKOWANIA... 81 nym współczynnikiem korelacji liniowej Pearsona, w którym wykorzystuje się spe-cyfikę kolejnych n liczb naturalnych (por. np. [Steczkowski, Zeliaś 1981, s. 160-162;

1997, s. 186-189]).

PRZYKŁAD

Dane są uporządkowania pięciu produktów w kolejnych trzech okresach 3 oceniono za pomocą współczynnika korelacji rang Spearmana oraz tau Kendalla i otrzymano wyniki:

(1,2) 0 1

rS = , i rS(2,3) 0,2,=

12 0

K = i K23=0,2.

Między tymi współczynnikami zachodzi relacja (1, 2) (2,3),

S S

r <r

12 23.

K <K

Do wyników pomiaru zastosowano dopuszczalne przekształcenie (2.2) na skali porządkowej (f(y) = y2), zachowujące ustalony porządek wyników pomiarów. Uzy-skane wyniki nie mają wcześniej stwierdzonej własności tylko w odniesieniu do współczynnika korelacji rang Spearmana, ponieważ

12 23

Współczynnika korelacji Spearmana nie można stosować do oceny podobień-stwa uporządkowań zbioru obiektów w miarę upływu czasu (nie zapewnia on bo-wiem wyników niezmiennych względem dopuszczalnych przekształceń na skali porządkowej).

Współczynnik ten nie jest typową miarą korelacji rang, stosując go bowiem, zakłada się, że odległości pomiędzy sąsiednimi rangami są sobie równe (na skali porządkowej odległości między dowolnymi dwiema rangami nie są znane). Założe-nie to oznacza, że można go wykorzystywać, gdy mamy do czyZałoże-nienia Założe-nie z pomia-rem porządkowym, ale z pomiapomia-rem co najmniej przedziałowym.

4

UOGÓLNIONA MIARA ODLEGŁOŚCI GDM