• Nie Znaleziono Wyników

UOGÓLNIONA MIARA

N/A
N/A
Protected

Academic year: 2021

Share "UOGÓLNIONA MIARA "

Copied!
108
0
0

Pełen tekst

(1)

UOGÓLNIONA MIARA ODLEGŁOŚCI

W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ

(2)
(3)

Marek Walesiak

UOGÓLNIONA MIARA

ODLEGŁOŚCI

W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ

Wydawnictwo Akademii EkonomiczneJ lm. Oskara Langego we Wrocławiu

Wrocław 2002

(4)

Recenzent Eugeniusz Gatnar

Redaktor Wydawnictwa Dorota Pttulec

Redaktor techniczn) Barbara l.opusJewic:.

Korektor

\/aria Wiszewska-Sroka

Sklad i lamanie Jolanta Salagaj

Projekt ol.ladki

Stanisław Gola

Kopiowanie i powielan1e \\jakiejkolwiek formie wymaga pisemnej zgody Wydawcy

Q Copyright by Akademia Ekonomiczna we Wrocławiu Wrocław 2002

ISBN 83-7011-583-7

Druk i oprawa: Zakład Graficzny AE we Wrocławiu Zam. 321/02.

(5)

Spis treści

Wstęp ... 7

l. PODSTA WO\\'E ZAGAONIENJ.\ STATYSTYCZNEJ Af\!ALIZY \VIELO\VYMIARO\VEJ ... 11

1.1. Pojęcia wstępni! ... ... ... ... ... 1.2. T}py skal pomiarowych i ich charakterystyka ... 13

1.3. Transfonnacja normalizacyjna i ujednolicanie zmiennych ... 16

1.4. Pomiar podobieństwa obiektów z punktu widzenia skal pomia- ru i wag zmiennych ... ... ... 22

2. UOGÓLNIONA MIARA ODLEGŁOŚCI GDM ... 33

2.1. Wprowadzenie ......... 33

2.2. Uogólniony współczynnik korelacji . . .. . ... 33

2.3. Charakterystyka uogólnionej miary odległości ... 35

2.4. Uogólniona postać miar} odległości dla zróżnicowanych wag zmiennych ... ... ... ... .. ... .... .. ... .... ... .... .... .... .. 40

2.5. Silne i słabe strony uogólnionej miary odległości ... 41

3. OBSZARY ZASTOSOWAŃ UOGÓLNIONEJ MIAR Y ODLE- GŁOŚCI W STATYSTYCZNEJ ANALIZIE WIELOWYMIA- RO\\'EJ ... 45

3.1. Uogólniona miara odległości w badaniach postaw i preferencji konsumentó\.v .... ... ... .... ... . ... . ... .. .. ... ... ... .... 45

3.2. Wyznaczanie macierz) odległości w procesie klasyfikacji obiektó\\ .. ... ... .... .. ... .. . .... .... .... .. ... .... 4 7 3.3. Ocena podobieństwa wyników klasyfikacji zbioru obiektów v. czasie . ... ... ... 48

3.4. Uogólniona miara odległości jako syntetyczny miernik rozwoju \V metodach porządkowania liniowego ... ... .... ... .. .. 54

3.5. Ocena podobieństwa W)'Dików porządkowania liniowego zbio- ru obiektów w c:t.asie ... ... . .. . ... ... ... . . .... ... .... .. 56

3.6. Przykład zastosowania uogólnionej miary odległości ... 60

(6)

6 Spis 1rdci

4. {;OGÓLNIONA MIARA ODLEGŁOŚCI-EKSPERYMENTY SY- MULACYJNE ... 67 4.1. Wpro\vadzenie ... ... ... ... 67 4.2. Eksperyment l - generowanie dwuwymiaroy,rych obserwacji

zgodnych z rozkładem normalnym o zadanym wektorzl! śred-

nich i macier.l.)' kowariancji ... ... 68 4.3. Eksperyment n - generowanie dwuwymiarowych obserwacji

o zadanych kształtach gl!ometrycznych ... .. . . ... ... 71 4.4 Eksperyment lli -generowanie dwuwymiarowych obserwacji

dla różn~ch struktur porządkov .. ych ... 74 4.5. Eksperyment IV -generowanie dwuw}miarO\\)·ch obserwacji

zgodnych z rozkładem nom1alnym i reprezentujących 4 skupie- nia separowalne ... 75 5. OPROGRAMOWANIE KOMPUTEROWE UOGÓLNIONEJ MIA-

R Y ODLEGŁOŚCI ... ... ... 83 5.1. Wprov:adzenie ... 83 5.2. Charakterystyka programu komputerowego GDM dla uogólnio-

nej miary odległości . ... ... .... 84 Literatura ... ... 97 Spis rysunków ... ... l OJ Spis tabel . ... .... . .... .. .. . .... . ... ... . . .... . .. ... .... .. .. . .... ... . . . ... .... l 04 Skorov .. ·idz ... ... ... ... .. ... ... .... ... ... ... . .. ... I 05

(7)

WSTĘP

Prezentowana książka stanowi podsumowanie rozważań autora zawartych w wielu opracowaniach dotyczących miary odległości. która została w pier- wotnej wersji zaproponowana dla zmiennych porządkowych (zob. Walesiak [ l993a]. s. 44-45). Podstawo\.ve części ksiąźk.i zostały opublikowane m.in.

w . .Argumenta Oeconomica··, .. Przeglądzie Statystycznym". ,.Badaniach Ope- racyjnych i DecpJach", Pracach i ZesZ}1ach Naukov;ych Akademii Eko- nomicznej we Wrocławiu. Szczecinie i Poznaniu oraz były referowane na konferencjach naukow)'ch. w tym na konferencji Niemieckiego Towarzy- stwa Klasyfikacyjnego w Monachium (zob. Jajuga. Walesiak i Bąk [2002J).

Praca składa się z pięciu rozdziałów.

W rozdziale pierwszym przedstawiono podstawowe zagadnienia staty- stycznej analizy wielowymiarowej. Wyjaśniono w nim takie podstawowe

pojęcia. jak obiekt. zmienna. macierz i kostka danych. Scharakteryzowano typy skal pomiarowych oraz zagadnienie transformacji normalizacyjnej i ujednolicania zmiennych z punktu widzenia skal pomiaro·wych. Ponadto za- prezentowano szeroką klasyfikację miar podobieństwa obiektów z U\vzględ­

nieniem problematyki ważenia zmiennych oraz skal ich pomiaru.

W rozdziale drugim przedstawiono szczegółową charakterystykę uogól- nionej miary odległości GDM (Generaliscd Distance Measurc). W kon- strukcji miary odległości GDM wykorzystano ideę uogólnionego współ­

czynnika korelacji, który obejmuje współczynnik korelacji liniowej Pearso- na i współczynnik korelacji zmiennych porządkowych tau Kendalla. W

nviązk'll z tym w części pierwszej tego rozdziału zaprezentowano uogólnio- ny współczynnik korelacji. W dalszej części scharakteryzowano uogólnioną miarę odległości GDM dla jednakowych i zróznicowanych wag zmiennych.

Następnie wskazano silne i słabe strony uogólnionej miary odległości.

Rozważania teoretyczne zilustrowano licznymi przykładami poglądO\\-'}'mi.

W rozdziale trzecim zaprezentowano obszary zastosowań uogólnionej miary odległości w starystycznej analizie wielowymiarowej. Podstawov.rymi obszarami zastosowań tej miary jest wyznaczanie macierzy odległości w procesie klasyfikacji obiektów oraz zastosowanie miary GDM jako synte- tycznego miernika roZ\voju w metodach porządkowania Liniowego. Ponadto w rozdziale tym zaprezentowano metody oceny podobieństwa wyników

(8)

8 Wstt;p

klasyfikacji zbioru obiektów oraz ocl!ny podobieństwa wynikó'ń- porlądko­

\\.ania liniowego zbioru obiektó'' \\ czasie W zakończeniu rozdziału npre- zentowano w·yniki badania empirycznego ilustrującego praktyczną ui.)1Ccz-

ność miary GDM.

Rozdzial cz'ńany za,,·iera rezultaty eksperymentów symulacyjnych po-

zwalających ocl!nić zachowanie się uogólnionej miary odległości GDM przy różnych strukturach danych. Dla ocen~ uogólnionej miary odległości

pr.leprowadzono cztery typy eksperymentów Zbiory danych został) wyge- nerowane za pomocą procedur RNMNGN. RNMNPR i RNECUY zawar- tych na płycie CD dołączonej do kstążki Brandta [1998].

Dla wygenerowanych struktur danych obliczono macierze odległości za

pomocą miar GDMI (dla zmiennych porządkowych). GDM2 (dla zmien- nych mierzonych na skali ilorazowej inub przedziałowej), LI (odległość

miejska). L2 (odległość euklidesowa) i LN (odległość Czebyszcwa). Dla struktur danych z piem.szych trzech typó\\ eksperymentÓ\\ obliczono war-

tości współcz)1lflików korelacjt Pearsona. Kendalla i Spearmana między tak wyznaczonymi macierzami odległości. Na tej podsta\\ie określono podo-

bieństwo miar GDM l i GDt-..12 do porówn)'\.Vanych miar odległości. Dla czwartej struktury danych przeprowadzono klasyfikację 50 obiektów dla

każdej tak wyznaczonej macierzy odległości za pomocą 4 metod klas} tika- cji; średniej mi-rdzyklasowej (BGL)~ średniej wewnątrzklasowej (WGL).

najbliższego sąsiada (NN). najdalszego sąsiada (FN). W dalszej fazie zba- dano. które miary odkgłości w połączeniu z metodą klasyfikacji pozwalają zidentyfikować 4 separowalne skupienia.

W rozdziale piątym zamieszczono charakterystykę programu kompute- rowego dla uogólnjonej miary odległości GDM napisanego •.v ję7) ku C++,

pracującego w systemie op~raq~jnym Windows. Program GDM umożliwia realizację następ4jących zadan obliczcnio,vych:

- obliczenie macierzy odległości między obiektami.

- obliczenie macier7..y odległości między obiektami ze specjalnymi po- lami wymaganymi w programie SPSS (program GDM umozliwia więc współpracę.\\ trybie o}Nine. z pakietem statystycznym SPSS).

liniowe uporządkowanie obiektów.

- U'ń'Zględnienie skal pomiaru zmiennych (por1.ądkowa. przedziałowa,

ilorazowa).

- nonnalizację zmiennych dla skali przedziałowej oraz ilorazowej.

- definiowanie wag zmiennych Oednakowych i zróL.nicowanych).

(9)

Wst~"ff 9

- defiruowanie współrzędnych \\Zorca (z U\v.t:ględnieniem zmiennych o charakterze stymulant, destymulant i nominant) w przypadku liniowego po-

rządkowania obiektów.

Pracę zamyka zesta\\ienie wykorzystywanej literatury. spis rysunkó\V i tabel oraz skorowidz rzeczowy.

Do ksiązki dołączona jest płyta CD zawierająca licencję jednostanowi-

skową na program komputerowy GDM dla uogólnionej miary odległosci '' wersji 1.0 dla Windows Q5/98/MF12000. Na płycie CD dostępna jest polska oraz. angiel~ka wersja jęZ)kowa programu GDM. Koncepc_jn programu GDM została opracowana prLez Marka Walesiaka i Andrzeja Bąka. Auto- rem podstawowego kodu prot,TTamu w .ictzyku C-H-jest Andrzej Bąk.

Książka jest przeznaczona dla pracowników naukowych zajmujących się

zastosowaniem metod statystycznej analizy wielm\)'Illiarowej w badaniach ekonomicznych. w tym w badaniach marketingov.ych. Ponadto odbiorcan1i

książki mogą być słuchacze starszych lat -wy.lszych uczelni studittiący za- gadnienia statystycznej analizy wielowymiarowej i jej zastosowań.

Pracę \~:,·konano \1' ramach projektu hadawczego nr 5 H02B 030 21 fi- nan.vowcmego przez Komitet Badali Nuukmi:l•c:h w latach 2001-2003.

(10)
(11)

l

PODST A WOWE ZAGADNIENIA 1 STATYSTYCZNEJ ANALIZY

WIELOWYMIAROWEJ

l.l. Pojęcia wstępne

Tennin .. statystyczna analiza wielowymiarowa" odnosi się do grupy metod statystycznych, za pomocą których jednoczesnej analizie poddane pomia- ry na prZ)·najmniej dwóch zmiennych opisujących kaźdy obiekt badania. Do podstawowych pojęć statystycznej analizy wielowymiarowej zalicza się pojęcie obiektu i zmiennej. Głównym zagadnieniem jest określenie ele- mentarnej jednostki badawczej. czyli obiektu badania. W pracy prLez obiekt rozumie się "naj mniejszy element poddany obserwacji. który dostarc7..a pod- stawowej z punktu \\idzenia sformułowanej hipotezy informacji'' (por.

Steczkowski i Zeliaś [1981], s. 19-20).

Obiekty rozumiane w sensie zarówno dosłownym. jak i prLcnośnym.

Obiektem jest więc w badaniach określona rlecz. osoba. kategoria abstrak- cyjna lub zdarLcnie. Konkretnymi pr;;ykładami obiektów są: konsument X, produkt Y. respondent R. przedsiębiorstwo f, rynek testowy T. dom tO\\i:ł­

rowy D. koncepcja (idea) produktu l, rynek zbytu Z. gospodarstwo domowe G. Zbiór obieJ...'iów badania będzie oznaczany przez A = {A;}~ = { A1• • • •• A11} .

Zmienna w statystycznej analizie wielowymiarowej jest charakterystyką opisującą zbiorowość obiektów. Za jej pomocą dokonuje się miert:cnia zja- v.isk i obiektywizuje ich opis (por. Jajuga [ 1987]. s. 12). W ujęciu formal- nym zmienna M 1 to odwzorowanie:

,\,f1:A~R (j= l, .... m).

gdzie: R - zbiór liczb rzeczywistych.

m - liczba zmiennych.

(1.1)

Znajomość w analizie statystycznej zbioru obiektów i zmiennych po- zwala zapisać macierz danych, w k-tórej dowolny element oznacza się prLez

x,, (i= L .... n;j = l. ... ,m). Jest to wartośćj-tej zmiennej zaobserwowana

(12)

12 l. Podstawowe zagadnienia ~Latystycroej analizy\\ it:lowymiarowcj

w i-tym obiekcie. Wielowymiarowa obserwacja (m-\a.ymiarowa) będzie za- pisywana w formie wektora (por. Jajuga [ 1993]. s. 21 ):

( 1.2)

Jeśli do dwóch ,.wymiarów'' (obiekty. zmienne} wprowadzi się .. wymiar"

czasu, to otrzymuje się tzw. kostkę danych. Pojęcia tego UŻywają w swoich pracach m.in. Zukov.·ska oraz Mucnik [ 1976), s. 15 i Jajuga l1987]. s. t 4-16:

[1993]. s. 21-23. Dowolną liczb~ w kostce danych oznacza si~ przez x ,,·

Jest to wartość j-tej zmiennej w i-tym obiekcie w okresie t (i = l, .... n:

.i= l. .... m: t '"'" l. .... 7). W celu uproszczenia zapisu do wszystkich wzorów w pracy będzie stosowana zasada. według której indeks pasy·wny (stały) bę­

dzie pomijany.

W badaniach marketingowych wykorzystujących metody statystycz- nej analizy wielowymiarowej nie wychodzi się poza trzeci .. wymiar''.

Wiąże to się nie tylko z brakiem odpowiednich danych statystycznych.

ale również z tym. ze w dalszych etapach analizy wie1mvymiarowej pierwotne dane podłegają syntetyzacji. Ponadto w razie liczby V.')'rnia- rów większej od trzech kłopotliwa staje się interpretacja wyników koń­

CO\\')'Ch.

Trójwymiarowe ujęcie w postaci kostki danych pozwala stosować w ba- daniach następujące schematy badawcze:

a) ujęcie całościowe. w którym v.-ykorzystuje się całą kostkę danych - analizowany jest tutaj zbiór n obiektów w T okresach ze względu na m zmiennych;

b) ujęcie cząstkowe-kostka ma trzy wymiary, więc moź1iwe są do uzy- skania trzy różne jej przekroje:

- przekrój czas-zmienna, w którym jeden z obiektów jest analizowany w T okresach ze względu na m zmiennych.

- przekrój obiekt-czas, w którym n obiek.'16w jest analizowanych w T okresach ze wL:ględu na jedną zmietliU\:

- przekrój obiekt-7.mienna. w którym n obiektów jest analizowanych ze

względu na m zmiennych ~jednym okresie.

W dalszej części pracy będą wykorzystywane dwa ujęcia: całościowe

oraz cząstkowe w prLekroju czas-zrnierma i obiekt-zmienna z koncepcji kostki danych. Ujęcie cząstkowe w przekroju obiekt-czas nie bl(dzie rozpa- trywane. ponieważjest to zagadnienie analizy jednowymiarowej.

(13)

1.2. T) p)' .\l.:al pomiarowych i ich charakterystyka 13

1.2. Typy skal pomiarowych i ich cha1rakterystyka

Przez pomiar rozumie się przyporządkowanie liczb obiektom zgodnie z

określonymi regułami w taki sposób. aby liczh~ odzw1erctedlały relacje za-

chodzące między tymi obiektami (por. np. Pawłowski [1969}, s. 54: Choy- nowskl [1971J, s. 17).

Podstawą teorii pomiam jest pojęcie skali.

DEFIMC.JA .l {por. Adarns. Fagot i Robinson [1965]. s. l O 1-102: Wale- siak [ 1990b]. s. 37). Taką upor~dkowaną czwórkę U= (A: G: H~ F). źc

a) A to niepusty Lbiór obiektó\\. f l- zbiór liczb rzeczywistych. G - klasa funkcji odwzorowującychA w H. f - klasa funkcji Od"\\ZOrowujących 1/v•l łl.

b) dla wszystkich ~E G i r E F. f o g E G.

c) F zawiera prlckształcenie /1 na H. a ponadto dla kazdego j~.Ji e F

złożenie ft oJ, E F.

nazyvv·a się skalą pomiaru.

W teorii pomiaru rozróżnia się cztery podsta\\owe skale pomiaru. wpro- wadzone przez Stevensa [ 1959] Definiując w odniesieniu do skali ilorazo- wej dopuszczalne przekształcenie, Stevens nic określił. do którego zbioru

naleŻ) x w funkcji ( 1.6). tzn. czy należy do caJcgo zbioru liczb rzeczywi- stych, zbioru liczb rzeczywistych dodatnich. czy rzeczywistych nieujcm- nych. Dopiero definicja Adamsa. Fagota 1 Robinsona usunęła tę usterkę.

DEFI"liCJA 2 (por Adams. Fagot 1 Robinson [1965] s. t 03: Walesiak [ 1991). s. 13-14 ). l =(A; G~ H. F) jest skalą nominalną wtedy i tylko \a.1e- dy. gdy F jest zbiorem wszystkich funkcji f odwzorowujących H w H (H= R) takich. że

f - funkcja wzajemnie jednoznaczna. ( 1.3)

DEFIMCJA 3 (por. Adams. l agot i Robinson [l 965]. s. l 03: Walesiak [1991 ]. s. 14). U= (A; G; H, F) jest skaląporządkową wtedy i tylko v.1cdy.

gdy F jest zbiorem wszystkich funkcji f odwzorowujących H w H (H= R) takich. że

f - funkcja ściśle monotonicznie rosnąca. (l .4)

(14)

14 l Podstowoy,.e zagadnienia statystyelllej analiz) \\1CioW)mlarowej

DEfiNICJA 4 (por. Adams. Fagot i Robinson [1965). s. l OJ~ Walesiak l1990b], s. 37). U= (A~ G; H, F) jest skalą interwałową (przedziałową)

\\otedy i tylko wtedy. gdy H jest zbiorem wszystkich hczb rzeczywtstych R i F jest zbiorem funkcji f takich. że dla dodatntego b

f(x)=bx+a, j(x)ER ( 1.5)

dla wszystkich x E R.

DEFINICJ .\ 5 (por. Adams. fagot i Robinson [ 1965], s. l 03: Walesiak (1990bJ. s. 38). U= (A; G: H: F) jest skalą ilorazową (stosunkową) wtedy i tylko wtedy. gdy H jest zbiorem liczb rzeczywistych dodatnich R. i F jest

zbiorem fwtkcji f takich. że dla dodatniego b

j(x) = bx. f(x) E R~ (l 6)

dla wszystkich x E R

Skale pomiaru uporządkowane są od najsłabszej do najmocniejszeJ: no- minalna, porządkowa (rangowa), przedziałowa (interwałowa), ilorazowa (stosunkowa). Skale przedziałową i ilorazową zalicza się do skal metrycz- nych. natomiast nominalną i porządkową do niemetrycznych

Z przytoczonych definicji 2-5 \l.')nika że z typem skali wiąże się grupa

przekształceń. ze v..tględu na któr~ skala zachowuje swe własności. Dopusz- czalnymi przeksztalcemami są \\ięc te, które me narusząią zasobu informacji zawartej dla mierzonej zmiermej. Skala U2 jest mocniejsza od skali U1 wtedy 1

tylko v-tedy, gd) j~j dopuszczalne pr7ekształcenie jest zdegcnero'-vanym przy- padkiem dopuszczalnego przekształcenia skali l', {por W aJenta [1971 ], ~. 5::!).

Podstawowe własności skal pomiaru zawiera tab. l , l.

Jedna z podstawowych reguł teorii pomiaru mówi, :lc jedynie re7ultaty pomiaruwskalt mocniejszeJ mogą być transfom1owane na liczb~ należące do skali ~łabsze;:j (por. np Stecz.kowskt i Zeliaś [ 1981 J. s. 17: f\997], s. 19: Wi-

śniewski [ 1986: 1987]: Walesiak [l990b ], s. 40). TransformacJa skaJ polega-

jąca na ich wzmacnianiu nie jest możliwa. ponieważ z mniejszej tlości infor- macji nie można uzyskać większej jej ilości W literaturze (por. Anderberg [ 1973 ], s. 53-69: Pociecha [1986)) podawane pewne aproks)'macyjne me- tody pr.lekształcania skal słabszych v.. silnieJS7C, opierające się na pewnych dodatkowych informacjach. StosuJąc zaś dovNolone przekształcenie wartości

na skali. .zacho"vujem) niezmienność typu skali przyjęteJ dla danej zmiermej

(15)

1.2. Typ)· skal pomiarowych i ich charaktt:ryst)·ka 15

Tabela 1.1. Podstawowe własności skał pom1aru Typ Dozwolone przel.o;młcenia

IJopuszczalne relacJe Dopus:~c7alne

skali matem'!!lcme operacje arytmetycme

<O = = f(x). j(x) -dowolne rÓ\\OOści ( x" = x11 ), zliczanie zdarzeń

.E <O przekształcenie wzajemnie różności (x,. ;t x8 ) (liczba relacji

c równości, różności)

·e jednomacme

;z o

<O z= f(x), f(x) - dowolna ściśle powytsze oraz. zliczanie zdarzeń

~ większości ( x.~ >X n) i (liczba relacji o monotonicznie rosnąca funkcja

1

mniejszości ( x" < xiJ) równości, rótności.

większości,

o. o mniejszości)

<O : = bx + a (b> O). :e R dla powy~ze oraz. powy~ze

~ wszystkich x zawartych w R , równości różnic oraz dodawanie

.e i odejmowanie

"' wartość zerowa na tej skali jest i przedziałów

'N -o zwykle pf'Z}jmowana arbitralnie (x .• -x8 =x, - Xo)

~ lub na podstawie konwencji (por.

Ackoff f 1969], s. 240)

z =hx (b> O). =E R. dla powyzsze powyższe oraz.

"' wszystkich x zawartych w R . • oraz. równości mnożenie 1 dzielente

~ ~ naruralnym początkiem skali . ( x,. Xc Ilorazów - = - ) ..5! ilorazowej jest wartość zerowa XB x,,

(zero lewostronnie ogranicza zakres skali)

Zródło: opracowanie własne na podstawie prac: Stevens [ 1959], s. 25 i 27: Adams, Fagot i Robinson [ 1965); \\' alesiak [ 1995}, s. l 89-19 l, Walesiak i Bąk [2000]. s. 17.

Inna z reguł teorii pomiaru mówi, że metody ilościowe. które można sto-

sować do wyników pomiaru w skali słabszej, stosuje się również do liczb uzyskanych z mierzenia na poziomie mocniejszym. Wynika to z tego. że

skala mocniejsza za\\~era w sobie dopuszczalne relacje skali słabszej.

Typ skali ze w~gl~du na dopuszczalne przekształcenia. determinuje sroso-

walność rozmaitych technik statystyczno-ekonometrycznych. Technikami sta- tystycznymi dopuszczalnymi dla danego typu skali takie techniki, które do-

starczają wyników (w sensie relacji) niezmiennych względem dopuszczalnych

przekształceń (por. np. Walenta [1971]. s. 61). W artykule Handa (1996]

dyskutowany jest problem relacji między skaJruni pomiaru a dopuszczalnymi dla nich technikami statystycznymi. Pokazano w nim przykłady. które źródłem kontrowersji w \.\rypadku ścisłego stosowania reguJ pomiaru.

(16)

16 l. Podstawm\ c lagadni~.:nia stal) :;1) cznc;j anali0· \\ •eiO\\)miarm\Cj

Pierwsze zestawienie typowych technik statystycznych przydatnych w pomiarze dokonyv.·anym na skalach ró:i.nych rodz.ajów olaprezentował Sten~ns

[ 1 959], s. 27. W pracy Walesiaka (l 996 ], s. 23-24 przedstawiono typowe me- tody i techniki wykonystywane w statystycznej anaJil'je wielowymiarowej.

których stosowanie jest uzalcznione od skał pomiaru l'.miennych.

1.3. Transformacja normalizacyjna i ujednolicanie zmiennych

Jeśli w badaniu <;ą wykorzystywane mt.:tody porządkowania liniowego zbio- ru obiektów. to zachodzi potrzeba:

l) ujednolicenia charakteru zmiennych będących przedmiotem agregacji.

z w)·kor~ystaniem postulatu jednolitej preferencji zmiennych.

2) pozbawienia wartości zmiennych mian i ujednolicenia rzędów wielko-

ści w celu doprO\\ad7.enia ich do porównywalności (transformacja normali- zacyjna).

Gdy w badaniu będą wykouystY\vane metody klasyfikacji i skalowania

wielo'ńymiarowego. zmienne muszą być sprowadzone do porównywalności

poprzez transformacje normalizacyjne. Stosuje się je wówc7.as. gdy zmienne mierzone na skali przedziałowej i ilorazowej. W odniesieniu do słabych

skal pomiaru nie zachodzi potrzeba normalizacji, na ich wartościach bo'viem nie vvymacza się ani relacji równości róźnic i przedziałów. ani stosunków.

Inne metody statystycznej analizy 'ń-ielowyrniarowej (analiza regresji.

metody drze\\ klasyfikacyjnych, cnnjoint analysis, analiza czynnikowa.

analiza dyskl]minac)jna, analiza korelacji kanonicznej, anali7..a wariancji i kowariancji) nie wymagają ani transfom1acji nom1alizacyjnei ani ujednoli- cania zmiennych.

Jeśli celem badania jest uporlądkowanie liniowe zbioru obiektów. istot- nego znaczenia nabiera klasyfikacja zmiennych ze względu na preferencje

wśród zmiennych. W~Tóżnia się ''tedy stymulant)' (S). destymulanty (D) i norninanty (,'t). Pojęcie stymulant)' i destymulanty wprowadził HeUwig [ 1968], a norninanty- Borys [ 1978]. Przeciwieństwem zmiennych preferen- cxinych zmienni! neutralne (obojętne) (por. Borys [1984], s. 111, 121).

Zmienna A/1 jest destymulantą (zob. Heliwig [1981]. s. 48), gdy dla każdych dwóchjej wartości x~ .x~ odnoszących się do obiektów A, .A;, jest

x~J > xt :::::;> A1 -< A~ (-< oznacza dominację obiektu A1r nad obiektem .41 ).

(17)

1.3. Transformacja normaliZilC>Jna i ujednolicanie nniennych 17

Zmienna M 1 jest stymulantą (zob. Heliwig [ 1981], s. 48), gdy dla każ­

dych dwóch jej wartości x:. xt odnoszących się do obiektów A1, A* jest

x: > xZ ~ A1 >- A* ( >- oznacza dominację obiektu A, nad obiektem Alt ).

W badaniach empirycznych dla nominant zachodzi potrzeba ustalenia

wartości łub przedziału wartości. który uznajemy za nominalny. Spośród

norninant rozwa7..ane będą w pracy tylko norninanty jednomodalne. Nomi- nanty wieJomodalne omó..-:iono m.in. w pracy Borysa (1984]. s. 118. Za najbardziej korzystną wartość norninanty jednomodalnej jest U7..nav~·ana wartość nominalna zmiennej. a za wartość najmniej korzystną- wartość

minimalna lub maksymalna.

Zmienna M 1 jest więc nominantąjednomodalną (zob. Borys [ 19841. s. l 18).

gdy dla każdych dwóch jej wartości x~v .x; odnoszących się do obiektów A,, A4

. l' 11' N N ,., A A

- Jeże 1 X11 ,xlri s nom1, to x" > xłJ => , >- *,

. l' .V ... ,\' ,.,. A A

- Jeże 1 xu ,x9 > nom1, to xl) > xłł =:> 1 -< *.

gdzie nom

1 to nominalny poziomj-tej zmiennej.

Przez ujednolicenie charakteru zmiennych rozumie się takie przekształ­

cenie każdej zmiennej. że dla każdych dwóch wartości x".x9 j-tej zmiennej

odnoszących się do obiektów A,. A;

( 1.7) Problem ujednolicenia charak"lcru zmiennych nie występuje wtedy. gdy w zbiorze zmiennych tylko stymulanty. W dalszym ciągu zakładan1y. że

ujednolicenie zmiennych polega na przekształceniu wszystkich zmiennych na stymulanty. Zagadnienie ujednolicenia charakteru zmiennych sformuło­

wano w ten sposób dlatego, że w badaniach empirycznych stymulanty sta-

nowią na ogół dominującą grupę zmiennych preferencyjnych. Formuły za- miany destymulant i norninant na stymulanty przedstawiono m.in. w pra- cach: Borys L1984], s. 289-308: Dziechciarz, Strahl i Walcsiak [2001]: Gra-

biński [1984]. s. 34-35: Kuk"ula (2000]. s. 58-59: Strahl [1978]: StrahJ i Walesiak [1997]: Walesiak [1993a]. s. 38-40: [1996], s. 36-38.

Typowe formuły transfonnacji destymulant na stymulanty mozna wyra-

zić \.\-LOrami:

(18)

18 l. ?odstawowe zagadnienia Slatystyczn;.:j analizy wielow)miarcmc.:j

a) ilorazowa: xY = b[x~J -t (b> 0). (1.8) gdzie: x~ -wartość j-tcj destymułan ty zaobserwowana w i-tym obiekcie,

b -stała przyjmov.'alla arbitralnie (np. b= min{x!1} , b= l);

l

b) różnicowa: x

9 =a-bx,~(b>O). (1.9)

gdzie: a, b-stałe prz)jmowane arbitralnie (np. b= l , a =O lub a=

= max{x/ } ).

Formułę ( 1.8) można stosować tylko do destym ul ant mierzonych na skali

ilorvow~j (t) lko dla nich bowiem zbiór moźliwych wartości zawiera się

w R ). Stymulanta otrzymana w wyniku przekształcenia będzie również

mierzona na skali ilorazowej. Formuła ( 1.9) może być stosowana do desty- mulant mierzonych na skali zarówno ilorazoweJ, jak i przedziałowej. Na ogól stymulanta otr~ymana w wyniku przeksztaJccnia (l. 9) jest mierzona na skali przedziałowej. Można jednak podać przykład takich destymwant mie- rzonych na skali ilorazowej, że stymulant)' otrzymane w wyniku ich prLe-

kształcenia (l. 9) róvmicż są mierzone na skali ilorazowej. Na przykład za- miana destymulanty .. wskaźnik zużycia środków trwałych w%" na stymu-

lant~ ,.wskaźnik niczużycia środków trwałych w%'' (w formule (1.9) b= l i a= 100% ).

W badaniach empirycznych do zamiany norninant na stymulant) wyko- rzystuje si~ następujące fom1uły:

• { N'

. . . _ mm nom, ;x,1 ,

a) Ilorazowa. xu- N (1.10)

max{nom1 :xy }

gdzie:

x : -

wartośćj-tej norninanty zaobserwowana w i-tym obiekcie, nom1- nominaln} poziomj-tej zmiennej~

b) różnicowa: J.lj = -lx:· -nom1 l· ( 1.1 t)

Formulę (1.1 0) można stosować tylko do norninant mierzonych na skali ilo- razowej (tylko dla nich bowiem zbiór możliwych wartości zawiera się w R.).

Uzyskana stymulanta będzie mieiLona w skali ilorazowej. Stymulanta uzyska- na w wyniku zastosowania \VLOru ( 1.1 t} jest mierzona na skali przedziałowej.

Jeśli w badaniu marketingowym wykorzystywane będą metody klasyfi- kacji. skalowania wielowymiarowego lub metody porządkowania liniowego zbioru obiektów, to zachodzi potrzeba pozbawienia wartości Lrniennych

(19)

1.3. Transfonnacja nonnalizacyjna i ujednolicanie 1micnn)ch 19

mian i ujednolicenia rLędów wielkości w celu doprowadzenia ich do po-

równywalności. Operacja ta nosi nazwę transformacji normalizacyjnej.

Ze względu na to, "i.c jedynym.i dopuszczaln)mi przekształceniami (por.

( 1.5) i (1.6)) na :skali przedziałowej i ilorazowej są przekształcenia liniowe,

formuły normalizac}jne można wyrazić ogólnym wzorem:

( 1.12) Szczególnymi przypadkami tego wzoru są następujące tormuły (por. np.

Abrahamowicz [1985]; Bobowski i Walesiak [ 1987]: Borys [ 1984}, s. 297- -308; Grabiński [1992]. s. 35-38: Jajuga [1981]: Jajugai Walesiak [2000];

Milligan i Cooper [ 1988 ]: Nowak [1990}, s. 38-39: Walcsiak [1988; l 990b J):

A. Standaryzacja: z11 =s~1-'j,-'X1s~1, (1.13)

B U . . l - -1

. mtaryzaCJa: z,, = ') xiJ - x, '1 .

C. Unitaryzacja zerowana: ziJ = [xu -m

1in {x!l} J/rJ,

(1.14) (1.15) D. Przekształcenia ilorazowe: =u = x;; xiJ, ( 1.16)

w których x . s .. r, to odpowiednio: średnia arytmetyczna. odchylenie stan- dardowe i rozstęp wyznaczony na podstawie waności j-tej zmiennej. We WlO-

rze ( 1.16) x01 oznacza podstawę normalizacji j-tej zmiennej, która może

być rów11a np. x01 = .\). x01 = r1 x01 = m~x{x"}. x01 = x1, x01 = L~=1x11 :

Celem normali7acji zmiennych jest -jak stwierdzono wcze~nicj - po- zbaw-ienie mian wyników pomiaru oraz ujednolicenie ich rzędów wielkości.

O ile realizacja pierwszego po:stulatu nic jest zb~ t trudna (zob. wzory (l .13)- -( 1.16)). o t) Ie ujednolicenie rzędów wielkości jest bardziej skomplikowane.

Jest ono możliv.:e tylko w razie jednolitego określenia wartości zerowej dla wszystkich zmiennych (zob. Walesiak (1988]).

Formuły normalizacyjne określone ogólnym wzorem (1.16) można sto-

sować tylko wtedy, gdy zmienne mierzone na skali ilorazowej. Gdy zbiór zawiera zmienne mierzone na skali przedziałowej lub przedziałowej i ilora- zowej, wówczas do nom1alizacji mo2:na stosować przekształcenia (1.13)- -( 1.15). wprowad?.ające jednolicie określoną wartość zerową (umowną) dla wszystkich zmiennych.

(20)

20 l. Podstawowe zagadnienia .statystycz.nej analizy wiclow) miarowej Formuły (1.13) i (1.14) określają umov.11ą wartość zerową na poziomie

średniej wartości zmiennej. a formuła ( 1.15) - na poziomie wartości mini- malnej. Zastosowanie formuł (1.13)-( 1.15) do zmiennych mierzonych na skali ilorazowej. aczkolwiek formalnie poprawne, spowoduje stratę infor- macji wskutek .. przejścia" wszystkich zmiennych na skalę pr1edziałową.

Strata informacji przejawia się m.in. ograniczeniem zastosowania różnych

technik statystycznych i ekonometrycznych.

Przy wyborze formuły normalizacyjnej należy brać pod uwagę nie tylko skale pomiaru 'Zmiennych. ale równici takie charakterystyki rozkładu

zmiennych. jak (por. tab. I .2):

- średnia ar)tmetyczna znormalizowanych wartości zmiennych.

- odchylenie standardov.·e znormalizowanych wartości zmiennych, - rozstęp wyznaczony dla znormalizowanych wartości zmiennych.

Analiza tab. 1.2 pozwala sformułować następujące \\lllioski (zob. Jąjuga i Walesiak [2000 j. s. 110-111 ):

a) fomlUły normalizacyjne (unitary7acja. unitaryzacja zerowana, prze-

kształcenie ilorazowe z podstawą normalizacji równą rozstępowi) są cenne.

ponieważ zapewniają znormalizowanym wartościom zmiennych 7Ióżnico­

waną zmienność (mierzoną odchyleniem standardowym) i jednocześnie stały rozstęp dla wszystkich zmiennych:

b) standaryzacja oraz przekształcenie ilorazowe z podstawą normalizacji

róvmą odchyleniu standardowemu powodują ujednolicenie wartości wszyst- kich zmiennych pod względem zmienności mierzonej odchyleniem standar- dowym. Oznacza to wyeliminowanie zmienności jako podstm.-.y różnicowa­

nia obiektów:

c) przekształcenia ilorazowe z podstawą normalizacji równą maksimum oraz pierwiastkov.i z sumy kwadratów obserwacji zapewniają znormalizo- wanym wartościom zmiennych zróznicowaną zmienność. średnią arytme-

tyczną i rozstęp;

d) przekształcenia ilorazowe z podsta\\'ą normalizacji równą sumie i śred­

niej arytmetycznej zapewniają znormalizowan:rm wartościom zmiennych

zróżnicowaną zmienność i ro7.stęp oraz stałą dla wszystkich zmiennych

średnią arytmetyczną. Pierwsza fom1Uła stanowi podstawę nonnalizacji w badaniach strukturalnych:

e) wszystkie formuł) normalizacyjne. będące przekształceniami liniowymi obsernacji na każdej zmiennej. ?..achowują skośność i kurtozę rozkładu

zmiennych. Ponadto dla każdej pary zmiennych wszystkie formuły normali- zaqjne nie zrnieniąią wartości '-_\'SpółcZ)1lnika korelacji liniowej Pearsona.

Cytaty

Powiązane dokumenty

Tak jak w przypadku klasyfikacji, wygodnie jest, zamiast bezpośrednio minimalizować Rx(dCt0), najpierw znaleźć odpowiednią funkcję De : Rd -+R i dopiero potem

Uwaga wiadomość powinna być wysłana z adresu pozwalającego na identyfikację nadawcy, informacja w temacie wiadomości:

Uwaga wiadomość powinna być wysłana z adresu pozwalającego na identyfikację nadawcy, informacja w temacie wiadomości:

Aksjomat ciągłości jest niezależny od pozostałych aksjomatów geometrii absolutnej: istnieje nieciągły jej model. System geometrii absolutnej nie jest kategoryczny,

Jak się okazuje dla funkcji lewostronnie ciągłej F , funkcja zbioru λ F jest przeliczalnie addytywna na pierścieniu odcinków i rozszerza się jednoznacznie do miary borelowskiej

• Przepustnice regulacyjne lub nastawcze stosuje się w instalacjach powietrznych do zmian ilości lub ciśnienia powietrza w zależności od zadanych wielkości np...

W sposobie trzecim należy się posłużyć miarami odległości wykorzystującymi dopuszczalne relacje na skali porządkowej, tj. równości, różności, większości i

[r]