• Nie Znaleziono Wyników

Wielowymiarowa analiza statystyczna

N/A
N/A
Protected

Academic year: 2021

Share "Wielowymiarowa analiza statystyczna"

Copied!
13
0
0

Pełen tekst

(1)

Mieczysław Sobczyk

Wielowymiarowa analiza

statystyczna

Annales Universitatis Mariae Curie-Skłodowska. Sectio H, Oeconomia 18,

159-170

(2)

A N N A L E S

U N I V E R S I T A T I S M A R I A E C U R I E - S K Ł O D O W S K A L U B L I N — P O L O N I A

VOL. X V III, 9 SECTIO H 1984

Z a k ła d Z a sto so w a ń M a te m a ty k i W y d z ia ł E k o n o m ic z n y U M C S

M i e c z y s ł a w S O B C Z Y K

W ielow ym iarow a analiza statystyczn a

М ногоизмерительны й статистический анализ M u lti-d im en sio n a l S ta tistic a l A n alysis

W k a ż d y m b a d a n iu s ta ty s ty c z n y m m ożn a w y o d rę b n ić tr z y w z a je m ­ n ie ze sobą p o w iązan e eta p y , a m ianow icie: g ro m ad z en ie in fo rm a c ji, ich p o rz ą d k o w a n ie i k la s y fik a c ję o raz m odelow anie. O sta te c z n y w y n ik b a d a ­ n ia s ta ty sty c z n e g o za leżn y je s t od p ra w id ło w eg o p rz e p ro w a d z e n ia p ra c w poszczegó lny ch e tap a ch , p rz y czym is to tn ą ro lę o d g ry w a tu ich k o le j­ ność. O znacza to, że w a rto ść poznaw cza o trz y m a n y c h m odeli k s z ta łto w a ­ n ia się zja w isk m aso w y c h zależy po p ierw sze od rzeteln o ści, ob fitości i tra fn e g o d o b o ru in fo rm a c ji sta ty sty c z n y c h , po d ru g ie zaś — od w ła śc i­ w e j k la s y fik a c ji z e b ra n y c h d an y c h . In fo rm a c je s ta ty s ty c z n e n ie z b ę d n e w b a d a n iu czerp ie s ta ty s ty k z ogólnie d o stęp n ej spraw ozd aw czości i ew i­ d e n c ji g ospodarczej. Z re g u ły — poza szczególnego ty p u b a d a n ia m i a n ­ k ie to w y m i — n ie m a on w p ły w u n a ich jakość. D lateg o też ty m w ię k ­ szej w a g i n a b ie ra p ro b le m w łaściw ego p o rz ąd k o w an ia i k la s y fik a c ji m a ­ te r ia łu sta ty sty c z n e g o .

K la sy fik a c ja — w n a jb a rd z ie j ogóln ym u ję c iu — je s t d ziałe m m e to ­ dologii ogólnej sta n o w ią c e j jed n o z p o d staw o w y ch n a rz ę d z i b a d a n ia rz e ­ czy w isto ści.1 T e rm in k la sy fik a c ja odnosi się tak że do sam ej czynności p o d ziału e le m e n tó w zb io ru n a p o d zb io ry (człony k la s y fik a c ji) o raz do końcow ego w y n ik u te j czynności, tj. do o trz y m a n y c h z p o d ziału zb io ru podzbiorów . W u ję c iu teo rio m n o g o ścio w y m k la sy fik a c ja sta n o w i n ie p u s tą ro d z in ę po dzb io ró w Si (i = 1, 2, ..., k) p ew n ego zb io ru , s p e łn ia ją c ą d w a w a ru n k i: rozłączn ości ( S i ^ S j = 0 , i ^ j , i, j = 1, 2 ,..., k) oraz

(3)

i 6 0 M. Sob czyk k

p ełn o ści ( U = Q). J a k o sy n o n im ó w te rm in u k la s y fik a c ja u ży w a się

i= l

ró w n ie ż ta k ic h o k re śle ń , ja k p o rz ąd k o w an ie , d y s k ry m in a c ja , d e lim ita c ja , ta k so n o m ia .2 W p rz y p a d k u w y k o rz y s ty w a n ia w p ro c e d u rz e k la s y fik a c ji m e to d ilościow ych u ż y w a się często te rm in ó w : ta k so n o m ia n u m e ry c z n a , ta k so n o m e tria , ta k s o m e tria .

W p ra c a c h c y b e rn e ty c z n y c h z a m ia st p ow y ższy ch te rm in ó w zw y k le u ż y w a się o k re śle ń : te o ria ro z p o z n a w a n ia ob razó w bąd ź też te o ria u k ła ­ dów ro z p o zn ając y ch , u czący c h się. T e o ria ro z p o z n a w a n ia o brazó w w y ­ k o rz y s ty w a n a je s t p rz y p o rz ą d k o w a n iu d u ży c h zbiorów in fo rm a c ji s ta ­ ty s ty c z n y c h bąd ź też p rz y w y o d rę b n ia n iu p e w n y c h podzbiorów .

O b ra z e m n a z y w a m y z b ió r re a ln ie lu b p o te n c ja ln ie is tn ie ją c y c h o b ie k ­ tów n a le ż ą c y c h do te j sa m e j k la s y p o d o b ień stw a, c h a ra k te ry z u ją c y c h się p e w n y m i w sp ó ln y m i w ła sn o śc ia m i (cecham i). O b ra zem je s t n p . zb ió r cech c h a ra k te r y z u ją c y c h ró w n o w a g ę ry n k o w ą , czy też zb ió r osób, k tó re n a b y ły sam o ch ó d w p e w n y m ok resie, czy też z b ió r p rz e d s ię b io rs tw w y ­ k o n u ją c y c h p la n y .

E le m e n ty sk ład o w e o b ra z u są o b iek tam i. P ro c e s p rz y p o rz ą d k o w a n ia n o w y ch , d o ty ch cz as nie ro z p a try w a n y c h o b iek tó w do d a n e j k la s y po d o ­ b ie ń stw a (obrazu) n a z y w a m y ro z p o zn aw a n iem obrazów . P rz y p o rz ą d k o w a ­ n ie o b iek tó w do poszczeg ó ln y ch o b ra zó w o d b y w a się w d ro d ze p o ró w n y ­ w a n ia w łaściw o ści k la sy fik o w a n e g o o b ie k tu z w łaśc iw o ściam i o b iek tó w n a le ż ą c y c h do p e w n e j, u sta lo n e j ju ż k la s y (obrazu). Z b ió r w sz y s tk ic h o b iek tó w b ę d ą c y c h p rz e d m io te m k la s y fik a c ji n a z y w a m y p rz e s trz e n ią p rób. N a to m ia st z b ió r w sz y s tk ic h o b razó w (k las p o d o b ień stw a) o p isa ­ n y c h n a d a n e j p rz e s trz e n i p ró b o k re ś la m y m ia n e m a lfa b e tu k la s (o b ra ­ zów).

W y jścio w y m p u n k te m k la s y fik a c ji je s t o k re śle n ie je j p rz e d m io tu i p rz e s trz e n i. P rz e d m io te m k la s y fik a c ji je s t zbiór o b iek tó w , k tó ry m i m ogą być je d n o s tk i p rz e s trz e n n e (np. w o jew ó d ztw a, gm iny ), p rz e d s ię ­ b io rs tw a p rz em y sło w e, h a n d lo w e itp . O g óln ie m o żn a stw ierd z ić , że p rz e d ­ m io te m k la s y fik a c ji je s t zb ió r in d y w id u ó w (obiektów ) d ow olnego ro d z a ­ ju. Z b ió r te n ozn aczam y , sy m b o lem Q, a e le m e n ty tego zb io ru — s y m ­ b olem coj. T ak w ięc coi £ Q, i = 1, 2, ..., k, gdzie k o znacza liczbę o biek tó w p o d le g a ją c y c h b a d a n iu . W zależności od p rz e d m io tu k la s y fik a c ji m ożn a w y ró ż n ić k la s y fik a c ję p rz e p ro w a d z o n ą d ro g ą p o d ziału logicznego oraz p rzez g r u p o w a n ie .3

2 Por. m. in. W. B u k i e t y ń s k i, Z. H e 11 w i g, K. K r ó l i k , A. S m o- 1 u k: U w a g i o d y s k r y m i n a c j i z b i o r ó w sko ń c z o n y c h . P race N au k ow e W SE W rocław , 1969 n r 21; B. K o p o c i ń s k i: D y s k r y m i n a c j a za p o m o c ą d e n d r y t ó w . „ Z astosow a­ nia M a tem a ty k i” 1960, nr 3.

3 Z. C h o j n i c k i , T. C z y ż : M e t o d y ta k s o n o m i i n u m e r y c z n e j w reg io n a ­ lizacji geog ra ficzn ej. W arszaw a >1973, s. 8.

(4)

W ielow ym iarow a analiza statystyczn a 161

K la sy fik a c ja p rzez podział logiczny (zw ana też k la s y fik a c ją d e d u k ­ c y jn ą lu b „od g ó ry ”) d o k o n y w a n a je s t w o p arciu o p ew n e k r y te r iu m za­ p e w n ia ją c e p o p ra w n y pod ział logiczny, tj. re a liz u ją c e w a ru n k i rozłączn o - ści i zupełno ści. K ry te riu m to je s t d efin io w a n e z góry. N a jp ro s ts z y m p rz y k ła d e m ta k ie j k la sy fik a c ji je s t p odział d y ch o to m iczn y (dw ud zieln y). W y jścio w y zb iór o b iek tó w Q d zielo n y je s t tu n a d w a p o d zb io ry (człony k lasy fik ac ji): je d e n z n ic h o b e jm u je o b ie k ty p o siad ają ce p e w n ą cechę, d ru g i n a to m ia s t — o b ie k ty n ie p o siad ają ce jej.

K la s y fik a c ja p rz ez g ru p o w a n ie (zw ana k la s y fik a c ją in d u k c y jn ą lu b „od d o łu ” ) o d b y w a się w d rodze g ru p o w a n ia o b iek tó w tw o rz ą c y c h zb ió r Q n a p o d staw ie ich p odob ień stw a. P ro c e d u ra g ru p o w a n ia w y m a g a tu u s ta le n ia k ry te rió w d o d aw an ia elem e n tó w zb io ru £2. W te n sposób np. {xi} ^ { x 2} = S i, a {x3} {x4} ^ { x 5} = S 2. W y n ik a s tą d w n io ­ sek, że w k la sy fik a c ji p rzez g ru p o w a n ie zachodzi konieczność e n u m e ra c ji zb io ru Q, podczas gd y w podziale logiczny m je s t on d efin io w a n y . F a k t te n w p rz y p a d k u p o d ziału logicznego m oże pro w ad zić do o trz y m y w a n ia k la s (podzbiorów ) p u sty c h , co n ie je s t m ożliw e w p ro c e d u rz e g ru p o w a ­ nia. D odać p rz y ty m n ależy, że w ra m a c h podzb iorów (członów k la s y ­ fik ac ji) u z y s k a n y c h w p ie rw sz y m etap ie, m ożn a d o k o ny w ać d alszej k la ­ sy fik a c ji, co p ro w a d zi do k la sy fik a c ji w ielo sto p n io w ej. W y n ik k la s y fi­ k a c ji w ielo sto p n io w ej o trz y m a n y w d rodze p o d ziału logicznego zależy n ie ty lk o od w y b ra n y c h cech sta n o w ią c y c h k r y te r iu m k la sy fik a c ji, ale ró w n ie ż od k olejn o ści, w ja k ie j cechy te sta n o w ią p o d staw ę podziału. S tą d też is to tn a je s t tu znajo m ość s tr u k t u r y zb io ru będącego p rz e d m io ­ te m k la sy fik a c ji. W k la s y fik a c ji p rzez g ru p o w a n ie n ie m a p o trz e b y u s ta ­ la n ia h ie ra rc h ic z n e g o p o rz ą d k u cech.

P rz e s tr z e ń k la sy fik a c ji w y zn aczo n a je s t p rzez zb ió r w łasn o ści (cech) o p isu ją c y c h e le m e n ty zb io ru £2 p o d leg ają ce k la sy fik a c ji. E le m e n ty p rz e ­ s trz e n i k la sy fik a c ji (cechy) p o w in n y być ta k d o b ra n e, b y sp e łn ia ły o k re ­ ślo n e w y m o g i n a tu r y zarów no fo rm a ln e j, ja k i m e ry to ry c z n e j. N ie je st p rz y ty m m o żliw e w sk az an ie je d n e j g e n e ra ln e j re c e p ty n a w ła śc iw y do­ b ó r cech, gdyż zależy to od c h a ra k te ru , p rz e d m io tu i celu k o n k re tn e g o b a d a n ia . N iem n iej je d n a k p rz y jm u je się, że zb ió r cech je s t w y soce d ia ­ g n o sty czn y , jeże li jego poszczególne e le m e n ty s p e łn ia ją n a s tę p u ją c e w a ­ ru n k i: 4

1) u jm u ją n a jb a rd z ie j is to tn e w łaściw ości a n a liz o w an y ch zjaw isk , 2) są p ro ste , jasn o sp re cy zo w a n e i logicznie ze sobą pow iązan e, 3) są b ez p o śred n io lu b pośred n io m ie rz a ln e o raz d ad z ą się w y ra z ić za pom ocą w ielk o ści sto su n k o w y c h lu b a b so lu tn y ch ,

4 J. F i e r i c h: Próba za s to s o w a n ia m e t o d ta k s o n o m ic zn y c h do re j o n iz a c j i s y ­ s t e m ó w r o ln ic zy c h w woj. k r a k o w s k i m . „M yśl G ospodarcza” 1957, mr 1.

(5)

162 M. Sob czyk

4) c h a r a k te r y z u ją się w y so k ą zm ien n o ścią w p rz e k ro ju k la sy fik o ­ w a n y c h o b iek tó w ,

5) są n ie sk o re lo w a n e , ale jed n o cz eśn ie w y k a z u ją d u żą zależność z ce­ ch a m i n ie u w z g lę d n io n y m i b ez p o śred n io w p ro c e d u rz e k la sy fik a c ji.

O b ie k ty , b ęd ą ce e le m e n ta m i sk ła d o w y m i zb io ru Q, c h a ra k te ry z o w a n e są z w y k le p rz e z w ię k sz ą liczb ę cech. S tą d też k a ż d y o b ie k t coi e Q m oże być ro z u m ia n y ja k o w e k to r:

coi = (xilł x i2, ... , x in) (1)

gdzie Xjj oznacza j - t ą sk ład o w ą teg o w e k to ra , czyli w a rto ść j- te j cech y p o sia d a n ą p rz e z o b ie k t Wj. W in te r p r e ta c ji g e o m e try c z n e j poszczególne o b ie k ty są p u n k ta m i w p rz e s trz e n i n -w y m ia ro w e j (stąd n a z w a w ie lo w y ­ m ia ro w a a n a liz a sta ty sty c z n a ). P u n k ty te n a le ż y rozdzielić n a p e w n ą (u sta lo n ą z g ó ry lu b też nie) ilość ro z łą c z n y c h i w y c z e rp u ją c y c h sk u p isk h o m o g en icz n y ch w sobie i h e te ro g e n ic z n y c h p om ięd zy sobą. O znacza to, że poszczególne s k u p isk a (k lasy , człon y k la s y fik a c ji) p o w in n y za w ierać p u n k ty położone b lisk o sieb ie w sen sie u s ta lo n e j a p rio ri m e try k i o d le­ głości, a ró w n o c ześn ie zn aczn ie o d d alo n e od p u n k tó w n a le ż ą c y c h do p o ­ z o sta ły c h sk u p isk .

Z b ió r d a n y c h w y jśc io w y c h sta n o w ią c y c h p o d sta w ę k la s y fik a c ji tw o ­ rz y m a c ie rz o b s e rw a c ji o postaci:

x n X i2 •• x ln X = x 2i x 22 •.. X 2n x ki x k2 •• X kn

gdzie: k — liczb a o b iek tó w , n — liczb a cech,

Xjj — w a rto ś ć j- te j cech y w i-ty m obiekcie.

W m a c ie rz y (2) d la każd eg o o b ie k tu p rz e z n a c z o n y je s t je d e n w iersz a d la k aż d ej ce ch y — je d n a k o lu m n a .

C ech y o p isu ją ró ż n e w łaściw o ści b a d a n y c h o b iek tó w i w y ra ż a n e są w ró ż n y c h m ia ra c h . S tą d też n ie n a le ż y w d alszy c h o b liczen iach p o słu ­ g iw ać się b ez w z g lę d n y m i w a rto ś c ia m i cech, lecz ich m ia ra m i r e la ty w n y ­ mi. P rz e k s z ta łc e n ia rz e c z y w isty c h wTarto śc i cech w w ielk o ści re la ty w n e d o k o n u je się w d ro d z e ich s ta n d a ry z a c ji (n o rm a liz acji). N o rm a liz acji cech n a jcz ęście j d o k o n u je się n a s tę p u ją c o :

(3)

(6)

W ielow ym iarow a analiza statystyczn a 16 3

(5)

(6)

gdzie: i — o b ie k t b ad an ia; i = 1, 2, k, j — cecha; j = 1, 2, n,

Xij — rz ecz y w ista w a rto ść j-te j cechy d la i-teg o o b iek tu , x ’jj — s ta n d a ry z o w a n a w a rto ść j-te j cechy d la i-teg o o b iek tu ,

Xj — ś re d n ia w a rto ść j- te j cechy,

Sj — o d c h y le n ia s ta n d a rd o w e j-te j cechy.

K ażd a s ta n d a ry z a c ja zm n iejsza w a ria n c ję cech, a ty m sam y m zn ie­ k sz ta łc a w y n ik i b ad ań . J e d n a k ż e w w ielo w y m iaro w ej an a liz ie s ta ty s ty c z ­ n e j s ta n d a ry z a c ja je s t zab iegiem konieczny m .

W p ro b lem ie k la sy fik a c ji, oprócz o k re śle n ia p rz e d m io tu i p rz e strz e n i, n ie z b ę d n y je s t w y b ó r odpow iedniego k ry te r iu m k la sy fik a c ji. K r y te r ia k la s y fik a c ji są fu n k c ja m i p o d o b ień stw a p rz y p o rz ą d k o w u ją c y m i k aż d ej p a rz e e le m e n tó w ooi, tOj 6 Q m ia rę ich w z ajem n eg o p o d o b ień stw a (niepo­ d o b ień stw a). M iaram i ty m i są n ajczęściej odległości lu b w sp ó łcz y n n ik i p o d o b ień stw a. W y b ó r fu n k c ji p o d o b ień stw a u z a le żn io n y je s t p rz e d e w sz y stk im od c h a ra k te r u cech u w z g lę d n io n y c h w b ad a n iu . I ta k w od­ n ie sie n iu do zm ie n n y c h (cech) ciąg ły ch z re g u ły s to su je się od po w ied nio o k re ślo n e odległości. N a to m ia st w p rz y p a d k u zm ien n y c h b in a rn y c h sto ­ s u je się g łów nie w sp ó łcz y n n ik i p o d o bieństw a.

W b a d a n ia c h e m p iry c z n y c h n ajcz ęście j w y k o rz y s ty w a n e są o dleg ło ­ ści E u k lid esa. Z b ió r o b iek tó w Q tra k to w a n y je s t ja k o p rz e s trz e ń m e ­ try c z n a , co u m o żliw ia k aż d ej p a rz e jego elem e n tó w coi, (Oj p rz y p o rz ą d k o ­ w ać d o k ła d n ie je d n ą n ie u je m n ą liczbę rz ecz y w istą d(coi, (Oj) s p e łn ia ją c ą n a s tę p u ją c e ak sjo m a ty :

1) a k s jo m a t tożsam ości (dij = 0 w te d y i ty lk o w te d y gdy i = j), 2) a k sjo m a t s y m e trii (djj = dji),

3) a k sjo m a t tr ó jk ą ta (dłs+ d si ^ d ie)

O d w zo ro w an ie d o k re ślo n e n a zbiorze w sz y stk ic h p a r ele m e n tó w p rz e s trz e n i Q n a z y w a m y m e try k ę p rz e s trz e n i m e try c z n e j fi. E le m e n ty te j p rz e s trz e n i n a z y w a m y p u n k ta m i, a w a rto ść o d w zo ro w an ia d(tOi, Wj), czyli w a rto ść m e try k i, n a z y w a m y odległością p u n k tu toi od p u n k tu coj.

O dległości eu k lid eso w e n ajcz ęście j obliczane są jako: 1) p rz e c ię tn e b ez w zg lęd n y c h różn ic w a rto śc i cech:

(7)

1 6 4 M. Sob czyk

gdzie: d rs — odległość m ię d z y o b ie k te m r - ty m o raz s -ty m d la r ^ s = = 1, 2, k

x ’rj — s ta n d a ry z o w a n a w a rto ść j-te j cechy w r- ty m obiekcie

(j = 1, 2 n)

x ’Sj — sta n d a ry z o w a n a w a rto ść j- te j cech y w s -ty m obiekcie,

n — liczb a u w z g lę d n io n y c h cech,

2) jak o p ie rw ia s te k z p rz e c ię tn e j k w a d ra tó w różn ic w a rto śc i z m ie n ­ n y c h (cech):

(8)

3) jak o su m ę b ez w zg lęd n y c h ró ż n ic w a rto ś c i zm ien n y ch :

(9

4) jak o p ie rw ia s te k z s u m y k w a d ra tó w ró żn ic w a rto śc i zm ien n y ch :

(

10

)

d u d i2 . . dik

D = d2i d22 • • d 2k dki d n2 ... dkk

P o o b liczen iu odległości każd ego o b ie k tu od w sz y s tk ic h p o zo stały ch w d a n y m zbiorze Q o trz y m u je m y m a c ie rz od leg łości o postaci:

( 11)

O dległości z a w a rte w m a c ie rz y D z o sta ły o k re ślo n e w p rz e strz e n i, k tó re j w y m ia ry w y z n acz a liczb a u w z g lę d n io n y c h z m ie n n y c h (cech). M a­ cierz D sta n o w i p o d sta w ę d a lsz y c h o p e ra c ji s ta ty s ty c z n y c h z m ierzając y ch do u z y s k a n ia je d n o ro d n y c h p o d zbiorów (w y n ik k lasy fik ac ji).

Z w rócić n a le ż y u w a g ę n a fa k t, że p rz e d m io te m p ro c e d u ry k la s y fik a ­ c y jn e j m ogą b yć za ró w n o o b ie k ty , ja k i cechy. W p ie rw sz y m p rz y p a d ­ k u odległości obliczan e są m ięd zy p u n k ta m i id e n ty fik o w a n y m i p rz ez w iersze w y jśc io w e j m a c ie rz y o b se rw a c ji (zw ykle z e sta n d a ry z o w a n e j), w d ru g im zaś — p o m ięd zy p u n k ta m i, k tó ry m o d p o w ia d a ją k o le jn e k o ­ lu m n y te j m a c ie rz y J e ś li od leg ło ści ob liczan e są p o m ięd zy o b iek tam i, to m a c ie rz D m a w y m ia ry k X k , g d y zaś m ięd zy ce ch am i — n X n . P r z y o b licza n iu odleg łości m ięd zy ce ch am i (k o lu m n y ) s to s u je się te sam e o p e­ ra cje, co p rz y o d leg ło ściach m ięd zy o b ie k ta m i (w iersze m acie rzy ), z ty m ,

(8)

W ielow ym iarow a analiza statystyczna

165

że z m ie n ia ją się g ra n ic e su m o w an ia. W ta k im p rz y p a d k u np. w z ó r (8) p rz y jm u je postać:

O bliczanie odległości p o m ięd zy p a ra m i zb io ru Q za pom ocą w zorów (7)— (10) o p iera ło się n a założen iu, że k aż d a ze z m ien n y c h (cech) o k re ­ ś la ją c a je d e n z w y m ia ró w p rz e strz e n i k la sy fik a c ji po siad a id e n ty c z n ą w agę. W y d a je się, że n a le ż a ło b y uw zg lęd n ić w ob liczan iu odległości m o ż­ liw ość w a ż e n ia o b serw acji. P ro b le m u sta le n ia w łaściw ej fu n k c ji w ago w ej je s t dość sk o m p lik o w a n y i w znaczn ej m ierz e p o w in ien o p ierać się n a p rz e sła n k a c h h e u ry s ty c z n y c h .5

P rz y k o n s tru k c ji fu n k c ji p o d o b ień stw a w o p arciu o w sp ó łcz y n n ik i p o d o b ie ń stw a w y k o rz y s tu je się ra c h u n e k k o re la c y jn y . Z ależności is tn ie ­ ją c e m ięd zy zm ien n y m i c h a ra k te r y z u ją w sp ó łcz y n n ik i k o re la c ji, tw o rz ą m acie rz R o postaci:

gdzie: Z — m acie rz z n o rm a liz o w an y c h w a rto ści cech o w y m ia rz e n X m ,

ZT — m acie rz tra n sp o n o w a n a w s to s u n k u do m a c ie rz y Z o w y ­ m ia ra c h m X n ,

n — liczba o bserw acji.

M acierz k o re la c ji R sp ełn ia ta k ą sam ą rolę, ja k m acie rz odległości D. J a k o m ia rę p o d o b ień stw a w y k o rz y s tu je się rów nież w sp ó łcz y n n ik k o ­ re la c ji w u ję c iu w e k to ro w y m . W ta k im p rz y p a d k u m ia rę p o d o b ień stw a dw ó ch o b iek tó w je s t sto p ień zbieżności p rz eb ieg u w e k to ró w (w sp ółczy

n-5 P ew n e u w a g i dotyczące tego zagadnienia znaleźć m ożna w pracach: J. L i c z ­ k o w s k i : B adanie in t e n s y w n o ś c i r o l n ic t w a w uję ciu p r z e s t r z e n n y m , „P ostępy N au k R oln iczych ” 1961, nr 6; J. M i k i e w i c z : Z agadnie nie w y b o r u cech p r z y u ż y c i u m e t o d ta k s o n o m i i w r o c ła w s k i e j. R eferat na k onfei'encję n aukow ą P olskiego T ow arzystw a B iom etryczn ego, W rocław 1967,

(

12

)

(9)

166 M. Sobczyk

n ik k o re la c ji), czyli cosinus k ą ta p o m ięd zy w e k to ra m i. W sp ó łczy n n ik te n je s t o k re ślo n y n a stę p u ją c o : 6 p rz y czym : (14) (15)

w,w,

cos WlWl = I

W.

I I

w,

I

n W, W, = ] Г х „ - х „ j = l

lw>l

W=\/±*±4

j = i j = i gdzie: Wj W i — iloczyn i-teg o i 1-tego w e k to ra ,

IWil |Wil — iloczyn s k a la r n y i-teg o i 1-tego w e k to ra , x ij — w a rto ś ć j- te j zm ien n e j d la i-te g o o b iek tu , x y — w a rto ś ć j-te j z m ie n n e j d la 1-tego o b iek tu . D la d a n y c h b in a rn y c h w sp ó łc z y n n ik i p o d o b ie ń stw a oblicza się z tzw . d w ó jk o w e j ta b lic y p o d o b ie ń stw a b a d a n y c h ob iek tó w , k tó ra m a postać:

O biekt i-ty

O biekt 1-ty

a b a r b

c d c-| d

a + c b-F d a + b - f c - f d

gdzie: a — liczb a cech w y s tę p u ją c y c h ró w n o cześn ie w i-ty m i 1-tym obiekcie,

b — liczb a cech w y s tę p u ją c y c h w o b iek cie i-ty m a n ie w y s tę ­ p u ją c y c h w o b iek cie 1-tym ,

c — liczba cech w y s tę p u ją c y c h w obiekcie j- ty m a n ie w y ­ s tę p u ją c y c h w o b iek cie 1-tym ,

d -— liczba cech n ie w y s tę p u ją c y c h w o biekcie i-ty m i 1-tym . W sp ó łcz y n n ik i p o d o b ie ń stw a z d w ó jk o w e j ta b lic y p o d o b ień stw a o b li­ czane są ja k o k o m b in a c je e le m e n tó w te j tab licy . P rz y k ła d o w o m ożn a je obliczyć n a s tę p u ją c o :

W r a-f d

a d + b c

(

16

)

• J. J. P a r y s e k , L. W o j t a s i e w i c z: M e t o d y a nalizy region aln ej i m e ­ t o d y p l a n o w a n i a regionaln ego. P A N , K PZ K , S tu d ia tom L X IX , W arszaw a 1979, s. 69.

(10)

W ielow ym iarow a analiza statystyczn a 167

ad

W = (17)

V (a + c ) (a-bb) (b + d ) (c + d )

N ależy zw rócić u w ag ę n a fa k t, że in te r p r e ta c ja odległości i w sp ó ł­ cz y n n ik ó w p o d o b ień stw a je st o d m ienna. R osnąca w a rto ść odległości w sk a z u je n a b ra k p o d o b ień stw a obiektów , k tó ry c h ta odległość dotyczy. N a to m ia st w z ro st w sp ó łcz y n n ik a p o d o b ień stw a św iad czy o p o d o b ień stw ie b a d a n y c h o biektów .

W k a ż d y m za d a n iu k la s y fik a c ji m ożna w yró żn ić n a s tę p u ją c e e le m e n ­ ty składo w e:

1) u s ta le n ie zb io ru k la s (a lfa b e tu klas, obrazów ) S. Je ś li zb ió r te n je s t skończony, to jego e le m e n ta m i są Sj (i = 1, 2 ,..., M);

2) d o k o n an ie w y b o ru w łasności obiektów , czyli cech c h a ra k te r y z u ją ­ c y ch p o jed y n cz ą re a liz a c ję o b ra zu (realizac ja o b ra zu — to k a ż d y o b iek t z b io ru re p re z e n tu ją c y d a n y obraz). O znaczm y zbiór ty c h cech p rzez X, a jego e le m e n ty p rzez Xj (j = 1, 2 ,..., n);

3) p rz y ję c ie o k reślo n eg o k ry te r iu m k la sy fik a c y jn e g o , czyli zasady, w e d łu g k tó re j n a le ż y p od ejm o w ać decyzje, do jak ieg o o b ra zu zaliczyć ro z p o z n a w a n y obiekt. O znaczm y tę zasadę d e c y z y jn ą p rzez D, a zbiór w a rto śc i fu n k c ji d e c y z y jn e j, p rz y k tó ry c h d a n y o b iek t n a le ż y zaliczyć do i-teg o o b ra zu p rz ez D^;

4) u s ta le n ie w ielk o ści s tr a t sp o w odow an ych b łęd am i k la sy fik a c ji, czyli u s ta le n ie e fe k ty w n o śc i k la sy fik a c ji (ściślej: u sta le n ie sp osobu po­ m ia ru s t r a t o raz o k re śle n ie ich poziom u). O znaczm y w ielk ość ty c h s tr a t sy m b o lem E.

W zależności od w stę p n y c h in fo rm a c ji o S, X, D i E (lub p rz y ję ty c h zało żeń o ty c h zb io ra ch i w ielkościach) m ożn a w y ró ż n ić c z te ry e le m e n ­ ta r n e za d a n ia k la sy fik a c ji.

P ie rw s z y m za d an iem je s t w y b ó r k ry te r iu m k la sy fik a c ji p o z w a la ją c e ­ go podzielić e le m e n ty zbioru Q sc h a ra k te ry z o w a n e p rz y pom ocy zbioru cech X p o m ięd zy k la s y Si (zad an e z góry), ponosząc p rz y ty m s tr a ty n ie w ięk sze od E. Z ad a n ie to m ożna w skrócie zapisać n astęp u ją co :

[D /S , X, E]

g dzie sy m b o l w y s tę p u ją c y p rz e d k re s k ą oznacza n ie o k re ślo n y człon za­ d an ia, podczas g d y pozostałe e le m e n ty sk ład o w e (po k resce) są znan e

e x ante. Z ad a n ie tego ty p u m oże rów nież polegać n a p o rz ą d k o w a n iu

now o p o jaw iają ceg o się o b iek tu (nie będącego e le m e n te m w y jściow eg o zb io ru Q) do odp o w ied n iej k la sy Sj. W ta k im p rz y p a d k u m ó w im y o za­ d a n iu k la sy fik a c ji z n au c zy ciele m (lub u czen iem z n ag rad za n ie m ). N azw a „ k la s y fik a c ja z n au c zy ciele m w y w o d zi się stąd , że te o ria ro z p o zn aw a n ia

(11)

1 6 8 M. Sob czyk

o b ra zó w z a jm u je się d z ia ła n ie m dw ó ch u k ład ó w : człow ieka (nau czyciela) i m a sz y n y (ucznia) 7. U czenie z n a u c z y c ie le m p o leg a n a ta k im w sp ó łd zia­ ła n iu ty c h u k ła d ó w , że n a u c z y c ie l d e m o n s tru je u czn io w i o b iek ty , a te n p rz y d z ie la je do o d p o w ied n ich k las. Do ro z w ią z y w a n ia z a d ań ty p u pierw szeg o w y k o rz y s tu je się m e to d y k la sy c z n e j a n a liz y d y s k ry m in a c y j­ n e j, gdy ż z a g a d n ie n ie to m o żn a sfo rm u ło w a ć n a stę p u ją c o : d an e są w ielo ­ w y m ia ro w a z m ie n n a losow a X , z m ie n n a losow a Y re a liz u ją c a w a rto śc i ró w n e n u m e ro m p o szczeg ó ln y ch k las, zn a n e są ro z k ła d y w a ru n k o w e ty p u F (x /y j) i = 1, 2 ,..., M, ro z k ła d zm ien n e j Y o ra z m a c ie rz sto p n ia s tr a t s to p n ia M. W ty c h w a ru n k a c h n a le ż y podać re g u łę d e c y z y jn ą m in im a li­ z u ją c ą np . p rz e c ię tn e s tr a ty b łę d n e j k la s y fik a c ji (s tra ty p rz y b ez b łę d n ej k la s y fik a c ji w y n o szą zero).

D ru g i ty p z a d a n ia m o ż n a o k re ślić m ia n e m re d u k c ji w y m ia ró w p rz e ­ s trz e n i lu b m in im a liz a c ji opisu. R o zw iązan iem z a d a n ia je s t w sk a z a n ie t a ­ kiego p o d zb io ru X (zbiór cech), k tó ry pozw oli p rz y p o rz ą d k o w a ć e le m e n ty sk ład o w e zb io ru Q (o b iek ty ) do k la s (obrazów ) Si p rz y po m ocy k r y t e ­ riu m D z m in im a ln y m i s tr a ta m i E, czyli:

[X /S , D, E]

Z a d a n ie tego ty p u n a le ż y ro zw iązać w te n sposób, b y s tr a ty sp ow o ­ d o w a n e zm ian ą ilości in fo rm a c ji (re d u k c ją liczb y cech) b y ły ja k n a jm n ie j­ sze w sen sie fu n k c ji E. J a k łatw o zau w aż y ć teg o ty p u za g ad n ien ie je s t id e n ty c z n e z p ro b le m e m d o b o ru z m ie n n y c h o b ja ś n ia ją c y c h do m o d eli e k o n o m e try c z n y c h .8

T rz eci ty p z a d a n ia k la s y fik a c ji m o żn a zapisać n a stę p u ją c o : [S /X , D, E]

W z a d a n iu ty m chodzi w ięc o p o d ział e le m e n tó w z b io ru Q o p isan y ch p rz y p o m ocy z b io ru w łasn o śc i (cech) X n a k la s y Si p o s łu g u ją c się p rz y ty m k r y te r iu m d e c y z y jn y m D p rz y za ch o w a n iu e fe k ty w n o śc i k la s y fi­ k a c ji n a poziom ie E. Z a d a n ia tego ty p u o k re ś la n e są m ia n e m tak so n o m ii, a u to m a ty c z n e j k la s y fik a c ji, g ru p o w a n ia (c lu s te r an aly sis), sam o u czen iem (u czen iem bez n au c zy ciela ).

N a le ży zw ró cić u w a g ę n a fo rm a ln e p o d o b ień stw o z a d a ń ty p u d ru g ie ­ go i trze cieg o . W o bu ty p a c h z a d a ń n a le ż y b o w iem d ok on ać o k reślo n eg o

7 B. B. R o z i n: Teoria r o z p o z n a w a n i a o b r a z ó w w badan iach eko n o m ic zn y c h . W arszaw a 1979, s. 11.

8 D la m odeli ek on om etryczn ych z d ysk retn ą zm ien n ą objaśniającą analogia jest zupełna, n atom iast w p rzypadku m odeli ze zm ien n ym i ciągłym i n a leży założyć, żę zoiór a lfa b etu k las je s t m ocy con tin u u m .

(12)

W ielow ym iarow a analiza statystyczn a 169

g ru p o w a n ia (re d u k c ji p rz estrze n i). Je d n a k ż e w za d an iu ty p u d ru g ieg o r e ­ d u k c ja o d b y w a się w p rz e strz e n i cech, n a to m ia s t w za d an iu ty p u tr z e ­ ciego — w p rz e strz e n i obiektów .

C z w a rty ty p za d a n ia m ożna o k reślić m ia n e m o p ty m alizacji. W z a d a ­ n iu ty m n a le ż y o k reślić poziom s tr a t E ponoszonych w tra k c ie p ro cesu k la s y fik a c ji elem e n tó w zb io ru Q o w łasn o ściach X po m ięd zy k la s y Sj w o p arciu o k ry te r iu m D, czyli:

[E /S , X, D]

D odać n alep y , że za d a n ia tego ty p u sta n o w ią zazw yczaj u z u p e łn ie n ie p o p rz e d n ic h ty p ó w , a n ie sta n o w ią o d ręb n eg o zad ania. I ta k jeśli np. w p ro b le m ie k la sy fik a c ji poziom s tr a t d o ty czy b łęd neg o z a k la sy fik o w a ­ n ia p o jed y n cz ej re a liz a c ji (s tra ty jed n o stk o w e), to ro z w iązu jąc zad an ie ty p u czw arte g o (ju ż po zak o ń czen iu k la sy fik a c ji) je ste śm y w s ta n ie p o ­ dać poziom s tr a t p rz eciętn y c h .

P o w y ższe c z te ry z a d an ia k la sy fik a c y jn e zo stały o k re ślo n e m ia n e m z a d a ń e le m e n ta rn y c h (prostych ). W p ra k ty c e b a d a ń s ta ty s ty c z n y c h n ie zaw sze d y sp o n u je m y , ta k du żą ilością in fo rm a c ji w y jścio w y c h (trz y sp o­ śró d c z te re c h członów m uszą b yć znane a priori). D latego też zachodzi konieczność ro z w ią z y w a n ia tzw . za d ań k o m b in o w an y ch . W tego ty p u z a d a n ia c h m ogą być z n a n e dw ie (lub n a w e t jed n a) sk ład o w e p ro c e d u r k la sy fik a c y jn y c h . P rz y k ła d o w o m ożn a w y m ien ić ta k ie za d an ia, jak : [X, D /S , E], [S, X /D ,E ] , [E/S, X, D] itp. Mogą rów nież w y stą p ić sy tu a c je , w k tó ry c h żad en e le m e n t p ro c e d u ry k la sy fik a c y jn e j n ie ..jest z n a n y e x

ante. M ó w im y w ów czas o za d an iach złożonych. Z asadnicze znaczenie po ­

s ia d a ją je d n a k z a d an ia e le m e n ta rn e , gdyż zaró w n o k o m b in o w an e, ja k i złożone m o żna sp ro w a d zić do z a d a ń p ro sty ch . P rz y k ła d o w o zad an ie k o m b in o w an e w p o staci [S, D /X , E] m ożna rozw iązać ro z p a tru ją c szereg z a d a ń e le m e n ta rn y c h [S /X , D, E] z a k ła d a ją c różn e m o żliw e k ry te r ia k la sy fik a c y jn e . N a le ży się je d n a k w te d y liczyć ze zn aczn y m w z ro ste m praco ch ło n n o ści, n a w e t p rz y zasto so w an iu m aszy n cy frow ych .

Р Е З Ю М Е В статье приводится общ ая характеристика исследовательск их проблем охваты ваем ы х термином „многоизмерительны й статистический ан ал и з”. В ч аст­ ности, дано оп р едел ен и е термина „к лассиф икаци я”, виды класси ф и к ац и й и способы построения ф ун к ц и й сходства, позволяю щ их зачислять отдельны е объ екты к определенны м гомогенным классам. В конечной части статьи о п р ед е­ лены четы ре основны е (элементарны е) задачи классиф икации.

(13)

S U M M A R Y

17 0 M. Sobczyk

In the a rticle an an a ly sis w a s carried out as to th e ch aracterization of research problem s in clu d ed in so -c a lle d m u lti-d im en sio n a l sta tistica l a n a ly sis (WAS). In p a r­

ticular, a d e fin itio n of the term ’’c la s sific a tio n ” w a s provided, there w ere also g i­ v en the typ es of cla ssifica tio n s and the m ethods of con stru ctin g the fun ction s of sim ila rity w h ich m ak e it p ossib le to group d efin ite objects under hom ogeneous cla sses. The la st part of th e a rticle sp ecified the four fu n d am en tal (elem entary) task s of cla ssifica tio n s.

Cytaty

Powiązane dokumenty

Na podstawie dokumentacji chorych z zespołem otępiennym oraz obserwacji ich zachowań, zarejestrowano 87 problemów pielęgnacyjnych dotyczących sfery

Wczesne wykrycie objawów mogących świadczyć o poważnych patologiach pooperacyjnych jest ważnym zadaniem personelu pielęgniarskiego.. Doświadczona i

POSTĘPOWANIE PIELĘGNIARSKIE WOBEC PACJENTA Z CHOROBĄ ALZHEIMERA Zakres podejmowanych działań przez personel pielęgniarski jak również i rodzinę

Celem pracy było dokonanie oceny czy występujące schorzenia układu nerwowego mają wpływ na czynności życia codziennego osób w wieku podeszłym... Badania przeprowadzono na

Niepokojące jest, iż 30,0 % chorych nie uzyskało informacji na temat zalecanej diety w okresie leczenia i rehabilitacji.. Nawiązanie współpracy z chorym i

W niniejszej pracy przedstawiamy historię choroby młodego pacjenta, u którego początkowo rozpoznawano zaburzenia z kręgu schizofrenii, natomiast po kilku

Poziom depresji u pacjentek na oddziale ginekologicznym mieści się w przedziale 12-26 pkt skali Becka co odpowiada łagodnej depresji, w badaniach występuje wzajemna ujemna

W badanej grupie pacjentów którzy wypełnili przed i po zabiegu PWP Wzrokową Skalę Bólu (VAS), oraz kwestionariusz osobowy Oswestry stwierdzono zmniejszenie