Klasyfikacja metodą grupowania cech z uwzględnieniem ich wzajemnej korelacji
Pełen tekst
(2) : SU]\SDGNX PR*OLZRFL UHDOL]DFML SURFHVX XF]HQLD z nauczycielem stRVRZDQH V JáyZQLH PHWRG\ RSDUWH QD UR]ZL]DQLX RGSRZLHGQLHJR ]DGDQLDDSURNV\PDFML>@7HQVSRVyEUR]ZL]DQLDMHVWW\SRZ\GODXNáDGyZNODV\ILNXMF\FK UR]SR]QDMF\FK
(3) ]QDQ\FK MDNR SHUFHSWURQ\ L RJyOQLHM V]WXF]QH VLHFL QHXURQRZH jednokierunkowe, do uczenia których wykorzystywany jest algorytm wstecznej propagacji Eá GyZ .RQLHF]QRü XF]HQLD EH] QDXF]\FLHOD Z\VW SXMH Z SU]\SDGNX JG\ QLH ]QDP\ SU]\NáDGyZSUDZLGáRZHMNODV\ILNDFML:WHG\QLHSRWUDILP\SU]HZLG]LHüSRSUDZQ\FKZDUWRFL V\JQDáyZ Z\MFLRZ\FK XNáDGyZ NODV\ILNXMF\FK QHXURQyZ
(4) QLH ]QDMGXM ZL F ]DVWRVRZDQLDSURFHGXU\SRV]XNLZDQLDRSW\PDOQHMVWUXNWXU\XNáDGXNODV\ILNXMFHJRRSDUWH 1. =DNáDG$XWRPDW\NL,QVW\WXW$XWRPDW\NLL5RERW\NL:$7XO.DOLVNLHJR -908 Warszawa.. 139.
(5) :áRG]LPLHU].ZLDWNRZVNL. QD PLQLPDOL]DFML Eá GX V\JQDáyZ Z\MFLRZ\FK : W\P SU]\SDGNX QDMEDUG]LHM SRSXODUQH UR]ZL]DQLH SROHJD QD Z\NRU]\VWDQLX neuronów typu Winner Takes All L UHJXá\ XF]HQLD .RKRQHQD>@-HGQDNSUDZLGáRZHG]LDáDQLHWHJRW\SXVLHFLLVWRWQLH]DOH*\RGQRUPDOL]DFML V\JQDáyZ ZHMFLRZ\FK L ZDJ : SU]\SDGNDFK ]DGD NODV\ILNDFML Z NWyU\FK NRUHODFMD V\JQDáyZ QDOH*F\FK GR SRV]F]HJyOQ\Fh grup jest istotna, zastosowanie metody .RKRQHQD Z\PDJD V]F]HJyOQLH UR]ZD*QHM QRUPDOL]DFML WDN DE\ RGSRZLHGQLD LQIRUPDFMD QLH ]DJLQ áD 6]F]HJyOQ\ SUREOHP VWDQRZL ]DGDQLD Z NWyU\FK SRV]F]HJyOQH NODV\ SU]HNU\ZDM VL D UR]Uy*QLHQLH NODV MHVW PR*OLZH W\ONR SRSU]H] VSR*\WNRZDQLH LQIRUPDFML o korelacji danych. 3U]\NáDG]DGDQLDNODV\ILNDFMLZNWyU\PZ\VW SXMHSUREOHPXZ]JO GQLHQLDNRUHODFML danych jest przedstawiony na rys. 1. Na rys. 1 (a) jest zobrazowany zbiór danych SRGOHJDMF\FK NODV\ILNDFML 5\V (b) przedstawia oczekiwany wynik klasyfikacji. Na rys. 1 F
(6) SU]HGVWDZLRQRZ\QLNNODV\ILNDFMLRSDUWHMQDSRUyZQ\ZDQLXRGOHJáRFLHXNOLGHVRZHM– MHVWWRZ\QLNQLH]DGRZDODMF\ (b). (a). (c). 3. 3. 3. 2. 2. 2. 1. 1. 1. 0. 0. 0. -1. -1. -1. -2. -2. -2. -2. 0. 2. -2. 0. 2. -2. 0. Rys. 13U]\NáDG]DGDQLDNODV\ILNDFMLD
(7) GDQHE
(8) Z\QLNRF]HNLZDQ\F
(9) Z\QLN klasyfikacji opartej nDRGOHJáRFLHXNOLGHVRZHM. 2. 2GOHJáRü0DKDODQRELVD :SURZDG]LP\QDVW SXMFHR]QDF]HQLD 1) X - wektor cech obiektu z klasy . , 2) X = EX -ZDUWRüRF]HNLZDQDZHNWRUDFHFKNODV\. , 3) 5 = ( X − X
(10) X − X
(11) ′ - macierz kowariancji wektora cech klasy . .. 140. 2.
(12) .ODV\ILNDFMDPHWRGJUXSRZDQLDFHFK... 3U]\MPLHP\ ]DáR*HQLH *H macierz kowariancji 5 MHVW GRGDWQLR RNUHORQD 'OD GDQHM macierzy kowariancji 5 Z\]QDF]\P\ZDUWRFLZáDVQH λ N LZHNWRU\ZáDVQH W N : (1). 5 W N = λN W N. N = Q. 3RQLHZD* PDFLHU] NRZDULDQFML MHVW V\PHWU\F]QD L – ] ]DáR*HQLD - GRGDWQLR RNUHORQD ZDUWRFL ZáDVQH λ N V GRGDWQLH D ZHNWRU\ ZáDVQH W N macierzy 5 V U]HF]\ZLVWH i ortonormalne: (2). W ′L W M = . MHOL MHOL. L= M L≠ M. 3U]HNV]WDáFHQLH OLQLRZH RUWRJRQDOQH R PDFLHU]\ SU]HNV]WDáFHQLD 7 ′ , gdzie 7 jest PDFLHU]PRGDOQW]QXWZRU]RQ]ZHNWRUyZZáDVQ\FK (3). 7 = [W . W WQ ]. ]QDQH MHVW MDNR SU]HNV]WDáFHQLH .DUKXQHQD-Loève’a2 >@ ,VWRWD WHJR SU]HNV]WDáFHQLD polega na dekorelacji wektora cech, bowiem macierz kowariancji wyniku transformacji jest PDFLHU]GLDJRQDOQ (4). (>7 ′(X − X )@ >7 ′(X − X )@′ = 7 ′ (> X − X
(13) X − X
(14) @′ 7 = W ′ W ′ W ′ W ′ ′ = 7 57 = 5 [W W W Q ] = [5W 5W 5W Q ] = W ′Q W ′Q W ′ λW ′W λ W ′W W ′ λ W ′ W λ W ′ W [λ W λ W λQ W Q ] = = W ′Q λW ′Q W λ W ′Q W . λ Q W ′W Q λ Q W ′ W Q = GLDJ (λλ λ Q ) λQ W ′Q W Q . 2. 3U]HNV]WDáFHQLHWRMHVW]QDQHWDN *HMDNRSU]HNV]WDáFHQLH+RWHOOLQJD Por.: 1) Hotelling H.: Analysis of a complex of statistical variables into principle components, J. Educ. Psychology, 24, 417-441, 498-520, 1933. 2) Karhunen K.: Über lineare Methoden in der Wahrscheinlichkeitsrechnung. Ann. Acad. Sci. Fennicae, Ser. A, Math.-Phys., 37, 3-79, 1947. 3) Chien Y.T., Fu K.S.: On the generalized Karhunen-Loève expansion, IEEE Trans. Inf. Theory, IT-13,3, pp.518-520, 1967.. 141.
(15) :áRG]LPLHU].ZLDWNRZVNL. Otrzymany wynik jest zgodny ze znanym twierdzeniem3 *H GOD ND*GHM PDFLHU]\ symetrycznej 5 o elementach rzeczywistych istnieje macierz ortogonalna 7 WDND*H 7 ′5 7 = . (5) przy czym:. = GLDJ (λ λ λQ ). (6). 2FHQD ]JRGQRFL Z\QLNX SRPLDUX [ ] NODV . SROHJD QD REOLF]HQLX Uy*QLF\ badanego wyniku [ LZDUWRFLRF]HNLZDQHM X = EX FHFK\ZWHMNODVLHW]QZDUWRFL (7). a [ =[−X. DQDVW SQLH]DVWRVRZDQLXGRRWU]\PDQHMUy*QLF\SU]HNV]WDáFHQLD.DUKXQHQD-Loève’a:. (8). a W ′[ \ ′ a \ W [ a \= = 7′ [ = a \ Q W ′Q [ . -HVWRF]\ZLVWH*HSU]HNV]WDáFHQLDRUWRJRQDOQH]DFKRZXMRGOHJáRüW]Q (9) Istota. 7 ′a [ wykorzystania. . [ ′ 7 7 ′a [=a [ ′a [= a [ =a transformaty. . Karhunena-Loève’a. polega. na. mo*OLZRFL. unormowania poszczególnych zdekorelowanych komponentów poprzez utworzenie QDVW SXMFHJRZHNWRUD. ( 10 ). ] ] ] = = ] Q . \ λ \ λ \Q λ Q . Uzyskany w ten sposób wektor ] MHVWXQRUPRZDQ\ZW\PVHQVLH*HPDPDFLHU]NRUHODFML UyZQPDFLHU]\MHGQRVWNRZHM. 3. Por. np.: Kowalczyk B.: Macierze i ich zastosowania, WNT, Warszawa, 1976, str. 102.. 142.
(16) .ODV\ILNDFMDPHWRGJUXSRZDQLDFHFK... ( 11 ). ]] ]] ]]Q ] ] ] ] ] ] Q ((]]′) = ( = ]Q ] ]Q ] ]Q ]Q =( . \ \ λ \ \. \ \ . \ \ Q λλQ \\Q λ λQ = GLDJ ( ) \Q\Q λ Q . . λλ \\ λ \Q\ λQ λ. λ λ \ Q \ λ Q λ. 2FHQD]JRGQRFLEDGDQHMFHFK\ [ ]NODV . SROHJDQDZ\]QDF]HQLXNZDGUDWXGáXJRFL wektora ] VWDQRZLFHJRXQRUPRZDQZDUWRüWUDQVIRUPDW\.DUKunena-Loève’a wektora a [ = [ − X W]QREOLF]HQLDQDVW SXMFHJRIXQNFMRQDáX a ) Q Q \ N ( W ′N [ a′W ) (W ′ [ a G ([ ) = ] ′] = ∑ ] = ∑ =∑ = ∑ ([ N N )= λ λ λ N = N = N = N N = N N Q. ( 12 ). N. Q. λ− − a′[W W W ] λ =[ Q . λ−Q . . W ′ W ′ a = [ − X
(17) ′ 7 −7 ′ [ − X
(18) = [ W ′Q . = [ − X
(19) ′ 5 − [ − X
(20) 3RZ\*V]\IXQNFMRQDáPR*HE\üLQWHUSUHWRZDQ\MDNRNZDGUDWRGOHJáRFLEDGDQego wyniku SRPLDUXRGZ]RUFDNODV\:\VW SXMFDZHZ]RU]H( 12
(21) ZD*RQDRGOHJáRüZSU]HVWU]HQL FHFKMHVW]Z\NOHQD]\ZDQDRGOHJáRFL0DKDODQRELVD4.. 3. Algorytm klasyfikacji =DSURSRQRZDQ\ VSRVyE RFHQ\ RGOHJáRFL EDGDQHJR Z\QLNX SRPLDUX cechy od Z]RUFD PR*H VWDQRZLü SRGVWDZ NODV\ILNDFML SRSU]H] JUXSRZDQLH NODVWHU\]DFM
(22) . 4. FLOHU]HF]ELRUF3&0DKDODQRELVZVZRMHMSUDF\>@]GHILQLRZDáRGOHJáR üPL G]\GZLHPDSRSXODFMDPL o równych macierzach kowariancji: G = X − X
(23) ′ 5 − X − X
(24) , gdzie 5 = 5 = 5 .. 143.
(25) :áRG]LPLHU].ZLDWNRZVNL. Grupowanie jest zaliczane do problematyki samoorganizacji, a odpowiednie algorytmy F] VWR V RNUHODQH QD]Z ,62'$7$ DQJ Iterative Self-Organizing Data Analysis Techniques). 0HWRG\ JUXSRZDQLD Z QDWXUDOQ\ VSRVyE ]QDMGXM ]DVWRVRZDQLH ZV] G]LH WDPJG]LH]DFKRG]LNRQLHF]QRüNODV\ILNDFMLEH]QDXF]\FLHOD 3U]HGVWDZLP\ ]D >@ SURVW\ DOJRU\WP JUXSRZDQLD PLQLPDOL]XMF\ VXP RGOHJáRFL wszystkich punktów grupy (klasteru) od jej centrum. 3U]\MPLHP\ *H GDQH ZHMFLRZH SURFHVX JUXSRZDQLD VWDQRZL ]ELyU ZHNWRUyZ ; = {[ [ [ 1 }. Zdanie polega na utworzeniu. /. grup. * N R QDVW SXMF\FK. ZáDFLZRFLDFK 1) Grupa * N zawiera /N wektorów ze zbioru ; JUXS\VUR]áF]QHLZVXPLHZ\F]HUSXM zadany zbiór ; .
(26) 'ODND*GHMJUXS\Z\]QDF]RQHMHVWMHMFHQWUXP ] N . 3) -DNR ZVND(QLN MDNRFL JUXSRZDQLD SU]\MPXMH VL VXP NZDGUDWyZ RGOHJáRFL VNáDGQLNyZJUXSRGFHQWUyZRGSRZLHGQLFKJUXSW]Q /. 4=∑. (13 ). ∑ [−]. N = [∈*N. N. $OJRU\WPUHDOL]DFMLSURFHVXJUXSRZDQLDPR*QDRSLVDüQDVW SXMFR .URN ZVW SQ\ L = ): 1DOH*\ Z\EUDü MDNR FHQWUD ]
(27) ]
(28) ] /
(29) grup dowolne, Uy*QLFHVL ZHNWRU\]H]ELRUX ; . Krok kolejny o numerze L : 'OD ND*GHJR ZHNWRUD [ ∈ ; QDOH*\ ]QDOH(ü JUXS WDN *H rozpatrywDQ\ZHNWRUMHVWSRáR*RQ\QDMEOL*HMMHMFHQWUXPW]QQDOH*\ZHNWRU [ ∈ ; ]DOLF]\ü do grupy o numerze N MHOL (14 ). [ − ] N (L ). . ≤ [ − ] M (L ). . dla wszystkich M = / ZSU]\SDGNXVSHáQLHQLDZDUXQNXSU]H]ZL FHMQL*MHGQJUXS EDGDQ\ ZHNWRU QDOH*\ ]DV]HUHJRZDü GR GRZROQHM DOH W\ONR MHGQHM ] QLFK
(30) :\QLNLHP SU]\SRU]GNRZDQLD ZHNWRUyZ GR JUXS MHVW XWZRU]HQLH ]ELRUyZ * N (L ) , gdzie N oznacza numer grup, a L - QXPHU LWHUDFML 'OD RWU]\PDQ\FK JUXS Z\]QDF]DQH V QRZH FHQWUD zgodnie z wzorem: (15 ). 144. ] N (L + ) =. . /N (L ). ∑[. [∈*N (L ).
(31) .ODV\ILNDFMDPHWRGJUXSRZDQLDFHFK... gdzie: /N (L ) = * N (L ) -OLF]HEQRüJUXS\ * N (L ) . .URNNRFRZ\ ProFHVJUXSRZDQLD]RVWDMH]DNRF]RQ\MHOLNROHMQDLWHUDFMDQLHSRZRGXMH zmian w grupach. =DVWRVRZDQLHRGOHJáRFL0DKDODQRELVDSROHJDQDZ\NRU]\VWDQLXZ]RUX [. (16 ). . = [ ′ 5 −[. (a). (b). -0.5. -0.5. -1. -1. -1.5. -1.5. -2. -2. -2.5. -2.5 1.5. 2. 2.5. 1.5. (c). 2.5. 2. 2.5. (d). -0.5. -0.5. -1. -1. -1.5. -1.5. -2. -2. -2.5. -2.5 1.5. 2. 2. 2.5. 1.5. Rys. 23U]\NáDGJUXSRZDQLDD
(32) GDQHE
(33) Z\QLNRF]HNLZDQ\F
(34) Z\QLNNODV\ILNDFML RSDUWHMQDRGOHJáRFLHXNOLGHVRZHMG
(35) Z\QLNNODV\ILNDFMLRSDUWHMQDRGOHJáRFL Mahalanobisa. 4. 8ZDJLNRFRZH Stosowanie prRFHGXU VDPRXF]HQLD VWDMH VL NRQLHF]QRFL Z SU]\SDGNDFK EUDNX GDQ\FK Z]RUFRZ\FK QS JG\ QLH ]QDP\ SU]\NáDGyZ SUDZLGáRZHM NODV\ILNDFML -HGQDN SURFHV\VDPRRUJDQL]DFMLV]QDWXU\U]HF]\WUXGQHGRVWHURZDQLDDRWU]\P\ZDQHZ\QLNL QLH ]DZV]H V ]JRGQH ] oczekiwanymi. Dlatego zwykle o powodzeniu zastosowania 145.
(36) :áRG]LPLHU].ZLDWNRZVNL. PHWRG\VDPRXF]HQLD JUXSRZDQLD
(37) PR*QDRU]HNDüMHG\QLHZRGQLHVLHQLXGRNRQNUHWQHJR problemu badawczego. 3U]HGVWDZLRQD Z DUW\NXOH PHWRGD ]RVWDáD RSUDFRZDQD GOD SRWU]HE VHJPHQWDFML V\JQDáX PRZ\ ZVW SQH Z\QLNL MHM ]DVWRVRZDQLD V ]DFK FDMFH 1D U\V (a) SU]HGVWDZLRQRSU]\NáDG]ELRUXZVSyáF]\QQLNyZ/3& U\VXQHNSU]HGVWDZLDZDUWRFLGZyFK SLHUZV]\FK ZVSyáF]\QQLNyZ /3&
(38) 5\V (b) przedstawia oczekiwany wynik klasyfikacji: ]ELyUZVSyáF]\QQLNyZVNáDGDVL ]F]WHUHFKJUXSND*GD]QLFKRGSRZLDGDQDJUDQLXJáRVNL “a” lub “y” przez jednego z dwóch mówców. Na rys. 2 (c) przedstawiono wynik klasyfikacji RSDUWHM QD SRUyZQ\ZDQLX RGOHJáRFL HXNOLGHVRZHM Z SU]HVWU]HQL FHFK – jest to wynik QLH]DGRZDODMF\ :\QLN JUXSRZDQLD XZ]JO GQLDMFHJR NRUHODFM GDQ\FK ]RVWDá przedstawiony na rys. 2 G
(39) -DNPR*QD]DXZD*\üRWU]\PDQ\Z\QLNJUXSRZDQLDMHVWEOLVNL oczekiwanemu.. Literatura [1]. Grad L., Zastosowanie transformaty Karhunena-Loeve’a do rozpoznawania mówcy, Biuletyn IAiR WAT, Nr 13, 2000.. [2]. Kwiatkowski W., 2 ]DVWRVRZDQLX PHWRG DSURNV\PDFML GR UR]ZL]\ZDQLD ]DGD NODV\ILNDFML V\JQDáyZ, Biuletyn IAiR WAT, Nr 4, 1996.. [3]. Kwiatkowski W., Klasyfikacja Karhunena-Loeve’a, Biuletyn IAiR WAT, Nr 13, 2000.. [4]. Kwiatkowski W., Podstawy systemów multimedialnych - Z\EUDQH SUREOHP\ SU]HNV]WDáFH i SU]HWZDU]DQLDV\JQDáyZ, IAiR WAT, 1999.. [5]. Mahalanobis P.C.: A generalized distance in statistics, Proc. Nat. Inst. Sci. India, 12, 4955,1936.. [6]. Osowski S.: Sieci neuronowe. Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa, 1994.. [7]. Tou J. T., Gonzalez R.C., Pattern Recognition Principles, Addison-Wesley Publishing Company, 1974.. [8]. Warmus M.: 8RJyOQLRQHRGZURWQRFLPDFLHU]\, PWN, Warszawa, 1972.. 5HFHQ]HQWGUKDELQ*Marian Chudy, prof. WAT. 3UDFDZSá\Q áDGRUHGDNFML. 146.
(40)
Powiązane dokumenty
Utworzone w pierwszych latach władzy radzieckiej instytuty nauko we stały się ośrodkami rozwoju najważniejszych dziedzin nauki, np. in stytuty: Fizyki Technicznej,
Powyższa analiza stopnia decentralizacji działań wyborczych wskazuje, że działania sztabowców opozycji oraz strony rządowej wpisują się w model kampanii typu premo-
Thematic structure is an important component of the translation process and product, and it significantly affects the quality of translations, es- pecially from English into
Jan Paweł II pozytywnej waloryzacji człowieka i jego egzystencji dokonywał także za pomocą czasowników: afirmować (godność ludzkiej osoby), bronić (uni- wersalnych i
W efek cie'an alizy wyników szczegółow ej inw entary zacji powierzchniowej zauważono podział pow ierzchni stanow iska na dwa człony w form ie odrębnych o
Urban design strategy: Prof Greg Keeffe, Queens University, Belfast. Aquaponic
-HGQRF]HĞQLH QLH PRĪQD QLH ]DXZDĪ\ü ĪH DUJXPHQW\ QD NRU]\Ğü NRQNUHW- QHM NZDOLILNDFML SU]HVWĊSVWZ SRSHáQLRQ\FK Z VNáDG]LH SU]HVWĊSF]HM RUJDQL]DFML. Z
[r]