K s ią ż k a s t a n o w i w p r o w a d z e n ie d o n o w o c z e s n e j i w a ż n e j p r o b le m a t y k i r o z p o z n a w a n ia o b r a z ó w . P r z e d s t a w io n o w niej z a r ó w n o t e o r e t y c z n e a s p e k t y k ilk u n a s t u m e to d r o z p o z n a w a nia, ja k i lic z n e p r a k t y c z n e p rz y k ła d y . P o d a n e a lg o r y t m y o b lic z e n io w e u ła t w ia ją w y k o r z y s t a n ie o m a w ia n y c h m e to d ro z p o z n a w a n ia , a u je d n o lic o n a fo rm a liz a c ja o p is u t y c h m e to d i z a p r o p o n o w a n a k la s y fik a c ja p o z w a la ją na ła t w ą o rie n ta c ję w r o z m a it y c h p o d e jśc ia c h , z w y k le o p is y w a n y c h w lite ra tu rze o s o b n o i b ez m o ż liw o ś c i ich w z a j e m n e g o p o r ó w n a n ia .
K s ią ż k a p r z e z n a c z o n a jest d la s t u d e n t ó w in fo r m a ty k i, a u t o m a ty k i, r o b o t y k i i e le k tro n ik i, a ta k ż e d la n a u k o w c ó w i in ż y n ie r ó w in te r e s u ją c y c h s ię m e t o d a m i r o z p o z n a w a n ia o b r a z ó w .
R o z p o z n a w a n ie o b ra z ó w
W sp ó łcze sn a Nauka i Technika
Informatyka
Kom itet Redakcyjny:
J a c e k B a ń k o w sk i Leon ard B ole Z d z is ła w B u b n ick i
J u liu sz Lech K u lik o w sk i - przew odniczący W ojcie ch S o b c z a k
J ó z e f W in k o w sk i
&
Ryszard T a d e u sie w ic z M a riu sz F la s iń sk i
Rozpoznawanie obrazów
P a ń s t w o w e W y d a w n ic t w o N a u k o w e W a rs z a w a 1991
P r o j e k t g ra fic z n y serii
Z y g m u n t Z i e m k a
T y t u ł d o to w a n y przez M in is te r s tw o E d u k a c ji N a ro d o w ej
© C o p y r i g h t
b y P a ń s tw o w e W y d a w n i c t w o N au ko w e W a r s z a w a 1991
R e d a k t o r
A n n a G ł a ż e w s k a - C z u r y ł o
P r a c ę d o d r u k u p r z y g o to w a ł M a r i a n Ł a k o m y
IS B N 8 3 - 0 1 - 1 0 5 5 8 - 5
P A Ń S T W O W F W Y D A W N I C T W O N A U K O W F
Wydanie I. A rk wyd. 11.5. Ark druk 13.5.
Papier offsetowy kl. III, HOg. 61 x 86 cm.
Oddano do reprodukcji w lipcu 1991 r.
D ru k u k o ń c z o n o w sie rp n iu 1991 r. Z a m n r 1426
Z \ K L . G R A F W Y D . N A U K Ł Ó D Ź . U L. Ż W I R K I 2
S P I S R Z E C Z Y
1. W p r o w a d z e n i e ... 9
2. Z a d a n ie r o z p o z n a w a n i a . ... 19
2.1. K la s y f ik a c ja j a k o p u n k t w y jś c ia d o r o z p o z n a w a n i a ... 19
2.2. Z a d a n i e r o z p o z n a w a n i a ... 20
2.3. E l e m e n ty s k ła d o w e r o z p o z n a w a n ia ... 21
2.4. R e c e p c ja i s t r u k t u r a p rz e s tr z e n i cech ... 22
2.5. F u n k c je p rz y n a le ż n o ś c i ... 27
2.6. P o d e jm o w a n ie d e cy z ji ... 28
2.7. C i ą g u czący ... 30
3. K la s y f ik a c ja m e t o d r o z p o z n a w a n i a ... 32
3.1. P o t r z e b a klasyfik acji m e to d r o z p o z n a w a n ia o b ra z ó w ... 32
3.2. Z a s a d a p o d z i a ł u i p o d s t a w a klasyfikacji m e to d r o z p o z n a w a n ia 33 3.3. K la s y f ik a c ja m e t o d p o d e j m o w a n i a decyzji ... 35
3.4. P o d z ia ł fu n k c ji p rz y n a le ż n o ś c i ... 38
3.5. P o d z i a ł m e t o d re c ep c ji ... 41
4. M e to d y m i n i m a l n o o d l e g ł o ś c i o w e ...43
4.1. W p r o w a d z e n ie ... 43
4.2. M e t o d a N N ... 44
4.3. M e t o d a a N N ... 47
4.4. M e t o d a j ^ N N ... 51
4.5. P o d s u m o w a n i e ... 53
6 Spis rzeczy
5. M e to d y wzorców ... 54
5.1. M e to d a uo gólnionych wzorców i otoczeń kulistych ... 54
5.2. M e t o d a N M ... 60
6. M e to d y a p r o k s y m a c y j n e ...64
6.1. P o sta w ie n ie z a d a n i a ... 64
6.2. P r o b le m w y b o ru funkcji bazow ych ... 65
6.3. W y b ó r liniowej funkcji przynależności ... 69
6.4. M e to d a uc ze n ia m a sz y n y ... 73
6.5. M e t o d a funkcji nieliniow ych ... 79
7. M e to d y s p e c ja ln e ... 84
7.1. P o d s ta w o w e sform u ło w an ie m e to d y funkcji p o te n cjaln y c h — 84 7.2. M e t o d a funkcji p o te n cjaln y c h w realizacji perceptronow ej ____88 7.3. M e to d a a p ro k s y m a c ji sto ch astycznej ... 90
7.4. Sieci n e u ro n o w e ... 92
8. M e to d y p ro b a b ilis ty c z n e ... 97
8.1. P o s ta w ie n ie z a d a n ia i p o d staw o w e z a ł o ż e n i a ... 97
8.2. M e to d a ro z p o z n a w a n ia w przestrzen i je d n ow y m iaro w ej ... 100
8.3. R o z p o z n a w a n ie w p rz e strze n i wielowymiarowej ... 104
8.4. O k reślen ie w y m a g a n y c h rozk ładó w p r a w d o p o d o b i e ń s t w a 106 8 5. P r z y p a d e k niezależnych sk ład o w y ch w e k to ra c e c h ... 107
8.6. P r z y p a d e k w ielow ym iarow ego ro z k ła d u n o r m a l n e g o ... 109
8.7. M e to d y o p a r te n a e m p iry c z n y m b u d o w a n iu ro zk ładu ... 113
8.8. A lg o ry tm L I ja k o szczególny p rz y p a d e k m e to d p ro b a b ilisty c zn y c h ... 115
8.9. R o zp o z n a w a n ie e t a p o w e ... 118
9. W p ro w a d z e n ie d o sy n ta k ty c z n e g o ro z p o z n aw a n ia o brazów ... 123
10. M e to d y c i ą g o w e ... 135
7
10.1. U w agi o g ó ln e ... 135
10.2. K o d y ła ń c u c h o w e F r e e m a n a ... 136
10.3. J ę z y k i o p is u o b r a z ó w ( P D L ) S h a w a ... 140
10.4. J ę z y k i o p is u cech k s z t a ł t ó w ( J a k u b o w s k i ) ... 147
1 1. M e t o d y d rz e w o w e ... 155
11.1. A n a l i z a s y n t a k t y c z n a d rz e w E D T ... 155
11.2. A n a liz a s y n t a k t y c z n a d rz e w T ... 161
12. M e to d y g r a f o w e ... 164
12.1. P a r s i n g e k s p a n s y w n y c h ję z y k ó w g ra fo w y c h ... 164
12.2. P a r s i n g d l a g r a m a t y k i grafow ej k la sy E T L (1) ... 172
D o d a t e k 1. P r o b l e m w y b o r u m e t r y k i w p rz e s tr z e n i cech ... 181
D o d a t e k 2. D o w ó d tw i e r d z e n i a o zbieżno ści p ro c e su u c z e n ia d la a p r o k s y m a c y j n e j m e t o d y r o z p o z n a w a n ia o b ra z ó w ... 185
D o d a t e k 3. P o d s ta w o w e p o ję c ia te o rii ję z y k ó w fo rm a ln y c h i a u t o m a t ó w ... 191
D o d a t e k 4. W y b r a n e p o ję c ia te o rii ję z y k ó w d rzew o w ych i g ra fo w y c h 197 W y k a z o z n a c z e ń ... 208
B i b l i o g r a f i a ... 213
1. W P R O W A D Z E N I E
T e o r i a r o z p o z n a w a n i a o b r a z ó w r o z w i n ę ł a się n a św iecie w ra z z b a d a n i a m i z w i ą z a n y m i ze s z t u c z n ą in te li g e n c j ą . J e s t t o n o w a g a ł ą ź in f o r m a t y k i , b u d z ą c a w ie le n a d z i e i i je s z c z e w ięcej k o n tro w e rs ji. Z a s a d n i c z a i d e a b a d a ń n a d s z t u c z n ą i n t e l i g e n c j ą s p r o w a d z a się d o te g o , by z a p o m o c ą u r z ą d z e ń a u t o m a t y c z n y c h ( g łó w n ie k o m p u t e r ó w ) u z y sk iw a ć d z i a ł a n i a m a s z y n p o d o b n e d o ty c h , j a k i e r e a liz u j e czło w ie k z a p o m o c ą sw ojej in te lig e n c ji. Z a k res d z i a ł a ń s p e c j a l i s t ó w o d s z tu c z n e j in te lig e n c ji z m i e n i a się w ra z z ro z
w o je m i n f o r m a t y k i , g d y ż a k t u a l n i e w iele z a d a ń - d o n i e d a w n a u w a ż a n y c h z a b e z w a r u n k o w o w y m a g a j ą c e in te lig e n c ji - z d e w a lu o w a ł o się n a s k u te k ro z w o ju t e c h n i k i . W y n i k a t o z b r a k u p re c y z ji o k r e ś le n ia i n t e l i g e n c j a , k t ó r e - c h o ć n a p o z ó r o c z y w i s t e - s p r a w i a k ł o p o t y p r z y p r ó b a c h t a k i e g o zd efin io w a n ia , by d e f in ic ja n a d a w a ł a się z a r ó w n o d o o c e n y o so b o w o ś c i o k r e ś lo n e g o c z ło w ie k a , j a k i d o o p i s u d z i a ł a n i a p r o g r a m u k o m p u te r o w e g o .
P rz y k ła d . W szkole za inteligentnego uważa się ucznia, który szybko i trwale z a p a m ię tu je p o d aw ane wiadomości. J e d n a k w odniesieniu do systemów technicz
nych k ry te riu m takie nie daje się zastosować, gdyż komputerowe bazy i banki danych zdolne są d o trw ałego i szybkiego zapam ięty w an ia milionów informacji a m imo to ich g łu p o ta d o p ro w adza do łez wielu użytkowników. T a k więc inte
ligencja ucznia i „inteligencja” k o m p u te ra - to najwyraźniej dwie różne rzeczy.
Podobnie zaw odne b yw ają k ry te ria przyw iązyw ane zwyczajowo do określonych zawodów lub rodzajów pracy. Przykładow o, kadrę urzędniczą zwyczajowo nazywa się inteligencją pra c u jąc ą , a ty m czasem program y zastępujące pracę urzędnika - na p rz y k ła d system y p rz e tw arz a n ia danych pełniące funkcje po dobne do księgo
wej w b an ku - uchodzą za najprostsze i najbardziej prym ityw ne ze wszystkich program ów . Nie w ystarczy także odwoływać się d o sformułowań n a te m a t pracy
„twórczej” i „nietwórczej” , gdyż kom puterow e program y w spom agające tw ór
czość inżynierską (tzw . C A D ), a nawet kom ponujące muzykę lub kreujące dzieła plastyczne - nie s ą zaliczane do sztucznej inteligencji. P rzyk łady m ożna m no
10 1. W p r o w a d z e n ie
żyć, o d k ry w a ją c n a w e t s w o istą h ip o k ry zję w naszych o cen a ch , k tó re są bardziej lib e ra ln e w o d n ie sien iu do ludzi, niż w s to s u n k u do kom p u teró w . R ozw ażm y z a g a d n ie n ie m o d n y c h o s ta t n io gier kom pu tero w y c h . Jeśli człowiek błyskotliw ie w y g ry w a p a r t i ę szachow ą, to je ste ś m y s k ło n n i przypisać mu inteligencję - ba n a w e t mówi się niekiedy o geniuszu! A ty m c z a s e m gdy p ro sty p ro g ra m funk
cjo n u ją c y n a d o m o w y m k o m p u te r z e o g ry w a n as raz po raz - o d m a w ia m y mu inteligencji.
J a k z te g o w y n ik a , o b s z a r s z tu c z n e j in te lig encji m a b a r d z o s ł a b o w y ty c z o n e g r a n ic e , a n i e k t ó r e k la s y c z n e z a g a d n i e n i a s z tu c z n e j in te lig e n cji s p a d a j ą d o p o z i o m u z a d a ń s z k o ln y c h . N a p r z y k ła d c z ę s to w y m i e n i a n a we wcze
sn y c h p r a c a c h z tej d z ie d z in y ła m ig łó w k a o n a z w ie wieże H a n o i, k a m i e ń p r o b ie r c zy w ielu p r o g r a m ó w s z tu c z n e j in te lig e n cji, d a je się dziś ro z w ią zać za p o m o c ą p r o g r a m u z a w ie ra ją c e g o k ilk a linijek n a p is a n y c h w j ę z y k u
L O G O , u ż y w a n y m w s z k o ła c h p o d s ta w o w y c h . J e d n a k d l a w sz y s tk ic h s p e c ja lis tó w z a jm u ją c y c h się s z t u c z n ą in te lig e n c ją j e d n o nie u le g a w ątp liw o śc i:
z a g a d n i e n i a r o z p o z n a w a n i a s ą n a d a l j e d n y m z c e n tr a ln y c h p ro b le m ó w tej d z ie d z in y .
P o ls k a n a z w a ro zp o z n a w a n ie obrazów n ie z b y t p re c y z y jn ie o d w z o ro w u je z a k r e s t e m a t y c z n y o m a w i a n e g o z a g a d n i e n i a ( ł ) i z te g o p o w o d u w y m a g a p e w n e g o k o m e n t a r z a . P o ję c ie obraz z a z w y cz a j dość j e d n o z n a c z n ie ko ja rz y się z d w u w y m i a r o w ą i l u s t r a c j ą (ry s. 1.1) lub z t r ó j w y m ia r o w ą s c e n ą , n a t o m i a s t w’ n a z w ie d y s k u t o w a n e j w k siążce d z ied z in y n a u k i m u s i być t r a k t o w a n e z n a c z n ie szerzej.
P r z y k ł a d . O b r a z e m p o d le g a ją c y m ro zp o zn a w an iu może być zarów no li
t e r a rękopisu lub od cisk palca, j a k i s ta n p a c je n ta p o d d a w a n e g o p o s tę p o w a niu d ia g n o s ty c z n e m u , a ta k ż e sygnał mowy (rys. 1.2), przebieg elektrokardio- g r a m u (rys. 1.3) lub geofizyczny opis o d w ie rtu złoża roponośnego. P rz y k ła d ó w j e s t z re s z tą bez liku: opis d z i a ła n i a h ydrauliki p odw ozia może być tra k to w a n y ja k o o b ie k t w z a d a n iu , w k tó r y m o b ra z a m i s ą decyzje o do p u szcze n iu s a m o lo tu d o kolejnego s t a r t u lu b o skierow aniu go do re m o n tu . S ta n powierzchni c h w y ta n e g o d e t a lu m oże być o b ra z e m dla s y stem u sensorycznego r o b o ta so rtu ją c e g o e le m e n ty na ta ś m ie m on tażo w ej. Zbiór p a r a m e tr ó w ekonom icznych opisujących g o s p o d a r k ę p rz e d s ię b io rs tw a może być r o z p a try w a n y ja k o opis pew nego o b ie k tu ,
(* ) Z n a c z n ie k o rz y s tn ie js z y j e s t , p o w sz e c h n ie u ż y w a n y w lite r a tu r z e d o ty c z ą c e j ro z p o z n a w a n ia , a n g lo ję z y c z n y te r m in p a l t t r n rcco g n i t i o n , o z n a c z a ją c y ro z p o z n a w a n ie w zo rcó w .
1. W p r o w a d z e n i e 11
Rys. 1.1. W p r o w a d z o n y d o k o m p u t e r a o b raz m oże być ro zw ażany ja k o p o d le
gający r o z p o z n a w a n iu o b ie k t. J e d n a k w dziedzinie rozpoznawania obrazów nie tylko ta k ie o b r a z y s ą ro z w a ż a n e
co p o z w a la n a a u t o m a t y c z n e zaliczenie go do o b ra z u zak ła d ó w rozw ojow ych, w a r
tych in w e s to w a n ia lub s to ją c y c h n a p ro g u b a n k ru c tw a .
O g ó ln ie w z a d a n i u r o z p o z n a w a n i a o b r a z ó w c h o d z i o ro zp o z n a w a n ie p r z y n a l e ż n o ś c i r o z m a it e g o ty p u o b ie kt ó w ( lub zja wisk) do p e w n y c h k l a s . R o z p o z n a w a n ie t o m a być p r o w a d z o n e w s y t u a c j i braku a p r i o r y c z n e j i n f o r m a c j i n a t e m a t r e g u ł p r z y n a le ż n o ś c i o b ie k tó w d o p o s z c z e g ó ln y c h k las, a j e d y n a i n f o r m a c j a m o ż l i w a d o w y k o r z y s t a n i a p rz e z a l g o r y t m lu b m a sz y n ę r o z p o z n a j ą c ą j e s t z a w a r t a w ciągu u c z ą c y m , z ło ż o n y m z o b ie k tó w , d l a k t ó r y c h z n a n a j e s t p r a w i d ł o w a k la sy fik a c ja .
12 1. W prow adzeni«
Rys. 1.2. R o zpozna w a nym i o b ie k tam i m ogą być wypowiedzi w języku n a t u r a l
nym. N a rysu n k u w idoczne je s t w idm o am plitudowo-częstotliwościowo-czasowe w yrazu ¿erce. Zapis ta k i je s t rozpoznaw anym obiektem , zaś obrazem je s t ogół wszystkich w ypowiedzi tego wyrazu - niezależnie od tego, jakim głosem zostały w ypow iedziane i bez względu n a warunki n a g ra n ia
P r z y k ł a d . W większości zadań a u to m aty z acji diagnostyki medycznej (czę
s to rozw ażanych ja k o typow e zastosow anie rozpoznaw ania obrazów) p u n k te m wyjścia do prow adzonych rozw ażań są kartoteki szpitalne. Zaw ierają one histo
rie choroby wielu pacjentów , d la których właściwe diagnozy s ą (ex po st) dobrze znane: w iadom o bowiem , j a k tych pacjentów leczono i czym się to skończyło . . .
Z te o re ty c z n e g o p u n k t u w id z e n ia f a k t b r a k u ap rio ry c z n ej w iedzy n a t e m a t a lg o r y t m u r o z p o z n a w a n ia p o w o d u je , że z a d a n ie ro z p o z n a w a n ia ob-
1. W p r o w a d z e n i e
Rys. 1.3. P r z y k ł a d e m o b ie k tu p o d le g a ją c e g o ro z p o z n a w a n iu m oże być pok aza n y n a r y s u n k u e le k tr o k a r d i o g ra m . Obiekt ta k i m oże być zakw alifikow any do o b r a zów: zapis prawidłowy, niedotlenienie komór, stan przedzawałowy itp.
ra z ó w j e s t i s t o t n i e in t e r e s u j ą c e : m a s z y n a p o w i n n a u c z y ć się r o z p o z n a w a n i a n a p o d s t a w i e p r z e d s t a w i o n y c h p r z y k ł a d ó w . Z a s a d n i c z y m e l e m e n t e m te g o u c z e n ia j e s t u o g ó l n i a n i e : k o m p u t e r o t r z y m u j e p r z y k ł a d y ty lk o n i e k t ó r y c h o b i e k t ó w ( n a l e ż ą c y c h d o c ią g u u c z ą c e g o ), n a t o m i a s t o rz e k a ć m u s i (w czasie r o z p o z n a w a n i a ) o w s z y s tk ic h . Z t e g o p o w o d u r o z p o z n a w a n i e o b r a z ó w j e s t p o l i g o n e m , n a k t ó r y m p o w s t a j ą m e t o d y p r z e k a z y w a n i a u r z ą d z e n i o m a u t o m a t y c z n y m w s z y s tk ic h ty c h m o ż liw o ści i u m ie ję tn o ś c i, k t ó r y m i człow iek d y s p o n u j e b e z i n t r o s p e k t y w n e j ś w i a d o m o ś c i i w ie d z y j a k to się robi. O ile b o w ie m p r z e k a z a n i e m a s z y n i e u m ie ję tn o ś c i lic z e n ia lu b lo g ic z n eg o w n io s k o w a n i a łą c z y się z w y k o r z y s t a n i e m z n a n y c h a l g o r y t m ó w ty c h c z y n n o ś c i, o t y l e lic z n e i n n e u m i e j ę t n o ś c i c z ło w ie k a , w t y m u m ie ję tn o ś c i r o z p o z n a w a n ia , b a z o w a ć m u s z ą n a p r e z e n t a c j i p o k a z ó w , g d y ż a l g o r y t m j e s t n ie z n a n y . J a k w s p o m n i a n o , k o n ie c z n o ś ć b a z o w a n i a p r z y r o z p o z n a w a n i u n a uogólnia-
14 1. W p ro w a d z e n ie
m u d o ś w ia d c z e ń z e b r a n y c h w p o s ta c i c iąg u u c zącego p o w o d u je , że dzie
d z i n a r o z p o z n a w a n i a j e s t b a r d z o a t r a k c y j n a z te o re ty c z n e g o p u n k t u w i
d z e n ia . R ó w n o c z e ś n ie j e d n a k f a k t te n p o w o d u je b a rd z o d u ż e k o m p lik a c je p r a k t y c z n e i s p r a w i a , że z a s to s o w a n ia ro z w in ię ty c h j u ż te o rii s ą nieliczne, a e fe k ty u ż y tk o w e - w ciąż o g ra n ic z o n e .
O b i e k t y p o d le g a j ą c e ro z p o z n a w a n iu m o g ą m ieć ró ż n y c h a r a k t e r . K ilk a p r z y k ł a d ó w j u ż w y m ie n io n o , n a t o m i a s t d a lsz e p re z e n to w a n e s ą w kolej
n y c h r o z d z ia ła c h . Z u n i f i k o w a n e p o d e jśc ie d o m e t o d r o z p o z n a w a n ia je s t m o ż liw e d z ięk i t e m u , że j a k o w s tę p n y e t a p p ro c e su w y m ie n ia się p o m i a r
cech op is u ją c yc h r o zp oz na w an e obie kty , zaś d a lsz e p o s tę p o w a n ie p o le g a n a a n a li z o w a n iu ty c h cech.
P r z y k ł a d . A u to m a ty c z n e ro zpoznaw anie sygnału K T G , będącego zapisem ele k try c z n e j ak ty w n o ści s e rca p ło d u w czasie p o ro d u , prow adzone je s t zwykle n a p o d s ta w ie oceny je g o a m p litu d y w specjalnie w yb ran y ch p a sm ac h częstotliwości.
W arto śc i tyc h a m p lit u d s ta n o w ią z a te m c e c h y przy rozpozn a w an iu K T G , a ich p o m ia r j e s t pierw szym e t a p e m p rocesu rozpoznaw ania.
W y d o b y w a n e cechy s ą u z a le ż n io n e o d ro d z a ju ro z p o z n a w a n y c h o b ie k tó w , s ą więc z ale ż n e o d k o n k r e tn e g o z a d a n i a i nie m o g ą być w y b r a n e raz na zawsze.
P r z y k ł a d . P o d c z a s ro z p o z n a w a n ia mowy cecham i s ą p a r a m e tr y a k u sty cz n e an alizow anego s y g n ału : lokalizacja i czasow a zm ienność ta k zw anych form antów (częstotliw ości rezonansow ych w n a r z ą d a c h mow y) oraz w artości m om entów wid
m ow ych. C echy te , b a rd z o sk u tecz n e przy rozpoznaw aniu mowy, s ą całkowicie nieprzydatne przy ro z p o z n a w a n iu innych sygnałów - naw et p o d o b n y ch do m ow y syg n ałó w dźw iękow ych (n p . w w ib ro ak u sty cz n ej diag n o sty ce m aszyn).
P o o k re ś le n iu cech m a m y j e d n a k s y tu a c ję j e d n a k o w ą d la w sz y stk ic h z a d a ń r o z p o z n a w a n ia : o b i e k t (d o w o ln y ) j e s t o p is a n y z b io re m w a rto ś c i swoich cech i n a t y m z b io rz e w a rto ś c i m o ż n a d o k o n y w a ć obliczeń w celu p o d ję c i a d ecy zji o p rz y n a le ż n o ś c i o b i e k t u d o o kreślon ej klasy. T e o ria r o z p o z n a w a n i a o b r a z ó w d o s t a r c z a licznych m e t o d p o d e jm o w a n i a decyzji n a p o d s ta w ie o k re ś lo n y c h z es ta w ó w cech, nie d a je n a t o m i a s t p o d s t a w d o ra c jo n a liz a c ji w y b o r u s a m y c h cech, k t ó r y p o z o s ta je n a o gół d o m e n ą in tu ic ji k o n s t r u k t o r a , tw o rz ą c e g o u r z ą d z e n ie lu b a l g o r y t m d o r o z p o z n a w a n ia . F a k t te n n a leży b ra ć p o d u w a g ę p r z y w szelkich p ró b a c h oceny m e t o d r o z p o z n a w a n ia , g d y ż w p r o w a d z a o n e le m e n t arbitralności d o p o r z ą d n ie (w in n y c h p u n k t a c h ) s fo rm a liz o w a n e j te o rii.
1. W p r o w a d z e n i e 15 P r z y k ł a d . W szczególnie często rozw ażanym zadaniu a u to m a ty c z n e g o roz
p o zn aw an ia pisanych tek stów (dokładniej - liter i cyfr pisanych ręcznie lub m a szynowo) op isu je się w lite ra tu rz e kilkanaście altern aty w n y ch zestawów cech, g w a ra n tu ją c y c h p o p ra w n e rozpoznaw anie. Cechy te o pisu ją kszta łty liter lub ich rzutów , rozmieszczenie p u n k tó w inform atyw nych (skrzyżowań, rozgałęzień i zakończeń linii), topologię zam kniętych i o tw a rty c h fragm entów konturów, obecność lu b b ra k linii o określonym nachyleniu w określonych ćw iartkach pro
s to k ą ta op isanego n a rozp o z n aw a n y m znaku itp. G ra n ic ą poszukiwań je st tu jedynie lim it w yobraźni twórców nowych m e to d , zaś ogrom ne zap otrzeb ow an ie
na u k ła d y O C R ( 2) pow oduje, że stale p a ten tow an e są nowe pomysły.
W a r t o d o d a ć , że k ie d y c e c h y s ą j u ż w y b r a n e ( w y t y p o w a n e ) , w ó w cz a s m o g ą b y ć p r z e d m i o t e m o c e n y i w a r t o ś c i o w a n i a z p u n k t u w i d z e n i a ich p r z y d a t n o ś c i w p r o c e s i e r o z p o z n a w a n i a . I s t n i e j ą i s ą o p i s a n e w l i t e r a t u r z e liczne m e t o d y s e le k c ji i n f o r m a c j i w s y s t e m a c h r o z p o z n a j ą c y c h ; c z ę s to z r e s z t ą te n e t a p o c e n y i w a r t o ś c i o w a n i a s t a n o w i n a j i s t o t n i e j s z y p r a k t y c z n i e e f e k t z a s t o s o w a n i a m e t o d r o z p o z n a w a n i a . J e d n a k t a k a a n a l i z a i s e le k c ja m o ż liw a j e s t j e d y n i e ex p o s t , k ie d y j a k i e ś cechy w s t ę p n ie z a p r o p o n o w a n o , a p o t e m p o d d a n o w e ry fik a c ji. B r a k n a t o m i a s t , co w a r t o p o d k r e ś lić , m e t o d k r e a t y w n y c h , p o z w a l a j ą c y c h n a a u t o m a t y c z n e w y g e n e r o w a n ie p r o p o z y c ji cech.
P r o p o z y c j e t a k i e m u s z ą z a w s z e p o c h o d z ić o d c z ło w ie k a , z n a w c y sp ec y fik i k o n k r e t n e g o z a s t o s o w a n i a .
P rzy k ła d . P o m y sło d a w cą przy w yborze cech dla rozpoznaw ania odcisków palców musi być d ośw iadczony da ktyloskop, zaś cechy, na których m a się opierać a u to m a ty c z n e diag nozow anie raka trz u s tk i musi p o d a ć w y traw ny in te rn ista . Nie
p ow odzenia opisyw anych w lite ra tu rz e prób stosow ania m etod au to m a ty cz n e g o ro zp o zn aw an ia ob razów d o lokalizacji złóż roponośnych spowodow ane były, jak się wydaje, fak tem nieobecności wśród cybernetyków i inform atyków o p racow u jących m e to d ę - p rz y n a jm n ie j je d neg o geologa.
N ie k ie d y m o ż liw e i c elow e j e s t t r a n s f o r m o w a n i e j e d n y c h cech ( o p i s u j ą c y ch r o z p o z n a w a n e o b i e k t y ) w in n e , m o ż liw e d o o b lic z e n ia n a p o d s t a w i e o k r e ś lo n y c h r e g u ł t r a n s f o r m a c j i c e c h . N ow e c ec h y m o g ą p o z w a l a ć n a ł a tw ie js z e r o z p o z n a w a n i e o b r a z ó w i te n f a k t d e c y d u j e z a z w y c z a j o ich u ż y c iu . J e d n a k r e g u ł y t r a n s f o r m a c j i w y k r y t e p r z y okazji d ą ż e n i a d o o p t y m a l i z a c j i p r o c e s u r o z p o z n a w a n i a p o z w a l a j ą n a o g ó ł w z b o g a c ić w ie d z ę o r o z p o z n a w a -
( 2 ) O p tic a l C h a r a c t e r R e a d e r (o p ty c z n y c z y tn ik z n a k ó w ) to h a n d lo w a n a z w a ty c h u r z ą d z e ń .
16 1. W p ro w a d z e n ie n y c h o b ie k ta c h - co ta k ż e b y w a w y k o rz y s ty w a n e w p r a k ty c e j a k o uboczny e fe k t te c h n i k ro z p o z n a w a n ia .
P r z y k ł a d . C zęsto p ro p o n o w a n y m p rz y k ła d e m transform acji cech je s t prze
k ształcenie K a rh u n e n a - L o e v e g o , prow adzące do w ydobycia najbardziej infor- m a ty w n y c h i w zajem nie nie skorelowanych cech rozpoznaw anych obiektów [3].
Dzięki zastosow aniu tego przek ształce n ia możliwe je s t - w niektórych zadaniach - opero w an ie w czasie ro zp o zn a w an ia kilkom a zaledwie, pow stając y m i po tr a n s form acji, sk ła d o w y m i kanonicznym i, zam iast kilkudziesięciom a cechami pierw ot
nymi.
N a p o d s ta w ie cech, p o d d a n y c h u p rz e d n io selekcji i t r a n s f o r m a c jo m lub w y k o rz y s ty w a n y c h bez ż a d n e g o w stę p n e g o preparowania, tr z e b a p o d e j m o w ać decyzje o p rz y n a le ż n o ś c i n ie zn a n y c h o b ie k tó w d o w y ró ż n io n y c h o b r a zów (lu b , u jm u ją c to s a m o inaczej, d o u s ta lo n y c h k las). M ożliwe s ą tu p o d e jś c ia d w o ja k ie g o ro d z a ju : całościow e a lb o s t r u k t u r a l n e .
P o d e j ś c i e c a ł o ś c i o w e p o le g a n a t y m , że bierze się p o d uw agę w sz y st
kie cechy c a łe g o r o z p o z n a w a n e g o o b ie k tu i p o d e jm u je decyzję o je g o p rz y n a leż n o ści w j e d n y m e ta p ie , w j e d n y m akcie d e c y z y jn y m . O czyw iście m e t o d y p r o w a d z ą c e d o ta k ie g o p o d ję c ia w y m a g a n e j decyzji m o g ą być r o z m a ite i dalej o m ó w io n o k ilk a s p o ś ró d nich, p o ró w n u ją c j e ze s o b ą i w sk azując n a ich z a le ty w k o n k r e tn y c h s y tu a c ja c h . O p is a n o m e to d y o p a r t e n a pojęciu odległości w p r z e s tr z e n i cech i z w ią z a n y c h z t y m po jęciem in tu ic ja c h geo
m e tr y c z n y c h . D y s k u t o w a n o m e t o d y o p a r te n a m e to d a c h ap rosym acji f u n k cji p r z y n a l e ż n o ś c i , o fe ru ją c e w ok re ślo n y ch okolicznościach b a rd z o w y so ką s p ra w n o ś ć ro z p o z n a w a n ia . M ożliwe j e s t pod ejście o p a r te n a m e to d a c h p r o b a b ilis ty c z n y c h , n a w ią z u ją c e d o st a ty st y k i. M ożliwości j e s t z re s z tą z n ac z n ie więcej. P r z y k ła d o w o celowe j e s t n ie je d n o k ro tn ie w y ró ż n ie n ie ta k ic h m e t o d r o z p o z n a w a n ia , k tó r e m o g ą być s to so w a n e ta k ż e w p r z y p a d k u znajo m ości z ale d w ie n ie k t ó r y c h s p o ś ró d w y ty p o w a n y c h cech. N a tu r a ln ie nie zawsze u d a się p o p r a w n i e r o z p o z n a ć o b ie k t n a p o d s ta w ie zn ajo m o śc i ty lk o części cech, z a t e m w m e t o d a c h ty c h p ró b y ro z p o z n a w a n ia (p o łą c z o n e z u z u p e ł
n i a n i e m w ie d zy o cechach ro z p o z n a w a n e g o o b ie k tu ) t r z e b a wiele razy p o n a w ia ć , d l a t e g o m e t o d y ta k ie p o z w a la ją z n ajd o w a ć ro z w ią za n ie w w y n ik u w i e l o e t a p o w e g o p ro c e su , a nie je d n o ra z o w e g o a k tu .
P o d e j ś c i e s t r u k t u r a l n e j e s t o d m ie n n e : w r o z p o z n a w a n y m obiekcie w y r ó ż n ia się n a jp ie r w o k re ś lo n e e le m e n ty o ra z u s t a l a ich w z a je m n e rela
cje. O c zy w iście p rz y w y d z ie la n iu i id en ty fik o w an iu e le m e n tó w o ra z przy
1. W p r o w a d z e n i e 17
o k r e ś la n iu re la c ji w y k o r z y s t u j e się - p o d o b n i e j a k we w cześniej o m ó w io nych m e t o d a c h - w y b r a n e i p o m ie r z o n e cechy. J e s t to j e d n a k d o p ie ro e t a p w s tę p n y , g d y ż w ła ś c iw e r o z p o z n a n i e d o k o n y w a n e j e s t n a p o d s t a w i e s t r u k t u r a l n e g o o p is u , u w z g lę d n ia ją c e g o w s z y s tk ie wry k r y t e e le m e n ty i w s z y s t
kie u s t a l o n e re la c je . M e t o d y p o d e j m o w a n i a d ecyzji s ą w t y m p r z y p a d k u b a rd z ie j z ło ż o n e i n a w i ą z u j ą (m i ę d z y in n y m i) d o m e t o d lin g w is ty c z n y c h p o d o b n y c h d o w y k o r z y s t y w a n y c h w ję z y k a c h i te c h n ik a c h p r o g r a m o w a n i a . W m e t o d a c h ty c h o c z y w iś c ie k lu c z o w ą rolę o d g r y w a p o ję cie g r a m a t y k i , p o n ie w a ż r e g u ły tej g r a m a t y k i w y z n a c z a j ą d o p u s z c z a ln e fo r m y o b ie k tó w p o d l e g a j ą c y c h r o z p o z n a w a n i u . W d a ls z y c h ro z d z ia ła c h p r z e d y s k u t o w a n o n a j p o p u l a r n i e j s z e g r a m a t y k i w y k o r z y s t y w a n e s p e c y fic z n ie w r o z p o z n a w a niu o b ra z ó w r: g r a m a t y k i c iąg o w e , d rz e w o w e i grafow e.
P r z y k ł a d , W z a d a n iu ro z p o z n a w a n iu znaków alfa n u m ery cz n y ch rela cjam i są o k re ś le n ia d e fin iu ją c e b ez w z g lę d n e i w zględne lokalizacje w yróżn io n y ch cech.
N a p r z y k ł a d o k re ś lo n e s k rzy żo w an ie linii m oże być „u g ó ry ” ( r e la c ja b e z w g lę d n a) lub „ n a lewo o d z a k o ń c z e n ia linii” ( r e la c ja w zględna).
P o d e jś c i e s t r u k t u r a l n e w y d a je się n a p o z ó r b a rd z ie j z ło ż o n e i m n ie j e f e k ty w n e ( p r z e z d w u e t a p o w ą a n a li z ę o b ie k tó w ) o d p o d e j ś c i a c a ło ś c io wego, j e d n a k j e g o z a l e t ą j e s t m o ż liw o ś ć w y k o r z y s t a n i a d o a n a liz y b a rd z ie j z ło ż o n y c h o b r a z ó w . N a p r z y k ł a d d o k o n u ją c p r ó b y r o z p o z n a w a n i a z ło ż o ny c h s c e n , z a w i e r a j ą c y c h w iele o b ie k tó w , a l b o r o z p o z n a ją c s y g n a ł m o w y w p o s t a c i c a ły c h , w ie lo w y r a z o w y c h w y p o w ie d z i - m o ż e m y z d e c y d o w a nie u s p r a w n i ć p r o c e s r o z p o z n a w a n i a s t o s u j ą c p o d e jś c ie s t r u k t u r a l n e . J e g o uż y cie j e s t u z a s a d n i o n e t y m , że we w s p o m n i a n y c h z a d a n i a c h m a m y d o c z y n ie n ia z p r o b l e m a m i , k t ó r y c h z ło ż o n o ś ć - p rz y p r ó b a c h c a ło ś c io w e g o r o z p o z n a w a n i a - p r z e k r a c z a m o ż liw o ści w sp ó łc z e s n y c h s y s te m ó w r o z p o z n a ją c y c h , a k t ó r e m o ż n a z p o w o d z e n ie m ro z w ią z a ć p o p rz e z z a s to s o w a n ie p o d e jś c ia s t r u k t u r a l n e g o . W e w s p o m n i a n y c h z a d a n i a c h dość o c z y w is te j e s t t a k ż e z d e f in io w a n ie s p o s o b u d e k o m p o z y c ji z ło ż o n e g o z a d a n i a n a s k ł a d n i k i e l e m e n t a r n e , o c z y w is ty j e s t t a k ż e s p o s ó b w p r o w a d z e n ia s k ła d n i k ó w ele
m e n t a r n y c h o r a z w y o d r ę b n i e n i e relacji.
P o d e jś c i e s t r u k t u r a l n e b y w a t a k ż e u ż y te c z n e w z a d a n i a c h r o z p o z n a w a n ia o b r a z ó w , w k t ó r y c h n ie w y s t ę p u j ą w s p o s ó b j a w n y ż a d n e k o n k r e t n e o b ie k ty , a p o d z i a ł w e jśc io w y c h i n f o r m a c ji n a k la sy o p a r t y j e s t n a p e w n y c h cec h a ch g l o b a l n y c h , t r u d n y c h d o o p is u i fo rm a liz a c ji.
18 1. W p ro w a d z e n ie P r z y k ł a d . Do zagadnień tego ty p u należy problem rozpoznaw ania i klasy
fikacji fa k tu r y rozw ażanych powierzchni. Do zagadnienia tego powrócimy przy o m a w ian iu m e to d s tr u k tu r a ln y c h , w tym miejscu w a rto jedynie podkreślić odm ie
nność te go z a d a n ia od innych typow ych problem ów rozpoznaw ania obrazów.
W l i t e r a t u r z e d o ty c z ą c e j p r o b le m a ty k i ro z p o z n a w a n ia f o r m u łu je się ta k ż e k o m p l e m e n t a r n e - w s to s u n k u d o z a d a n ia pi'ostego rozpoznawania - z a d a n ie g r u p o w a n ia ( 3 ), m a ją c e liczne p ra k ty c z n e z a sto so w a n ia , szczególnie w e k o n o m ii, m e d y c y n ie lu b te ch n ice p rz e tw a r z a n ia sygn ałó w . Z a d a n ie to n a jła tw ie j w p ro w a d z ić j a k o inwersję z a d a n i a ro z p o z n a w a n ia . P r z y ro z p o z n a w a n iu m a m y dan y z b ió r k la s o ra z po je d y n cz y o b ie k t, k tó re g o p r zy n a le ż -
n o ś ć d o je d n e j z k la s m a b yć u s t a l o n a i w y k a z a n a . W z a d a n iu k la ste ry z a c ji m a m y daną j e d y n i e zb io row o ść o b ie k tó w , k tó re z ap e w n e d z ie lą się n a j a kieś klasy, p rz y c z y m liczba i c h a r a k te r y s ty k i klas nie s ą z n a n e i p o w in n y b yć d o p ie ro a u t o m a t y c z n i e w y z n a c z o n e . D o p ie ro z te g o p o d z ia łu w yn ik nie p rz y n a le ż n o ś ć o k re ś lo n y c h o b ie k tó w do poszczególnych klas.
C h a r a k t e r y s t y c z n ą w sp ó łza le żn o ść z a d a ń ro z p o z n a w a n ia i k la s te ry z a cji p o g ł ę b i a f a k t, że z n a c z n a część m e to d i technik w y k o rz y sta n y c h do r o z p o z n a w a n ia d aje się a d a p t o w a ć d la p o trz e b k la stery z a cji i n a o d w ró t.
P r z y k ł a d . Szeroko znany pak iet A R T H U R , opracow any na Uniwersytecie W ashingtion d la k o m p u te ra C D C C y b e r pozw ala (zależnie od w yboru użytkow
nika) rozw iązyw ać z a d a n ia rozpoznaw ania lub dokonyw ać klasteryzacji danych.
Icn p a k ie t w y k o rzystyw ano podczas b a d a n ia właściwości omawianych w kolej
nych rozdziałach m e to d rozpoznaw ania, a także służył ja k o p u n k t odniesienia przy ocenie efektyw ności niektórych nowych m e tod rozpoznawania.
M e to d y g r u p o w a n i a m a j ą j e d n a k sw o ją specyfikę, k tó re j w p row adze
n ie ro z b iło by w e w n ę tr z n ą s p ó jn o ść tej książki, a p o n a d t o d la ty c h m e to d - w o d r ó ż n ie n iu o d m e t o d r o z p o z n a w a n ia - o p ra c o w a n o n ie d a w n o nowe p o d rę c z n ik i. D la te g o m im o b liskiego zw iązku z z a g a d n ie n ia m i tu prezen
t o w a n y m i, m e t o d y g r u p o w a n i a i a n a liz y s k u p ie ń p o z o s ta n ą p o z a z akresem tej książki.
(3 ) W lite r a tu r z e św iato w e j u s ta lił się d la te j dzied zin y an g ielsk i te rm in c l u s t e r anal ysi i , k tó ry b y w a n ie k ie d y sp o lszcz an y ja k o „ k la ste ry z a c ja ” . B ędziem y tę nazw ę także sto so w a li, m im o je j n ie z b y t ła d n e g o b rz m ie n ia w ję z y k u p o lsk im , ze w zględu n a k ró ts z y i w y g o d n iejszy z a p is.
2. Z A D A N I E R O Z P O Z N A W A N I A
2 .1 . K l a s y f i k a c j a j a k o p u n k t w y j ś c i a d o r o z p o z n a w a n i a
W p o p r z e d n i m ro z d z ia le w p ro w a d z o n o z a d a n ie ro z p o z n a w a n ia w s p o só b i n tu ic y jn y i opisow y. W celu k o n k re ty z a c ji te g o z a d a n ia i w p ro w a d z e n ia p o szc z eg ó ln y c h m e t o d r o z p o z n a w a n ia k o rz y s tn e j e s t j e d n a k d y s p o n o w a n ie u ję c ie m b a rd z ie j s fo rm a liz o w a n y m . T a k ie w ła śn ie ujęcie z o s ta n ie te ra z p rz e d s ta w io n e .
O z n a c z a ją c p rz e z D z b ió r o b ie k tó w lu b zjaw isk p o d le g a ją c y c h r o z p o z n a w a n iu , m o ż e m y p r z y ją ć , że n a z b io rze t y m z d efin io w an a j e s t re la c ja K C D X D , b ę d ą c a r e la c ją rów now ażno ści. R e la c ja K o k re ś la ro z b i
cie z b io ru D n a kolekcję klas rów n ow ażno ści {D'}> o d p o w ia d a ją c y c h p o s z c z e g ó ln y m o b r a z o m . R elac ji K n a d a m y na zw ę klasyfikacji. W d a lsz y c h r o z w a ż a n ia c h z a k ł a d a m y j e d y n i e je j i s t n i e n i e , co j e s t p o tr z e b n e d o p r a w id ło w e g o s f o r m u ło w a n ia z a d a n i a r o z p o z n a w a n ia . Ż a d n e bliższe c h a r a k t e r y s t y k i klasyfik acji K n ie s ą z gó ry n a rz u c o n e , p o n ie w aż k o n s tr u k to r a l g o r y t m u lu b u r z ą d z e n i a p rz e z n a c z o n e g o d o ro z p o z n a w a n ia nie z n a (z za
ło ż e n ia ) bliższy ch w ła sn o ś c i tej relacji. Z ało żen ie to m u s im y w p ro w a d zić w celu z a p e w n ie n ia o d p o w ie d n ie g o p o z io m u ogólności p ro w a d z o n y c h roz
w a ż a ń , g d y ż w w iększości n ie b a n a ln y c h z a g a d n ie ń k r y t e r i a klasyfikacji s ą n ie z n a n e , zaś w p o z o s ta ły c h p r z y p a d k a c h ich z n ajo m o ść czyni z a d a n ie roz
p o z n a w a n i a t r y w ia ln y m .
O z n a c z m y przez L liczbę klas gen ero w a n y c h przez relację K , a z b ió r in d e k s ó w k la s - p rz e z / . W ów czas
D = \ J D \
»€/
(1)
20 2. Z a d a n ie ro z p o z n a w a n ia
n £ > " = 0], (2)
V * .,*-€!> « ¿ " . O e A' => 3 i e / ( ^ € D ‘) A (d" € £»•)] • (3) Z o p is u relacji K i zb io ru I w y n ik a istnienie o d w z o ro w a n ia
A : D —+ I (4)
o w ła sn o ś c ia c h
Vi 6 J > [¿(«Q = i = d € D ‘ ]. (5)
O d w z o ro w a n ie A w p e łn i o p isu je relację K , n a t o m i a s t re la c ja K defi
n iu je o d w z o ro w a n ie A z d o k ła d n o ś c ią d o p e r m u ta c ji z b io ru indeksow ego I . Z te g o powro d u uw ażać m o ż n a , że odw z o ro w an ie A - w o d ró ż n ie n iu od istn ie jąc e j o b ie k ty w n ie (z z a ło ż e n ia ) relacji K - zaw iera pew ien a r b itr a ln y s k ł a d n i k , z w ią z a n y z w y b o re m s p o so b u n u m e ra c ji klas.
P r z y k ł a d . W zadaniach diagnostyki medycznej, należących do „klasyki”
rozpoznawania obrazów zbiór D utożsamia się ze zbiorem wszystkich rozważa
nych dolegliwości. Dolegliwości te nie są (obiektywnie) identyczne i dlatego musi się rozróżniać rozmaite choroby, co odpowiada klasyfikacji K . Natomiast przypi
sanie nazw chorobom, co odpowiada odwzorowaniu A, jest oczywiście arbitralne.
2 .2 . Z a d a n i e r o z p o z n a w a n i a
W z a d a n i u r o z p o z n a w a n ia d ą ż y się d o tego, a b y sk o n stru o w a ć a lg o r y tm re a liz u ją c y o d w z o ro w a n ie
A : D - > l U { i 0) (6)
t a k ie , a b y p e w n a m i a r a Q ( A , A ) , n a z y w a n a dalej oceną jak o śc i algorytmu rozpoznawania A , b y ła m in im a ln a . J e d n o e le m e n to w y zbiór {t0} syb olizuje t u b r a k o d p o w ie d z i (d e c y z ja ty p u nie wi em ). W p ro w a d z e n ie w o d w z o ro w a n iu A e le m e n tu i 0 czyni z a d a n ie ro z p o z n a w a n ia b ardziej re a listy czny m : w p r a k ty c e często nie m o ż n a u s ta lić praw idłow ej decyzji z c a łą d o k ła d n o ścią, a z n acznie lepiej j e s t , jeśli a lg o ry tm u z n a, że nie p o tra fi ro z p oznać o k re ś lo n e g o o b ie k tu i zgłosi to s p e c ja ln y m sy g n a łe m , niż kiedy zgłoszony z o s ta n ie m y ln ie r o z p o z n a n y e le m e n t.
2.2. Z a d a n ie ro z p o z n a w a n ia 21
C z a s a m i p rz y definicji a lg o ry tm u A dopuszcza się rozpoznania warian
t o w e , to zn aczy p r z y jm u je się sy tu cję, w której ja k o roz p o z n an ie a k c e p tu je się dow olny podzbiór z b io ru 1. W a r to zauw ażyć, że ta k ie rozw iązan ie też m oże być p r z y d a t n e z p u n k t u w id z en ia pra k ty c zn y c h zastoso w ań , ponie
waż n iekiedy w y s ta r c z y w skazać pew ien p o d z b ió r klas rozpo zn aw an ych o b ie k tó w , a b y o s ią g n ą ć z a m ie rz o n y cel.
P r z y k ł a d . Przy rozpoznawaniu mowy może być wystarczające stwierdzenie, że analizowana głoska jest szumowa, bez precyzowania, czy mamy do czynienia z S, SZ czy Ś, a przy diagnostyce medycznej może nas zadowalać, że podejrzenie raka może być wykluczone - chociaż dokładniejsze rozpoznanie choroby nie jest jeszcze możliwe.
O d w z o ro w a n ie A m o ż e być z a te m op isan e ja k o
A : D - + 27, (6a)
gdzie o z n ac z en ie 21 u ż y te j e s t (z god nie z tr a d y c ją ) do zapisu zbioru wszy
stkich podzbiorów zbioru I. W a r to zwrócić uwagę, że w ty m p rz y p a d k u z b ę d n e j e s t w p ro w a d z a n ie e le m e n tu i0t poniew aż zbiór 27 z aw iera (z de
finicji) zb ió r p u s ty (0 C 2 / ), czyli w łaśnie b ra k ro z p o z n an ia . O d m o w a r o z p o z n a n ia m o że z re s z tą być przy takiej konwencji w y ra ż o n a n a d w a s p o soby: a lb o p o przez p o d a n ie j a k o ro z w ią z a n ia zbioru p ustego 0, a lb o poprzez p o d a n ie j a k o ro z w ią z a n ia całe g o zbioru / , co j e s t możliwe, j a k o że I 6 2J .
2 .3 . E l e m e n t y s k ł a d o w e r o z p o z n a w a n i a
O d w z o ro w a n ie A j e s t realizow an e j a k o założenie trzech odw zo ro w ań
A — F ■ C B , (7)
przy czy m pierwsze z nich
B : D -+ X (8)
b ę d z ie m y n a z y w a ć re c e p c ją , drugie
C : X —+ Rl (9)
o z n a c z a o b lic z an ie w arto ści t a k zw anych f u n k c j i przynależności, zaś ostat
nie o d w z o ro w a n ie , z ap isy w a n e j a k o
F : R l - / U { i'0 } ( 1 0 )
22 2. Z a d a n ie ro z p o z n aw a n ia lub
F : Rl — 21 (lO a)
o z n a c z a p roces p o d e jm o w a n i a decyzji.
P r z y k ł a d . W system ach wizyjnych robotów przemysłowych odwzorowanie B polega n a w prow adzeniu potrzebnego obrazu do kom p u tera (za po m o c ą ka
m e ry T V i przetw ornika A / C) oraz n a obliczeniu (za pom ocą specjalizowanych procesorów) w ybranych cech rozpoznawanych obiektów. Na podstaw ie tych cech określane s ą (za po m o c ą odpow iednich program ów w nadrzędnym kom puterze) m iary p o d o b ie ń stw a do znanych wzorców (odpow iada to odwzorowaniu C ) oraz p o d ejm o w an a je s t (przez sterow nik ro b o ta ) decyzja, który obiekt należy pochw y
cić (odw zorow anie F ).
W a r t o d o d a ć , że s c h e m a t te n n a d a je się do opisu m e to d całościowego ro z p o z n a w a n ia , n a t o m i a s t m e to d y s tr u k tu r a ln e , o m a w ian e w d alszych roz
d z ia ła c h książki, w y m a g a j ą o d m ie n n e g o p o d ejścia, co z o sta n ie we w łaści
w y m m iejscu w y ra źn ie z az n aczon e. O m ó w im y ob ecnie bliżej w pro w a d zo n e o d w z o ro w a n ia .
2 .4 . R e c e p c j a i s t r u k t u r a p r z e s t r z e n i ce ch
P o c z ą tk o w y m e le m e n te m każdego a lg o ry tm u ro z p oznająceg o j e s t p o m ia r cech w szy stk ich o b ie k tó w - z aró w n o w zorcowych, należących do ciągu u c ząceg o ( p a t r z d a le j), j a k i p o d le g ając y ch ro zp o z n aw a n iu
B : D X .
O k re ślen ie cech p ro w a d zi d o z a m ia n y ob ie k tó w d £ D w p u n k t y pew nej p rz e s tr z e n i. S y m b o l X w z a c y to w a n y m wzorze (8) o z n ac z a w ła śn ie tę p r z e s t r z e ń cech. Jej s t r u k t u r a j e s t z reg uły a r b i t r a l n a i z d e te rm in o w a n a g łów nie przez możliwości p o m ia ro w e . T r u d n o bo w iem z a k ła d a ć uw zględ
n ia n ie w ro z p o z n a w a n iu ta k ic h cech, k tó ry c h w artości nie p o tra filib y śm y w yznaczyć!
Z a k ła d a ć będ ziem y , że e le m e n ta m i p rz e strze n i cech X s ą w ek to ry ?i-ele- m e n to w e
x = (a?i, a?2, . . - x n ) € X . (11)
2.4. R e c e p c j a i s t r u k t u r a p r z e s tr z e n i cech 23 S k ła d o w e x v ty c h w e k to ró w c h ę tn ie b ę d z ie m y tr a k to w a li j a k o liczby x v £ 71 o k re ś la ją c e ilo ściow ą m ia rę o kreślon ej cechy, co p o w o d u je , że p rz e s t r z e ń X t r a k t o w a n a b ę d z ie j a k o n -w y m ia r o w a p rz e s tr z e ń e u k lid e so w a ( X C Tln ). W ta k ie j p r z e s tr z e n i s to s u n k o w o n a jła tw ie j i w n a jb a r d z ie j n a t u r a l n y s p o s ó b m o ż n a b ę d zie p ro w a d z ić w sz y stk ie a n a liz y i rozwra ż a n ia , d l a t e g o p r z e s tr z e ń t a t r a k t o w a n a b ę d zie przez n a s j a k o m od el standardowy.
D l a i lu s tr a c ji p ro w a d z o n y c h ro z w a ż a ń p rz y jm o w a ć b ę d z ie m y d o d a t kow o, że m a m y d o c z y n ie n ia z p r z e s tr z e n ią d w u w y m ia r o w ą ( n = 2), a b y m o ż n a b y ło o d w z o ro w y w a ć ro z w a ż a n e o b ie k ty j a k o p u n k t y n a p ła s z c z y ź nie, zaś w n ie k tó r y c h p r z y p a d k a c h uciekać się b ę d z ie m y n a w e t d o „ p rz e s t r z e n i ” je d n o w y m i a r o w y c h , co oczyw iście nie o d p o w i a d a n a o g ó ł rz e cz y w i
s t e m u z a d a n i u r o z p o z n a w a n ia , a słu ży ć b ę d z ie główrnie t e m u , by w y g o d n ie z a p r e z e n t o w a ć p e w n e p ra w id ło w o ś c i i w sp ó łzależn o ści n a r y s u n k u .
P rzyk ład . N a ry s u n k u 2.1 przedstaw iono, w ja k i sposób cechy obiektów w y z n a c z a ją w sp ó łrz ę d n e p u n k tó w w przestrzeni cech i ja k dochodzi do o d w zoro
w ania o b ie k tu d'1 £ D w p u n k t € X , c h a ra k tery zo w an y przez w spółrzędne ij*
s to p ie ń sza ro ści
ar^(J)--- ę o b i e k t 2
x t o b i e k t 1
T2
X \
o b i e k t 1
x i~i
p o m i a r cech o d w z o ro w u je o b ie k ty
w p u n k t y p rz e s tr z e n i
ś r e d n ic a
o b ie k t 2
Rys. 2.1. R o z p o z n a w a n e obiekty m o g ą być tra k to w a n e ja k o p u n k ty w przestrzeni cech. N a ry s u n k u p o k a z a n o p rz estrz eń cech, w której n a osi poziomej o d k ła d a n a j e s t ś r e d n ic a o b ie k tu , a n a osi pionowej - jego stopień szarości
(*) D a lsz e sz c z e g ó ły n a te n t e m a t - p a tr z : D o d a te k 1.
24 2. Z a d a n ie ro z p o z n a w a n ia i x*2, in te rp re to w a n e (w rozw ażanym n a rysunku 2.1 przykładzie) ja k o średnica obie k tu i jego stopień szarości.
S y t u a c j a , k iedy cechy m o g ą być in te rp re to w a n e j a k o liczby, j e s t n a jk o rz y s tn ie js z a , ja k k o lw ie k nie j e d y n a . C e c h a m i w o g ó ln y m p r z y p a d k u m o g ą być rów nież p o je d y n c z e bity s y g n a liz u ją c e obecność lub brak określonej w łaściw o ści ro z w a ż a n e g o o b ie k tu , a ta k ż e symbole kodowe (n a z w y ) o k re ślające w a rto ś c i cech porzą dk ow ych lub wręcz jakośc iow ych ro z w ażanych o b i e k t ó w ( 1). O czyw iście w t a k i m p r z y p a d k u p rz e strze ń X nie m oże być t r a k t o w a n a j a k o e u k lid e so w a , co je d n a k nie p rz e sz k ad z a we w pro w a d ze n iu p e w n y c h in tu ic ji g e o m e try c z n y c h .
P r z y k ł a d . Na ry s u n k u 2.2 pokazano przestrzeń cech o p a r tą n a d a n y c h b in a r
nych, a n a rysunku 2.3 - przestrz eń cech porządkowych i opisowych. J a k widać ta k ż e i w p rz y p a d k u tych cech możliwe je s t utożsam ianie obiektów z p u n k ta m i w przestrz en i, chociaż przestrzeń t a nie je s t ta k gęsto w ypełn io n a p u n k ta m i, ja k przestrz eń liczb rzeczywistych.
R o d za j i w ła sn o śc i w y b ra n e j p rz e strz e n i cech b a rd z o silnie w p ły w a ją n a d a lsz y to k p ro c e su r o z p o z n a w a n ia . J e s t to z u p e łn ie zro z u m iałe: o b ie k ty d e D m a j ą pote ncj alnie n ieskończenie wiele cech. O d w zo ro w an ie B p ro w a dząc e d o n -w y m ia ro w e j ( n <C oo) p rz e strz e n i cech X zw iąz a n e j e s t zawsze z utr atą części i n f o r m a c j i , z a te m jeśli u t r a c o n a z o sta n ie in fo r m a c ja i s t o t n a z p u n k t u w id z e n ia celów r o z p o z n a w a n ia , a w p rz e strze n i cech uw zględni się w y łą c z n ie cechy m a ło w ażne - to s t r a t y tej nie d a się z re k o m p en so w ać ż a d n y m i p ó ź n ie js z y m i w y siłk am i.
Nie u s t a l o n o d o ty c h c z a s ż a d n y c h ścisłych m e t o d o k re ś la n ia s t r u k t u r y p rz e s tr z e n i cech i jej w y b ó r m a w dużej m ierze c h a r a k te r h e u ry s ty c z n y i a r b itr a ln y , zależny o d w łasności z b io ru D o ra z o d p om ysłow ości tw órcy a lg o r y t m u A . Z a g a d n ie n ie t o b y ło j u ż sy g n a liz o w a n e w p o p r z e d n im rozdziale.
W l i t e r a t u r z e is tn ie je n a te n t e m a t je d y n ie k ilk a ogólnikow ych wskazówek, n a p r z y k ł a d s ze ro k o z n a n a j e s t zasada B r a w e r m a n n a . Z a s a d a t a głosi, że cechy x v m u s z ą być t a k d o b r a n e , a b y w p rz e strz e n i cech X p u n k t y x o d p o w ia d a ją c e o b ie k to m d n a le ż ą c y m d o je d n e j klasy (d £ A ) g r u p o w a ły się w p o s ta c i s k u p is k m ożliw ie m a k s y m a ln ie zw arty ch w e w n ę trz n ie i możliwie n a jb a r d z ie j o d d a lo n y c h o d p o d o b n y c h sk u p isk d la inn ych k la s (2). Z a s a d a
(2 ) L .I. R o z o n o e r o p is a ł tę z a sa d ę o b razo w o w ter» sp o só b , że ró żn ice p o m ięd zy k lasam i w p rz e s trz e n i cech m u s z ą być in n eg o ro d z a ju , n iż ró ż n ic a, ja k a is tn ie je p o m ięd zy g ą b k ą a n a s ą c z ą ją c ą j ą w o d ą.
2.4. R e c e p c j a i s t r u k t u r a p rz e s tr z e n i cech 25 t a j e s t j e d n a k z b y t og ó ln ik o w a , by m ó g ł z niej rzeczyw iście s k o rz y sta ć t w ó r c a m a s z y n y ro z p o z n a ją c e j.
O s t a t n i o w z a g a d n ie n ia c h z w ią z a n y c h z w y b o re m cech i o p t y m a l i z a c j ą s t r u k t u r y p r z e s tr z e n i cech z a is tn ia ły now e fakty. S p o re sza n s e n a ro z w ią z a n ie te g o p r o b le m u w ią z a ć m o ż n a z b a r d z o in te n s y w n ie r o z w ija n y m d z ia łe m s z tu c z n e j in te lig e n c ji, p o ś w ię c o n y m s y s t e m o m e k s p e r t o w y m , w ra m a c h k tó r e g o - b yć m o ż e - w y p ra c o w a n e z o s t a n ą ta k ż e m e to d y a u to m a ty c z n e g o w y b o r u cech w z a d a n ia c h r o z p o z n a w a n ia . P e w n e n a d z ie je w iązać m o ż n a t a k ż e z p o w s t a j ą c ą o b e c n ie d z ie d z in ą te c h n ik i, z w a n ą i nz yn te rt ą wiedzy.
d z iu ry
o b e c n e
b ra k
i i o b i e k t 1
— !--- " f —
o b i e k t 1
1 o b i e k t 2
T
o b ie k t 2
nie ta k w y p u k ło ś ć
Rys. 2.2. W p rz e strz en i cech m o ż n a umieszczać także obiekty op isan e cechami b in a rn y m i (o zn ac zają cy m i obecność lub b rak określonej własności). N a rysunku p rz e d s ta w io n o p rz estrz eń cech, w której n a osi poziomej oznaczono w ypukłość linii k o nturow ej o b ie k tu , a n a osi pionowej - obecność lub b rak w ew nętrznych k on tu ró w
D o ty c h c z a s s t a l e z a k ła d a liś m y , że w szy stk ie cechy Xj ( j = 1 ,2 , . . . , n ) s ą d o s t ę p n e ró w n o c ze śn ie. T y m c z a s e m p roces p o z y s k iw a n ia cech m o ż e w ią zać się z p e w n y m i t r u d n o ś c i a m i ( n a p r z y k ła d k o s z ta m i) i zw ykle j e s t roz
ło ż o n y w czasie.
P r z y k ł a d . W d ia g n o sty ce m edycznej poszczególne b a d a n ia , których w yni
kiem s ą kolejno w y k ry w a n e s y m p to m y (rozw ażane tu ja k o cechy, będące p o d s ta w ą ro z p o z n a w a n ia ) s ą uciążliwe d la p a c je n ta i obciążające d la placówki dia-
2 6 2. Z a d a n ie ro z p o z n a w a n ia
Rys. 2.3. P rz e strz e ń cech może być o p a r t a na cechach m ających c h a ra k te r kodów o pisujących właściwości obiektów . N a osi poziomej odłożono kody odpow iadające liczbie osi sym etrii o b ie k tu (w skali: je d n a , dwie, dużo), a n a osi pionowej - kody o d p o w ia d a ją c e wielkości o biektu (w skali: mały, średni, duży)
gnozującej. Jeśli zatem można podjąć decyzję na podstawie analizy tylko niektó
rych cech (> = 1,2, . . . , m ), to wówczas można sobie (i pacjentowi) zaoszczę
dzić tru d u określania symptomów z m+ i, co może stanowić istotny zysk i zwykle przyspiesza rozpoznanie.
Form atlna s t r u k t u r a o d w z o r o w a n ia B d la o m a w io n e g o t u częściowego (k o le jn e g o ) o k r e ś la n ia cech m o że być w zasa d zie r o z w a ż a n a j a k o id e n ty c z n a ze s t r u k t u r ą p o d a n ą w z o rem (8), g d y ż ró ż n ic a p o le g a je d y n ie n a liczbie w y
m ia r ó w p rz e s tr z e n i X . J e d n a k d l a z a a k c e n to w a n ia o d m ie n n o ś c i ro z w a ż a nego t u p o d e jś c ia o d w o ła m y się p o n o w n ie d o z ap isu o p o s ta c i 2X , o k re ś la ją c e g o (w t y m p r z y p a d k u ) z b ió r w szystkich p o d z b io ró w ( p o d p r z e s trz e n i)
w e k to ro w ej p rz e s tr z e n i cech X . W p ro w a d z im y ta k ż e w y różn ik e d l a zazna-