• Nie Znaleziono Wyników

Reprezentacja obiektów za pomocą atrybutowanych IE grafów

W dokumencie Index of /rozprawy2/10347 (Stron 48-61)

4 Model reprezentacji sygnatur odręcznych z wykorzystaniem technik grafowych

4.2 Reprezentacja obiektów za pomocą atrybutowanych IE grafów

Na wstępnie tego podrozdziału omówiony zostanie sposób tworzenia reprezentacji scen w postaci adekwatnego opisu w formie grafu IE. Opis taki zostanie następnie wykorzystany do przechowywania informacji o strukturze podpisów odręcznych. Z formalnego punktu widzenia proces definiowania reprezentacji grafowej powinien przebiegać w następujących etapach45:

45 Opracowanie na podstawie prac prof. M. Flasińskiego [48] oraz szczegółowej dyskusji zawartej w pracy M. Barana [6] .

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 49  Reprezentacja poddawanego analizie obrazu w postaci grafu HEDG, (por. definicja A.1), gdzie  określa relację kierunku pomiędzy parami sąsiadujących obiektów reprezentowanych przez wierzchołki grafu,

 Sprawdzenie czy graf jest grafem OS, HOS (definicja A.6) lub w razie potrzeby przekształcenie do tej postaci. Istotne są tutaj warunki nałożone na zbiór , czyli uporządkowanie w zbiorze etykiet zgodnie z relacją < oraz istnienie odwrotności dla każdej z etykiet. Jeśli nie jest możliwe przekształcenie grafu H do postaci grafu OS stwarza to przesłankę do stwierdzenia, iż może nie być możliwe opisanie anali-zowanej sceny w sposób znaczeniowo równoważny przy użyciu grafu IE,

 Przekształcenie grafu H do postaci grafu GIE – zakładając, że HOS jest to realizowane w następujących krokach:

o Wybór wierzchołka startowego (uzależniony od kontekstu semantyczne-go danej sceny np. może to być składowa pierwotna o minimalnych współrzędnych kartezjańskich),

o Rozpięcie w grafie G drzewa metodą BFS,

o Nadanie indeksów wierzchołkom grafu. Wierzchołek startowy otrzymuje numer 1 a wierzchołki z nim sąsiadujące odpowiednio numery 2, 3, ... , kolejność numerów jest determinowana przez porządek ustanowiony w zbiorze etykiet. Następnie procedura ta jest kontynuowana dla każdego wierzchołka posiadającego niezaindeksowanych sąsiadów przy czym w pierwszej kolejności jest to wykonywane dla wierzchołków o najniż-szych numerach,

o Odwrócenie kierunku krawędzi zgodnie z kierunkiem rozpinania drzewa. Krawędzi muszą być skierowane od wierzchołków o indeksie niższym do wierzchołków o indeksie wyższym. W razie potrzeby wykorzystuje się fakt istnienia odwrotności dla każdej z etykiet (własność OS grafu).

Zastosowanie opisanej procedury gwarantuje uzyskanie jednoznacznie zaindeksowanego grafu IE spełniającego warunki definicji A.7. Dodatkowo sposób indeksowania zapewnia uzyskanie pewnego porządku liniowego w grafie, który następnie determinuje kolejność wywodu w gramatyce ETPL(k) (zgodnie z drzewem rozpiętym w grafie). Pozwala to na

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 50 uzyskanie efektywnego obliczeniowo mechanizmu badania izomorficzności tego rodzaju struktur (por. rozdz. 2.2).

W celu skonstruowania reprezentacji strukturalnej badanej sygnatury szkielet jest de-komponowany na składowe pierwotne, do których zalicza się każdą krzywą leżącą pomię-dzy punktami krzyżowania się oraz końcami linii szkieletu (por. rys. 4.1d). W kolejnym etapie spójne fragmenty szkieletu (złożone grafemy) są opisywane w formie grafów IE. Każdemu grafemowi odpowiada oddzielny graf opisujący jego strukturę. Węzły grafu re-prezentują składowe pierwotne a krawędzie relację bezpośredniego sąsiedztwa (incyden-cja) krzywych (por. rys. 4.2).

a) b) c a d e23 c e3 a d d 1 2 3 4 5 2 5 e1 d 1 e0 a 3 4 e2 e0 e1 a e1 c) d)

Rysunek 4.2 Reprezentacja strukturalna scen na poziomie lokalnym z wykorzystaniem opisu grafowego: a-b)

fragmenty szkieletu z rys. 4.1c, c-d) reprezentacja strukturalna tych fragmentów w postaci grafów IE.

Krawędziom grafu przypisywane są odpowiednie etykiety kierunkowe (por. rys. 4.3) określające relacje przestrzenne pomiędzy środkami ciężkości sąsiadujących krzywych. Precyzja określenia kierunku jest definiowana z dokładnością do 15 stopni kątowych. Gdyby zaistniała taka potrzeba można zawsze w łatwy sposób dokonać redefinicji zestawu etykiet w zakresie zwiększenia precyzji odwzorowywania kierunku. Węzeł startowy (o indeksie 1) reprezentuje składową pierwotną położoną najbliżej lewego górnego rogu sce-ny.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 51 e3 e6 < e5 < ... < e0 ... < e18 ... < e12 < ... < e7 e2 e1 e0 e6 e9 e12 e15 e18 e21 e14 e13

Rysunek 4.3 Uporządkowany zbiór etykiet krawędziowych określających relacje przestrzenne pomiędzy

elementami sceny.

Reprezentacja grafowa sceny (por. rys. 4.2 c-d) wymaga jeszcze uzupełnienia o etykiety wierzchołkowe odpowiadające poszczególnym prymitywom obrazowym46

. Ze względu na w zasadzie nieograniczoną liczbę możliwych kształtów krzywych utożsamianych ze skła-dowymi pierwotnymi, niemożliwym a wręcz niecelowym jest opisanie każdego elementu osobną etykietą. Zamiast tego zaproponowano wyróżnienie czterech klas równoważności, z których każda jest reprezentowana przez zbiór wzorcowych kształtów pokazanych na rys. 4.4. W ten sposób każdej składowej przyporządkowywana jest etykieta węzłowa wy-znaczona ze zbioru V {a,b,c,d}.

Klasyfikacja jest dokonywana poprzez obliczanie podobieństwa analizowanej krzywej do poszczególnych wzorców klas. Wierzchołek grafu reprezentujący daną składową otrzymuje etykietę przynależną wzorcowi klasy, do którego kształtu jest najbardziej zbli-żony47

(najbliższy w sensie przyjętej definicji odległości, metryki). Aby zwiększyć repre-zentatywność takiego przyporządkowania każdorazowo obiekty wzorców klas są skalowa-ne do rozmiarów klasyfikowaskalowa-nego obiektu. Skalowanie to odbywa się na podstawie zna-jomości długości krzywej (w pikselach) oraz współczynników Fereta48

określających wy-dłużenie obiektu w płaszczyźnie pionowej i poziomej (por. rys. 4.5).

46

Określenia „składowa pierwotna” oraz „prymityw obrazowy” są w niniejszej pracy używane zamiennie. 47 Klasyczny przykład klasyfikacji w oparciu o metody minimalno-odległosciowe, NN (ang. Neareast Ne-ighbour) [147] .

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 52

a

b

c

d

Etykieta Kształty reprezentujące klasy

Rysunek 4.4 Zbiór etykiet wierzchołkowych wraz z elementami wzorcowymi dla każdej z klas

równoważno-ści.

Tak skonstruowany opis grafowy zawiera informację o strukturze przestrzennej opisy-wanych fragmentów podpisu (sceny). Aby poszerzyć ten opis o parametry określające wła-sności i cechy reprezentowane na poziomie lokalnym (cechy geometryczne poszczegól-nych składowych, krzywych) wykorzystano zmodyfikowany formalizm w postaci atrybu-towanych grafów IE49

[103] (definicja A.24), gdzie z etykietami węzłów i krawędzi może być skojarzona pewna informacja semantyczna.

Definicja 4.1 (A.24, [103]) – atrybutowany graf IE

Atrybutowanym grafem IE (ang. attributed, aIE) nazywamy siódemkę G = (V, Ε, Σ, Γ, , V, E)

gdzie:

a) G' = (V, Ε, Σ, Γ, ) jest grafem IE zgodnie z definicją A.7 (z dodatku A),

b) V, E są odwzorowaniami atrybutującymi odpowiednio wierzchołki i krawędzie grafu: V : V → A =

E : E → B =

spełniającymi warunki:  v V V (v) (v) e = (u, , w) E E (e) 

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 53 Ponadto zbiór wartości, jakie dla elementu x V E może przyjmować (odpowiednia)

funkcja atrybutująca jest postaci x

i

   

1 2, gdzie i jest ilością atrybutów związanych z elementem x a xj jest przestrzenią wartości, jakie może przyjąć j-ty atrybut.

W proponowanym rozwiązaniu informacja dodatkowa w postaci wektora reprezentuja-cego geometryczne własności składowych pierwotnych jest przypisana jedynie do wierz-chołków grafu, czyli odpowiednie funkcje atrybutujące krawędzie i węzły są postaci:

  E E :  i

  

V :V A , gdzie zbiór wartości dla funkcji atrybutującej węzły

jest określony w przestrzeni liczb zespolonych 17

C

 . Przykład takiej reprezentacji gra-fowej dla podpisu z rys. 4.1 złożonego z dwóch grafemów znajduje się na rys. 4.5.

a d d 2 5 d e23 1 a 3 4 e2 e0 A 00 A 11 A 20 A 66 ... ... ... A 00 A 11 A 20 A 66 ... ... ... (a) (b) e23 e3 1 2 3 4 5 e1 e1 R F R F c a d c a e1 A 00 A 11 A 20 A 66 ... ... ... R F

Rysunek 4.5 Reprezentacja strukturalna podpisu z rys. 4.1 w postaci atrybutowanego grafu IE: (a) lewy

grafem, (b) prawy grafem.

Każda węzeł jest skojarzony w właściwym wektorem parametrów opisującym kształt krzywej. Zestaw parametrów składa się podzbioru momentów Zernike oraz współczynnika Fereta (por. rozdz. 4.1) stąd odpowiedni wymiar przestrzeni atrybutowania. Gdyby zaist-niała taka potrzeba model można uzupełnić w analogiczny sposób o informację seman-tyczną związaną z krawędziami grafowymi. W rozważanym przypadku zaproponowany model w opisanej formie wydaje się być jednak w zupełności wystarczający50.

50 Informacja taka mogłaby być związana np. ze wskazaniem względnej odległości pomiędzy obiektami składowymi, pomiędzy którymi zachodzi reprezentowana przez etykietę relacja przestrzenna.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 54

4.3 Reprezentacja podpisów jako scen z wykorzystaniem grafów

hie-rarchicznych

W większości przypadków podpisy odręczne składają się z kilku fragmentów (grafemów) wizualnie od siebie odseparowanych. Może to być od kilku do nawet kilkunastu składo-wych, w zależności od rodzaju podpisu (pełnobrzmiący, uproszczony, oparty o ideogramy np. kanji) o różnym stopniu złożoności. Aby uchwycić w ujęciu globalnym przestrzenne ułożenie tych złożonych składowych (spójnych fragmentów podpisu) względem siebie w niniejszym podejściu również wykorzystywany jest opis grafowy w postaci grafu hierar-chicznego. Proponowana struktura jest określona zgodnie z definicją 4.1.

Definicja 4.2

Hierarchicznym grafem IE (ang. Hierarchical IE graph, HIE) zbudowanym nad językiem L nazywamy piątkę HIE(L) = (V, Ε, Σ, Γ, ), gdzie:

V jest skończonym, niepustym zbiorem wierzchołków grafu będących IE grafami, którym zostały przypisane w sposób jednoznaczny indeksy, czyli V (v1,,vn),

N

n , gdzie i1 , ,n viL a L jest językiem generowanym przez gramatykę G, )

(G

L

L , gdzie GacETPL(k)51 ,

Σ jest skończonym, niepustym zbiorem etykiet wierzchołkowych, Γ jest skończonym, niepustym zbiorem etykiet krawędziowych,

Ε jest zbiorem krawędzi grafu postaci (v, λ, w), gdzie v, w V, λ Γ i indeks v jest mniejszy niż indeks w,

: V → Σ jest funkcją etykietującą wierzchołki.

Opis grafowy jest konstruowany, jako metastruktura zbudowana nad zadanym grafem bazowym (w tym przypadku grafem IE) w ten sposób, że wierzchołki grafu

51 Gramatyka ETPL(k) sterowana atrybutowo (ang. attribute controlled ETPL(k)), definicja A.26, P. Oleksik [103] .

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 55 go są podgrafami grafu bazowego52 [103]. Inaczej mówiąc, węzły tego grafu reprezentują poszczególne grafemy, a etykiety krawędzi określają relacje przestrzenne między nimi (por. rys. 4.6). W efekcie powstaje struktura dwupoziomowa pozwalająca w efektywny sposób reprezentować całą złożoność podpisu. Poziom I (graf hierarchiczny) odpowiada za globalne elementy sceny natomiast poziom II opisuje dokładnie strukturę poszczególnych grafemów (atrybutowany graf IE) wraz wbudowaną informacją semantyczną odnoszącą się do kształtu poszczególnych składowych pierwotnych (wektory kształtu oparte o momenty Zernike’a). e23 1 2 A 00 A 11 A 20 A 66 ... ... ... A 00 A 11 A 20 A 66 ... ... ... e23 e3 1 2 3 4 5 e1 e1 R F R F c a d c a a d d 2 5 d e23 1 a 3 4 e2 e0 e1

Rysunek 4.6 Hierarchiczna reprezentacja podpisu z rys. 4.1 - graficzna wizualizacja struktury I (graf IE) i II

(atrybutowane grafy IE) poziomu.

Etykiety krawędziowe przypisywane są na analogicznej zasadzie jak dla grafów repre-zentujących części składowe podpisu. Wykorzystywany jest identyczny zbiór etykiet kie-runkowych (por. rys. 4.3) z tą różnicą, że kierunki są wyznaczane pomiędzy środkami ciężkości całych grafemów. Trudności pojawiają się przy ustalaniu etykiet dla węzłów grafu. Z punktu widzenia analizy syntaktycznej (gramatyki ETPL(k) wywodzą się z grama-tyk NLC – Node Label Controlled) powinny to być egrama-tykiety wnoszące pewną informację na temat struktur, które są przez nie reprezentowane co następnie jest wykorzystywane w pro-cesie parsingu [48], [50]. W proponowanym rozwiązaniu etykiety są bezpośrednio skoja-rzone z informacją o rozmiarze grafu (por. tabela 4.7).

52 Koncepcje wykorzystania hierarchicznych struktur grafowych bazujących na grafach IE do opisu złożo-nych scen są obecne w literaturze przedmiotu m.in. u Oleksika [103] – grafy IE + grafy VE oraz Barana [6] – języki drzewowe TGraph + grafy IE.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 56

Tabela 4.7 Zbiór etykiet wierzchołkowych dla grafu I poziomu.

Liczba węzłow w

grafie II poziomu Etykieta

1 - 3 a 4 - 6 b 7 – 10 c 11 – 15 d 16 – 20 e 21 – 25 f 26 – 30 g

Rozmiar grafu jest tu rozumiany w sposób uproszczony, jako ilość węzłów w jego strukturze. Podobny sposób etykietowania został z powodzeniem wykorzystany dla struk-tur drzewowych TGraph w [6]. W zależności od potrzeb liczebność zbioru etykiet może być rozszerzona ponad zestaw przedstawiony w tabeli 4.7. Ostateczna postać grafu hierar-chicznego z rys. 4.6 po uwzględnieniu opisanego schematu etykietowania wierzchołków z ukrytą warstwą poziomu II jest przedstawiona na rys. 4.7.

b e23 1

b 2

Rysunek 4.7 Ostateczna forma hierarchicznej reprezentacji podpisu z rys. 4.1 z uwzględnieniem etykiet

wę-złowych dla grafu I poziomu (warstwa II poziomu została ukryta).

Reguły konstruowania reprezentacji hierarchicznej

Dla potrzeb reprezentacji strukturalnej sceny na poziomie globalnym zaproponowano ści-sły schemat konstrukcji grafu hierarchicznego tak, aby uzyskany graf był jednoznaczny i był prawidłowym grafem IE, czyli spełniał kryteria wynikające z definicji A.7. Reguły budowania reprezentacji grafowej przedstawia w uproszczeniu rys. 4.8. Jako przykład zo-stał wybrany napis ideograficzny, aby możliwe było zilustrowanie metody dla sceny o większej ilości elementów globalnych (grafemów) rozmieszczonych przestrzennie.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 57 a) d) c) e) 36 53 84 62 62 56 1 1 2 f) b) e18 g) 6 7 1 3 2 e2 e18 e18 e22 e0 e23 103 113 1 3 2 e18 e2 e22 e18 99 e1 4 5 4 5

Rysunek 4.8 Kolejne etapy budowy reprezentacji grafowej dla elementów globalnych sceny na podstawie

środków ciężkości grafemów: a) oryginalny obraz wejściowy, napis oparty o ideogramy (kanji), b) szkielet obrazu oryginalnego, c) etap pierwszy – wyznaczenie startowego węzła grafu (element oznaczony okręgiem), położenie środków ciężkości poszczególnych fragmentów szkieletu oznaczone jest w postaci czarnych punk-tów, d) etap drugi – wyznaczenie następników dla węzła grafu o indeksie 1 na podstawie relacji sąsiadowa-nia oraz odległości elementów, e) etap trzeci - wyznaczenie etykiet kierunkowych krawędzi pomiędzy zaak-ceptowanymi węzłami grafu oraz wyznaczenie następników dla węzła o indeksie 2, f) etap czwarty - wyzna-czenie etykiet kierunkowych krawędzi pomiędzy zaakceptowanymi węzłami grafu oraz wyznawyzna-czenie następni-ków dla węzłów o indeksach 3,4 i 5, g) etap czwarty – ostateczna reprezentacja sceny, zostały uwzględniowe wszystkie elementy sceny oraz przypisane indeksy węzłów i etykiety krawędzi.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 58

CL (ang. candidate) postaci CLi=[wi, gi], gdzie wi oznacza współrzędne środka ciężkości elementów globalnych (grafemów), a gi graf IE reprezentujący strukturę grafemu (element lokalny),

FL (ang. fixed) postaci FLi=[wi, k, gi], gdzie k oznacza indeks wierzchołka grafu hierarchicznego przydzielony danemu grafemowi,

AL (ang. accepted) postaci Ali=[n(k), gi], gdzie n(k) oznacza opis charakterystycz-ny wierzchołka o etykiecie terminalnej n i indeksie k.

Zakładamy, iż na początku mamy do dyspozycji uzupełnioną listę CL z kompletną in-formacją o środkach ciężkości poszczególnych złożonych elementów sceny i powiązanych z nimi grafów IE. Proces budowania reprezentacji opiera się na wykonaniu poniższych kroków:

1. i0

2. Znajdź element startowy, dla którego odległość od początku układu współrzęd-nych jest najmniejsza, usuń z listy CL i umieść na liście FL nadając mu indeks

i

k 

3. Dla każdego elementu f listy FL wykonaj: i

a. Wyznacz element min z listy CL najbliższy w sensie odległości do f i b. Wyznacz zbiór Di elementów z listy CL, których odległość od elementu

i

f jest nie większa niż A%53 odległości od min (A>=100%)

c. Dla wszystkich tych elementów dj zbioru Di wyznacz etykiety kierun-kowe fidj

d. Jeśli istnieją elementy w zbiorze Di posiadające identyczne etykiety kierunkowe do f z dokładnością do i 1 symbolu etykiety pozostaw tylko element najbliżej położony

e. Jeżeli pomiędzy elementem f z listy FL a powiązanym z nim elemen-i tem djze bioru Di znajduje się inny element f z listy FL to usuń taki k następnik dj z listy. Sprawdź na podstawie kierunku z dokładnością 1 symbolu etykiety.

53 W zależności od wartości parametru A uzyskuje się mniej lub bardziej skomplikowane struktury grafowe na poziomie globalnym wskutek tego, iż wraz ze wzrostem parametru A zwiększa się zasięg obszaru, z któ-rego pozyskiwane są grafem kandydujące na potencjalne następniki analizowanego węzła grafu.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 59 4. Dla każdego elementu f listy FL w kolejności rosnących indeksów i k przy-dziel elementom dj zbioru Di kolejne indeksy kj izachowując kolejność numeracji wierzchołków zgodnie z uporządkowaniem zbioru etykiet kierunko-wych (por. rys. 4.3)

5. Elementy f listy FL przesuń do listy AC konstruując opisy charakterystyczne i na podstawie odpowiadających im zbiorów Di

6. Elementy zbiorówDi umieść na liście FL

7. Jeśli lista FL jest niepusta kontynuuj od kroku [3] w przeciwnym wypadku STOP

Zbudowanie reprezentacji sceny na poziomie globalnym z wykorzystaniem tego algo-rytmu gwarantuje uzyskanie prawidłowego grafu IE. Istotny jest również fakt, iż – podob-nie jak w przypadku grafów lokalnych opisujących grafemy – sposób rozpinania grafu powoduje uzyskanie struktury niezawierającej krawędzi łączących wierzchołki na tym samym poziomie grafowym (definicja A.10). Taka własność grafów na obydwu pozio-mach strukturalnego opisu sceny znacząco uprości proces automatycznego generowania reguł gramatyki (por. rozdz. 5.3).

W tym miejscu należy zwrócić uwagę na jeszcze jeden aspekt formalny związany z za-proponowaną strukturą hierarchiczną. Proponowany model zgodnie z definicją 4.2, zakłada istnienie jednego bazowego języka L, do którego należą grafy skojarzone z etykietami wierzchołkowymi I poziomu. W praktyce takie ograniczenie może nie być możliwe do spełnienia w pewnych szczególnych przypadkach [47], [50] a jeśli nawet to implikowałoby to konieczność budowania bardzo złożonej gramatyki opisującej słowa grafowe należące do wszystkich węzłów grafu. Tak złożona gramatyka znacząco komplikowałaby efektywną analizę syntaktyczną tego typu struktur. Aby rozwiązać ten problem zaproponowane zosta-ło rozwiązanie w postaci grafu hierarchicznego rozpiętego na wielu językach – definicja 4.3.

Definicja 4.3

Hierarchicznym grafem IE (ang. Hierarchical IE graph, HIE) zbudowanym nad językami

n L L1,, nazywamy piątkę ( , , ) ( , , , , ) 1V E   H n L L IE , gdzie:

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 60 V jest skończonym, niepustym zbiorem wierzchołków grafu będących IE grafami, którym zostały przypisane w sposób jednoznaczny indeksy takimi, że

) , , (v1 vj

V   ,L(L1,,Ln), j,nN, gdzie dla każdego i 1 , ,j istnieje

n

r 1 , , takie, że viLr a L jest językiem generowanym przez gramatykę r G , r )

( r

r

r L G

L  , gdzie GracETPL(k),

Σ jest skończonym, niepustym zbiorem etykiet wierzchołkowych, Γ jest skończonym, niepustym zbiorem etykiet krawędziowych,

Ε jest zbiorem krawędzi grafu postaci (v, λ, w), gdzie v, w V, λ Γ i indeks v jest mniejszy niż indeks w,

: V → Σ jest funkcją etykietującą wierzchołki.

Sama definicja nie ogranicza wartości współczynnika n określającego liczbę języków formalnych, nad którymi zbudowany jest dana struktura grafowa oraz nie precyzuje czy dany węzeł może być opisywany przez więcej niż jeden język Li54. Kwestie te należy roz-strzygnąć w trakcie projektowania analizatora syntaktycznego dla tego typu struktur albo nakładając dodatkowe ograniczenia na postać grafu zgodnie z wymaganiami. Dla potrzeb reprezentacji struktury podpisów odręcznych zakłada się wykorzystanie wariantu, w któ-rym liczba języków jest równoliczna z ilością węzłów w grafie, co bezpośrednio przekłada się na założenie, iż każdy graf II poziomu reprezentuje niezależny język, czyli indeks języ-ka jest tożsamy z indeksem węzła viLi. Formalnie można to opisać w postaci definicji 4.4.

Definicja 4.4

Zupełnym hierarchicznym grafem IE (ang. complex HIE, cHIE) zbudowanym nad języ-kami L1,,Ln nazywamy szóstkę ( , , ) ( , , , , ) 1V E   H n L L IE , gdzie: a) 

m i i n L L L L .. 1 1, , ) (

 jest zbiorem języków bazowych

54 Dyskusja na temat struktur hierarchicznych opartych na wielu językach grafowych znajduje się w pracy M. Barana [6] . Prześledzono tam analogiczny problem analizy syntaktycznej drzew hierarchicznych opartych na wielu językach formalnych dla kilku wariantów teoretycznych analizy syntaktycznej.

ROZDZIAŁ 4:MODEL REPREZENTACJI SYGNATUR ODRĘCZNYCH ... 61 b)

m i i K L .. 1

jest zbiorem klas równoważności zdefiniowanym na L

c) ilość klas równoważności m #V oraz dla każdego viV istnieje bijektywne przyporządkowanie postaci viKiLi

d) V,E,,isą określone jak dla grafu HIE (definicja 4.2).

4.4 Reprezentacja kolekcji sygnatur w postaci losowych grafów

W dokumencie Index of /rozprawy2/10347 (Stron 48-61)