• Nie Znaleziono Wyników

Wnioskowanie gramatyki hierarchicznej TLsw ETPL(n,k) na pod- pod-stawie IE grafów badanych cech

W dokumencie Index of /rozprawy2/10347 (Stron 131-136)

5 Rozpoznawanie podpisów w oparciu o bazę wzorców

Definicja 5.10 – gramatyka TLswETPL(n,k) sterowana językami bazowymi

5.4 Wnioskowanie gramatyki hierarchicznej TLsw ETPL(n,k) na pod- pod-stawie IE grafów badanych cech

... ... R F a (1.0) 1 d (1.0) 1 {e0 (0.5),e23 (0.5)} Z = A B Vij = [V11,V12] (1) A [V21,V22] (2) B 2 C 3 D [V31,V32] a (1.0) 1 (4) D [V51,V52] (3) C d (1.0) 1 [V41,V42] C1({e0 (0.5),e1 (0.5)}, in)

= {({a(1.0)},{c(1.0)},{e0 (0.5),e1 (0.5)}, in)}

C2({e23 (1.0)}, in)

= {({d(1.0)},{c(1.0)},{e23 (1.0)}, in)}

C4({e0 (0.5),e23 (0.5)}, in)

= {({a(1.0)},{d(1.0)},{e0 (0.5),e23 (0.5)}, in)} C3({e3 (0.5),e4 (0.5)}, in)

= {({d(1.0)},{d(1.0)},{e3 (0.5),e4 (0.5)}, in)}

c (1.0)

{e0 (0.5),e1 (0.5)}

1

{e23 (1.0)}

{e3 (0.5),e4 (0.5)}

Rysunek 5.38. Produkcje gramatyki GII2 klasy ac-swETPL(k) uzyskane za pomocą automatycznego algoryt-mu wnioskowania dla atrybutowanego losowego grafu IE z rys. 4.12a (drugiego w kolejności), linią przery-waną zaznaczone są powiązania wierzchołków terminalnych z wektorami paramatrów kształtu – zbiory atry-butów.

5.4 Wnioskowanie gramatyki hierarchicznej TLsw ETPL(n,k) na

pod-stawie IE grafów badanych cech

Mając do dyspozycji mechanizm wnioskowania dla języków losowych rozważmy jak można go wykorzystać do generacji języków opartych o grafy hierarchiczne HrIE opisują-ce wzoropisują-ce podpisów w postaci statystycznej struktury dwuwarstwowej. Wejściem dla ta-kiego systemu wnioskowania jest zbiór hierarchicznych grafów HIE w liczbie m, z których każdy opisuje jeden wzorzec podpisu (por. rozdz. 4.2 i 4.3). W pierwszym kroku następuje

ROZDZIAŁ 6:OPIS IMPLEMENTACJI SYSTEMU DO GRAFOWEJ ANALIZY PODPISÓW ODRĘCZNYCH 132 unifikacja strukturalnie izomorficznych grafów reprezentujących wzorce na obudwu po-ziomach opisu (warstwa I hierarchiczna i warstwa II grafowa) jak to zostało opisane w rozdz. 4.4. W wyniku tej procedury otrzymujemy zbiór grafów losowych HrIE, z których wierzchołkami są powiązane kolekcje atrybutowanych losowych grafów arIE. Na tym eta-pie dla grafów hierarchicznych HrIE można wykorzystać algorytm wnioskowania opisany w rozdziale wcześniejszym, ponieważ grafy hierarchiczne są pełnoprawnymi losowymi grafami IE. Algorytm ten musi być jednak poszerzony o mechanizmy wnioskowania nie tylko na poziomie hierarchicznym, ale również w warstwie II poziomu dla losowych (atry-butowanych) grafów IE II poziomu powiązanych z wierzchołkami hierarchicznymi. Aby przedstawić postać formalną tego algorytmu wprowadźmy następujące oznaczenia:

P- wnioskowany zbiór produkcji hierarchicznej gramatyki grafowej klasy lcTLs(w)ETPL(k)

R(VR,ER,,,R)– losowy graf hierarchiczny HrIE (zupełny) będący słowem wejściowym algorytmu wnioskowania,

S (VS,ES,,,S)– losowy graf hierarchiczny HrIE (zupełny) redukowany w kolejnych etapach wnioskowania,

G- kolekcja gramatyk II poziomu ac-s(w)ETPL(k).

Pozostałe oznaczenia są określone analogicznie jak w przypadku algorytmu z rozdz. 5.3. Poniżej przedstawiono jedynie te procedury, które zmieniają swoje działanie lub są nowym elementem niewystępującym w przypadku klasycznych losowych grafów IE:

RunInferenceRandomIE(S, i, G) – uruchamia system wnioskujący dla kolejnych (atrybutowanych) losowych grafów IE II poziomu skojarzonych z terminalnym wierzchołkiem o indeksie i redukowanego grafu hierarchicznego S i uzyskane gra-matyki umieszcza w zmiennej G,

ConstructNCTL(S, i, G, NCTL, PCC) – w zmiennej NCTL umieszcza znormali-zowany graf CTL zaczepiony w wierzchołku o indeksie i grafu S a w zmiennej PCC kolekcję zbiorów PCC dla wierzchołków grafu NCTL (z pominięciem wierz-chołka zaczepienia), dodatkowo procedura musi zapewnić powiązanie wierzwierz-chołka zaczepienia grafu NCTL z kolekcją gramatyk II poziomu uzyskanych z mechani-zmu wnioskującego niższego rzędu i przekazanych do procedury poprzez zmienną G.

ROZDZIAŁ 6:OPIS IMPLEMENTACJI SYSTEMU DO GRAFOWEJ ANALIZY PODPISÓW ODRĘCZNYCH 133 Formalna postać algorytmu wnioskowania dla grafów hierarchicznych jest przedstawiona na rys. 5.39: S:=R; P=Ø; SetNodeLevels(S); repeat PCC=Ø; NCTL=Ø; G=Ø; i := GetMaxTermIndex(S); if i=1 then Z := S; {aksjomat gramatyki} else begin RunInferencerandomIE(S,i,G); ConstructNCTL(S,i,G,NCTL,PCC); CD := GiveCD(S,i); PC := MakePC(S,i); ComposeProduction(P,NCTL,CD,PC,PCC); RemoveNCTL(S,i,NCTL,NN); end until i=1;

Rysunek 5.39. Algorytm wnioskowania reguł nieznanej gramatyki hierarchicznej lcTLswETPL(k) dla słowa

wejściowego w postaci losowego grafu hierarchicznego IE.

Działanie algorytmu jest następujące - dla każdego grafu losowego HrIE uruchamiamy algorytm wnioskowania, który ustalając postać produkcji dla danego wierzchołka jedno-cześnie uruchamia proces wnioskowania dla powiązanych z tym wierzchołkiem k grafów losowych II warstwy. Należy także pamiętać, iż w każdym kroku wnioskowania są dodat-kowo wykonywane tzw. akcje semantyczne, czyli wykonywane przy okazji procedury zbierające informacje na temat dodatkowych danych skojarzonych z grafami wejściowymi. Dla gramatyki hierarchicznej akcje te będą uzupełniać tablice powiązań gramatyk II po-ziomu z odpowiednimi wierzchołkami prawych stron produkcji. Dla gramatyk II warstwy (grafowych) akcje semantyczne zajmują się gromadzeniem i kojarzeniem zbiorów atrybu-tów z konkretnymi grafami produkcji.

Cały algorytm wnioskowania jest procesem dosyć złożonym. Skomplikowane procedu-ry (złożoność dla wnioskowania gramatycznego rzędu O(n2)) są wykonywane wielokrotnie

ROZDZIAŁ 6:OPIS IMPLEMENTACJI SYSTEMU DO GRAFOWEJ ANALIZY PODPISÓW ODRĘCZNYCH 134 i dla wielu grafów na wszystkich poziomach. Spróbujmy oszacować złożoność oblicze-niową takiego procesu. W tym celu załóżmy, iż na starcie dysponujemy m grafami HIE reprezentującymi wzorce składającymi się maksymalnie z n wierzchołków warstwy hierar-chicznej a w każdym wierzchołku grafu HIE jest osadzony graf aIE o maksymalnej ilości wierzchołków k. Z racji tego, iż nie do przewidzenia jest sposób podziału tych grafów na kolekcje (por. rozdz. 4.4) załóżmy przypadek najbardziej pesymistyczny, który w praktyce nie zachodzi a mianowicie, iż otrzymamy m grafów losowych a każdy z nich n grafów II warstwy osadzonych w każdym wierzchołku. W takie sytuacji koniecznym byłoby prze-prowadzenie wnioskowania gramatyk dla m*n grafów losowych II warstwy, gdzie koszt obliczeniowy jednej procedury wnioskowania wynosi O(k2). Dodatkowo należy doliczyć narzut obliczeniowy m*O(n2) dla procedur wnioskowania gramatyk w warstwie hierar-chicznej. Łącznie otrzymujemy m*n*k2

+m*n2, która to suma jest dosyć trudna do oszaco-wania. Zakładając najbardziej pesymistyczny przypadek i szacując od góry można w przy-bliżeniu stwierdzić (ze względu na pierwszy człon sumy), iż koszt obliczeniowy jest rzędu O(x4), gdzie x reprezentuje wartość maksymalną spośród parametrów (m, n, k). Dla przy-padku zakładającego wnioskowanie gramatyki na podstawie pojedynczego grafu HIE oszacowanie złożoności obliczeniowej upraszczałoby się do zależności 1*n*k2

+1*n2 co w efekcie daje przy pesymistycznym założeniu n~k wartość rzędu O(n3

).

W celu praktycznej prezentacji efektów działania mechanizmu wnioskowania dla grafów hierarchicznych na rys. 5.40 przedstawiono reguły gramatyki uzyskane za pomocą oma-wianego automatycznego algorytmu wnioskowania dla hierarchicznego losowego grafu IE z rys. 4.11a. Na rys. 5.40 znajdują się reguły gramatyki opisujące strukturę uzyskanego języka losowego na poziomie I warstwy natomiast do poszczególnych wierzchołków ter-minalnych znajdujących się w grafach prawych stron produkcji przypisane są odwołania do gramatyk reprezentujących związane z tymi wierzchołkami języki II poziomu. Języki te oznaczone symbolami GII1,...,GII4 są przedstawione na rys. 5.36-38. W ten sposób uzy-skujemy automatycznie dwuwarstwowy opis syntaktyczny otrzymując reguły dla wartswy hierarchicznej języka (gramatyka klasy lcTLswETPL(k)) oraz powiązane z nimi języki II poziomu (gramatyki ac-swETPL(k)).

ROZDZIAŁ 6:OPIS IMPLEMENTACJI SYSTEMU DO GRAFOWEJ ANALIZY PODPISÓW ODRĘCZNYCH 135 2 a (1.0) 1 1 Z = A

GII = {GII1, GII2, GII3, GII4} [GII1,GII2] (1) A [GII3] (2) B [GII4] C1({e23 (1.0)}, in)

= {({a(1.0)},{b (0.5),c (0.5)},{e23 (1.0)}, in)}

C

2({e0 (1.0)}, in)

= {({a (1.0)},{a(1.0)},{e0 (1.0)}, in)}

a (0.5) d (0.5) b (0.5) c (0.5) 1 {e23 (1.0)} {e0 (1.0)} 2 B

Rysunek 5.40. Produkcje gramatyki hierarchicznej klasy lcTLswETPL(k) uzyskane za pomocą

automatycz-nego algorytmu wnioskowania dla hierarchiczautomatycz-nego losowego grafu IE z rys. 4.11a, linią przerywaną zazna-czone są powiązania wierzchołków terminalnych z odpowiednimi kolekcjami gramatyk II poziomu reprezen-tującymi opis syntaktyczny lokalnych cech podpisów wzorcowych.

ROZDZIAŁ 6:OPIS IMPLEMENTACJI SYSTEMU DO GRAFOWEJ ANALIZY PODPISÓW ODRĘCZNYCH 136

6 Opis implementacji systemu do grafowej analizy podpisów

W dokumencie Index of /rozprawy2/10347 (Stron 131-136)