POLSKA AKADEMIA NAUK

(1)

POLSKA AKADEMIA NAUK

Instytut Badań Systemowych

Streszczenie

ROZPRAWY DOKTORSKIEJ mgr inż. Łukasz Sosnowski

Komparatory obiektów złożonych w zastosowaniach do badania podobieństwa i identyfikacji

Promotor dr hab. Dominik Ślęzak

Warszawa 2016

(2)

1. Wprowadzenie

Funkcjonowanie otaczającego nas świata bazuje na umiejętności przetwarzania informacji oraz podej- mowania na ich podstawie decyzji. Informacja obecna jest w każdym zachodzącym procesie. Może być różnie zapisywana. Można wyodrębnić różne jej nośniki. Wymiana informacji wiąże się z umiejętnością jej kodowania, dekodowania oraz transmisji [20]. Natomiast decyzje podejmowane są na podstawie pew- nych informacji wejściowych, które najczęściej pochodzą z wielu źródeł, a także na bazie wyników ich przetwarzania w postaci syntezy, agregacji lub dekompozycji.

Można powiedzieć, że świat bazujący na informacji składa się z obiektów, które mogą stanowić zarówno źródło, jak i odbiorcę informacji. Obiekty, które występują w otaczającej nas przestrzeni można podzielić na obiekty złożone oraz obiekty proste. Obiektami prostymi nazywane będą atomowe, niepodzielne byty, które charakteryzują się pewnymi cechami, lecz nie składają się z innych obiektów. Natomiast obiekta- mi złożonymi będą byty posiadające pewną strukturę złożoną z powiązanych ze sobą innych obiektów prostych lub złożonych. W systemach podejmowania decyzji obiekty złożone i proste na ogół nie są bezpośrednimi uczestnikami przetwarzania informacji. Przetwarzana jest raczej pewna ich reprezentacja, wyrażana na przykład poprzez cechy, stany czy parametry. Reprezentacja ta może być różna dla tego samego obiektu, w zależności od rodzaju procesu przetwarzania, celu i kontekstu. Na potrzeby wnio- skowania o obiektach istotne są relacje pomiędzy obiektami, w szczególności relacje podobieństwa lub porządku. Analizując występowanie, charakterystykę oraz specyfikę obiektów złożonych, można zauwa- żyć, że ich przetwarzanie nierozłącznie wiąże się z badaniem podobieństwa, metodami ich porównywania oraz granulacją obiektów złożonych [14].

W wielu dziedzinach życia istnieje potrzeba łatwego porównywania oraz klasyfikacji obiektów, określa- nia ich przynależności do grup lub zbiorów charakteryzujących się pewnymi z góry określonymi cechami.

Potrzeba ta podyktowana jest koniecznością wykrywania cech obiektów, wykluczania pewnych zdarzeń, zapobiegania sytuacjom krytycznym czy też identyfikacji na podstawie podobieństwa. Takie zapotrze- bowanie ogólnie generują systemy przetwarzania danych, gdzie głównym punktem zainteresowania jest właśnie obiekt złożony i jego relacje z pewnymi wzorcami. W szczególności warto tu wspomnieć o sys- temach wspomagania decyzji, które, w zależności od dziedziny zastosowań, wymagają różnych technik porównywania obiektów złożonych.

Wymienione w rozprawie przykłady systemów zajmują się dość odmiennymi problemami. Łączy je

przetwarzanie obiektów złożonych, choć zupełnie innych w poszczególnych przypadkach. Z przykładów

tych wynika, iż obiekty złożone mogą być zróżnicowane pod względem typu, zastosowań lub innych kry-

teriów. Jednakże pomimo różnic związanych z obiektami, widać tu wyraźnie te same potrzeby związane z

ich przetwarzaniem. Przede wszystkim jest to potrzeba badania podobieństwa względem pewnego punktu

odniesienia. Dzięki osiągnięciu wiedzy o podobieństwie możliwe staje się uszeregowanie badanego obiektu

w rankingu podobnych elementów, co pośrednio może prowadzić do jego rozpoznania lub identyfikacji.

(3)

1.1. Układ rozprawy

Wstęp rozprawy poświęcony jest krótkiemu wprowadzeniu w problematykę podobieństwa, porówny- wania oraz powszechności występowania tego problemu w dziedzinach związanych z systemami podejmo- wania decyzji. Jednocześnie w rozdziale tym można znaleźć motywację, która towarzyszyła rozpoczęciu badań, jak również podstawowe założenia oraz wymagania stawiane przed szukanym rozwiązaniem. W rozdziale tym została sformułowana teza niniejszej rozprawy doktorskiej wraz z celami do realizacji.

Stanowi on jednocześnie wykaz podstawowych zagadnień, którymi niniejsza rozprawa się zajmuje.

Rozdział drugi zawiera podstawy teoretyczne z różnych dziedzin, wykorzystywane do formułowania rozwiązań stanowiących pracę badawczą autora. W ramach tego rozdziału przedstawiono teorię zbiorów rozmytych, która jest jedną z podstawowych teorii wykorzystywanych przez zaproponowane w rozprawie komparatory obiektów złożonych. Rozdział prezentuje również rozszerzenia zbiorów rozmytych oraz inne modele informacji niepewnej. Przedstawiono w nim także wybrane podejścia do modelowania zagadnień podobieństwa, kluczowe dla niniejszej rozprawy pojęcia związane z rozpoznawaniem oraz identyfikacją obiektów. Zaprezentowano również przegląd metod syntezy informacji, które w sposób bezpośredni włą- czone zostały do przetwarzania obiektów poprzez proponowane sieci komparatorów.

Rozdział trzeci zawiera podstawy matematyczne komparatorów obiektów złożonych, jak również sys- temowy opis komponentów i algorytmów w nich zastosowanych. Zawiera także opis wybranych technik uczenia komparatorów, co pozwala rozpatrywać omawianą metodykę jako przykład praktycznej reali- zacji podstaw inteligencji obliczeniowej. Ponadto rozdział ten omawia zagadnienia obiegu informacji w komparatorze przy użyciu struktur granularnych. Ważnym elementem tej części rozprawy są również zdefiniowane wymagane własności jakimi każdy komparator obiektów złożonych powinien się charakte- ryzować.

Rozdział czwarty zawiera opis tworzenia złożonych struktur sieciowych na bazie dedykowanych kompo- nentów w postaci komparatorów, agregatorów, translatorów itp. W tym rozdziale znaleźć można również opis matematyczny sieci oraz klasyfikacja rodzajów sieci wraz z przedstawieniem możliwych zastosowań dla poszczególnych rodzajów. Rozdział ten wraz z rozdziałem trzecim jest właściwą prezentacją opracowa- nej metody, stanowi dorobek autora, który wynika z przeprowadzonych badań podstawowych, będących odzwierciedleniem doświadczeń zdobytych w wielu projektach praktycznych.

Rozdział piąty prezentuje ogólną metodykę postępowania przy projektowaniu rozwiązań korzysta- jących z komparatorów oraz opisuje model działania metody. Znajdują się tu również wybrane trzy przykłady rozwiązania problemów identyfikacji i rozpoznawania obiektów złożonych przy użyciu sieci komparatorów. Przykłady dotyczą trzech zupełnie różnych rodzajów zastosowań oraz zupełnie różnych typów obiektów złożonych. Pierwszy przykład dotyczy przetwarzania obrazów w postaci map konturo- wych, drugi zajmuje się przetwarzaniem obiektów tekstowych, a trzeci odnosi się do przetwarzania ryzyka podczas akcji ratowniczo-gaśniczych.

Rozdział szósty podsumowuje wykonane badania i osiągnięte wyniki. W krótkiej formie opisano za- łożenia, wykonane badania oraz rezultaty. Zdefiniowano również drogi dalszego rozwoju, możliwe do realizacji w celu dalszego rozwinięcia dziedziny.

W rozprawie znajduje się również załącznik gromadzący w jednym miejscu szczegółowe informacje

dotyczące możliwych metod pomiaru podobieństwa (katalog miar podobieństwa), jak również inne szcze-

gółowe zagadnienia związane z implementacją metody.

(4)

1.2. Problem badawczy. Teza i cele rozprawy

Prace zrealizowane w ramach rozprawy koncentrują się wokół rozpoznawania i identyfikacji obiektów złożonych, które bazują na metodach wykorzystujących podobieństwo. Konieczność badania podobień- stwa dla bardzo zróżnicowanych obiektów stanowi ważny argument przemawiający za wypracowaniem uniwersalnej metodyki postępowania, wspartej narzędziami i metodami do porównywania obiektów zło- żonych. Powyższe przesłanki pozwalają sformułować podstawową tezę badawczą rozprawy doktorskiej:

Możliwe jest opracowanie matematycznych i algorytmicznych podstaw komparatora obiektów złożonych, który, po pierwsze, umożliwiałby szeregowanie zbioru lub podzbioru obiektów referencyjnych względem podobieństwa do obiektów wejściowych zaś, po drugie, zdolny byłby do łączenia się w sieci z innymi komparatorami na potrzeby modelowania złożonych struktur obiektów i ich zależności.

Dla potwierdzenia powyższej tezy w pracy sformułowano następujące cele:

— opisanie matematycznych podstaw komparatora,

— opisanie i scharakteryzowanie sieci komparatorów,

— opisanie uniwersalnej metodyki projektowania sieci,

— opisanie bazującego na komparatorach modelu rozpoznawania i identyfikacji w oparciu o komparatory, jako metody komplementarnej względem znanych technik i metod przetwarzania obiektów złożonych,

— wykonanie eksperymentów weryfikujących skuteczność zastosowania komparatorów do rozpoznawania i identyfikacji różnych typów obiektów złożonych,

— stworzenie katalogu miar podobieństwa do wykorzystania przy implementacji rozwiązań bazujących

na sieciach komparatorów obiektów złożonych.

(5)

2. Wiadomości wstępne

W niniejszym rozdziale opisany został aparat matematyczny używany w dalszej części rozprawy do opisu teorii komparatorów obiektów złożonych. W rozdziale tym znajdują się również opisy metod i modeli decyzyjnych, względem których opisywana metodyka stanowi podejście komplementarne. Poszczególne tematy podzielone zostały na sekcje, lecz przedstawiono je we wspólnym kontekście związanym z głównym tematem pracy.

Rozdział ten został podzielony na sześć sekcji. Pierwsza sekcja obejmuje materiał dotyczący zbiorów rozmytych, ich podstawowych definicji jak również relacji rozmytych oraz wnioskowania rozmytego. Te- maty te są w dalszej części rozprawy wielokrotnie używane lub stanowią bezpośrednią podstawę działania opisywanych mechanizmów.

Druga sekcja przedstawia wybrane modele informacji niepewnej, a wśród nich zbiory przybliżone oraz rozszerzenia klasycznych zbiorów rozmytych w postaci przedziałowych zbiorów rozmytych intuicjonistycz- nych zbiorów rozmytych, zbiorów cieniowanych (ang. shadowed sets) oraz zbiorów miękkich (ang. soft sets).

Trzecia sekcja przedstawia wybrane zagadnienia podobieństwa, wprowadza definicję ontologii, obiektu złożonego oraz metod wyrażania podobieństwa znanych z literatury. Kolejna sekcja skupia się wokół identyfikacji obiektów, podstaw systemów decyzyjnych, modeli identyfikacji jako systemów decyzyjnych oraz sposobów testowania jakości rozpoznawania i identyfikacji.

Piąta sekcja tego rozdziału przybliża wybrane zagadnienia uczenia modeli decyzyjnych, a w szcze- gólności metody ewolucyjne oraz sieci neuronowe. Znajduje się tam również krótki przegląd wyranych technik uczenia maszynowego. Ostatnia sekcja to wybrane aspekty syntezy informacji. Składa się z opisu podstawowych metod uśredniających, jak również pokazuje podejście rozmyte bazujące na T-normie oraz S-normie. W dalszej kolejności sekcja ta zawiera opis metod bazujących na głosowaniu jako techniki optymalizacji wyboru elementów.

Cały rozdział zawiera około 60 stron, a jego zawartość stanowi arbitralny wybór autora zakresu

wiedzy potrzebnego do opisu dalszej części rozprawy. Stanowi jednocześnie przegląd literatury związanej

z opisywanymi zagadnieniami. Wśród 136 pozycji literatury wymienionej w doktoracie w rozdziale tym

znajdują się m. in odwołania do [6, 9, 10, 13–15, 19, 22, 32–35] i wielu innych.

(6)

3. Komparatory

Komparator obiektów złożonych jest bytem, przystosowanym do przetwarzania kompleksowych da- nych w postaci całych obiektów. Oznaczany jest jako com

^ref

, natomiast można go interpretować jako funkcję w postaci:

μ

^ref_com

: X × 2

^ref

→ [0, 1]

^ref¹

, (3.1) gdzie X ⊆ U jest zbiorem obiektów wejściowych, czyli tych, które będą porównywane, ref to zbiór obiektów, względem których podobieństwo będzie badane. Dodatkowo a(x) jest funkcją generującą repre- zentację obiektu x ∈ X do przetwarzania przez dany komparator dla zadanej cechy a. Analogiczna funkcja reprezentacji używana jest dla poszczególnych obiektów referencyjnych a(y), gdzie y ∈ Y . W dalszej części rozprawy zbiór ref będzie nazywany zbiorem referencyjnym, a Y podzbiorem referencyjnym (Y ⊆ ref).

Przy ustalonym porządku na zbiorze ref = {y

¹

, ..., y

_|ref|

} komparator może być zapisany jako funkcja w postaci

μ

^ref_com

(x, Y ) = Sh(F (~v)), (3.2)

gdzie Sh jest funkcją wyostrzania wyniku, F jest funkcją odpowiedzialną za filtrowanie wyników częścio- wych, opartą o funkcje idempotentne typu: min, max, top, itp. [16], a ~v jest wektorem bliskości pomiędzy obiektem wejściowym x a wszystkimi elementami zbioru ref. W przypadku, gdy Y nie jest podzbiorem właściwym ref, na współrzędnych wektora ~v odpowiadających elementom y

i

∈ Y znajdować się będą / wartości zerowe. Wartościami pozostałych współrzędnych tego wektora są podobieństwa poszczególnych par obiektów, powstałych z połączenia obiektu wejściowego x oraz elementów podzbioru referencyjnego Y . Wymiarem wektora ~ v jest moc zbioru referencyjnego ref . Uwzględniając powyższe, wektor bliskości przyjmie postać:

~ v[i] = n

0

sim(x,yi)

:

^y_yⁱ_i^∈Y_∈Y^/

(3.3)

Wartości podobieństw (ozn. sim(u, y)) obliczane są za pomocą relacji rozmytej [6], złożonej z dodatko- wymi mechanizmami kontrolującymi powstałe wyniki (opisanymi w kolejnej sekcji).

3.1. Architektura komparatora

Komparator składa się z dwóch warstw przetwarzania: współbieżnej i sekwencyjnej. Pierwsza od- powiedzialna jest za wyliczenie poszczególnych wartości współrzędnych wektora bliskości przy pomocy funkcji podobieństwa danej wzorem

sim(x, y

i

) =

 



0 : Exc

^ref_Rules_i

(x) = 1 ∨ y

ⁱ

∈ Y /

t

h

(μ(x, y

i

)) : w p.p. , x ∈ X, y

ⁱ

∈ ref, (3.4)

1 [0,1]^ref to oznaczenie dla przestrzeni wektorów ~v długości |ref|, gdzie każda i-ta współrzędna v[i] ∈ [0, 1] odpowiada elementowi yi∈ ref, ref = {y1, ..., y_{|ref |}}.

(7)

Rys. 3.1. Diagram blokowy przedstawiający wewnętrzną budowę komparatora. Widoczne są dwie części: współ- bieżna, odpowiedzialna za wyliczenie wartości współrzędnych wstępnego wektora bliskości, oraz sekwencyjna, która zajmuje się obróbką uzyskanych wartości na wcześniejszym etapie. Bloki oznaczone jako sim odpowiedzial- ne są za wyliczenie pojedynczych wartości podobieństw. Budowa wewnętrzna tego elementu została przestawiona

na Rys. 3.2 w postaci diagramu UML.

gdzie t

h

oznacza funkcję progową, μ jest funkcją podobieństwa bazowego, Exc

^ref_Rules_i

jest funkcją reguł wzbraniających oraz i jest indeksem współrzędnej wektora bliskości, dla której obliczane jest podobień- stwo, a Y ⊆ ref.

Podobieństwa mogą być wyliczane jednocześnie, gdyż nie są od siebie zależne. Dotyczą odrębnych par obiektów. Na rys. 3.1 przedstawiono diagram blokowy, na którym zilustrowano budowę wewnętrzną komparatora. O ile poszczególne współrzędne wektora wyliczane są niezależnie, to sama procedura wyli- czenia wartości jest pewną sekwencję działań, wykonywaną dla pary obiektów (x, y

i

). Z tej perspektywy przetwarzanie komparatora jest współbieżnym wykonywaniem pewnych sekwencji działań kończących się wyliczeniem wartości funkcji podobieństwa wyrażonej wzorem (3.4). Szczegółowa ilustracja tego bloku znajduje się na rys. 3.2 i stanowi jego diagram czynności UML [18]. Przetwarzanie w warstwie pierwszej kończy się w momencie wyliczenia wszystkich współrzędnych wektora bliskości. Dopiero po osiągnięciu tego stanu komparator przechodzi do przetwarzania kolejnej warstwy.

Przetwarzanie w drugiej warstwie komparatora wykonywane jest sekwencyjnie, a zatem każda kolejna operacja wykonywana jest po zakończeniu poprzedniej. W takim trybie dokonywana jest filtracja za pomocą funkcji F (~v) (opisaną w doktoracie w sekcji 3.2.6) oraz wyostrzanie wektora bliskości poprzez funkcję Sh(~v) (opisaną w doktoracie w sekcji 3.2.7). Wyjściem komparatora jest przetworzony wektor bliskości wyrażony wzorem (3.3).

Patrząc globalnie na komparator obiektów złożonych oraz na jego części składowe, można ogólnie zapisać go jako złożenie poszczególnych elementów w postaci jednej funkcji:

μ

^ref_com

(x, Y ) = Sh(F (< sim(x, y

1

), ..., sim(x, y

_|ref|

) >)) (3.5)

(8)

Rys. 3.2. Diagram UML bloku sim komparatora obliczającego wartość pojedynczego podobieństwa pomiędzy obiektem wejściowym a wskazanym obiektem referencyjnym.

3.2. Podsumowanie

Przedstawiona w tym rozdziale teoria systematyzuje pojęcie komparatora jako najmniejszej jednostki decyzyjnej w tego rodzaju systemach. Jednostka ta odpowiedzialna jest za porównania lokalne związane z daną cechą, która reprezentowana jest przez funkcje użyte w komparatorze. Dany komparator realizuje maksymalne dopasowanie obiektu wejściowego do obiektów referencyjnych. Dokonuje tego przez pry- zmat cechy, dla której został stworzony. Wyraża stopień podobieństwa obiektu wejściowego do zadanych elementów referencyjnych, jednakże w kontekście opisanym przez jego części składowe odpowiadające zadanemu aspektowi.

Komparator wraz z pozostałymi opisanymi elementami może stanowić samoistny system decyzyjny,

lecz do rozwiązywania odpowiednio prostych problemów. Istotną cechą komparatora jest to, iż repre-

zentuje on funkcje podobieństwa. Dlatego też rozwiązania te można zaklasyfikować do grupy systemów

nazywanych systemami wnioskującymi w oparciu o podobieństwo. Ich główną cechą jest umiejętność

modelowania podobieństwa pomiędzy obiektami oraz odpowiednia interpretacja [21].

(9)

4. Sieci komparatorów

4.1. Definicje elementów składowych sieci komparatorów

Działanie sieci komparatorów może być interpretowane jako funkcja w postaci:

μ

^ref_net^out

: X → [0, 1]

^ref^out

, (4.1) przyjmuj¸aca jako argument x ∈ X, gdzie X jest zbiorem obiektów wejściowych sieci, a ref

^out

jest zbiorem referencyjnym warstwy wyjściowej, ustalonym dla sieci. Przeciwdziedzin¸a tej funkcji jest przestrzeń wek- torów bliskości. Wektor tej przestrzeni posiada wartości b¸ed¸ace podobieństwami konkretnych obiektów referencyjnych do obiektu wejściowego x oraz oznaczany jest przez ~v. Ustalaj¸ac porz¸adek na ref, który jest zbiorem referencyjnym ustalonym dla danej sieci, otrzymujemy:

ref = {y

¹

, ..., y

_|ref|

}. (4.2)

A zatem wartości funkcji modelującej sieć przyjmą postać:

μ

^ref_net

(x) = hSIM(x, y

¹

), ..., SIM (x, y

_|ref|

)i, (4.3) gdzie SIM(x, y

i

) jest globaln¸a wartości¸a podobieństwa w danej sieci pomi¸edzy obiektem wejściowym x, a konkretnym obiektem referencyjnym y

i

. Podobieństwo to jest nazywane jest globalnym, gdyż uwzgl¸ednia w sobie wszystkie podobieństwa lokalne obliczone przez poszczególne komparatory sieci oraz wykonane operacje agregacji oraz translacji na poszczególnych etapach przetwarzania sieci.

4.1.1. Warstwa sieci

Sieć zbudowana jest z warstw. Istniej¸a trzy rodzaje warstw: wejściowa, pośrednia i wyjściowa. Warstwa grupuje komparatory ze wzgl¸edu na pewien kontekst zwi¸azany z przetwarzanymi cechami lub struktur¸a obiektu. Warstwa odpowiedzialna jest za wykonywanie równoległych, lokalnych porównań przy użyciu znajduj¸acych si¸e w niej komparatorów oraz syntez¸e uzyskanych wyników do postaci lokalnej decyzji dotycz¸acej doboru obiektów referencyjnych do dalszego przetwarzania. Warstwa może być zapisana w postaci funkcji:

μ

^ref_layer

: X → [0, 1]

^ref^l

, (4.4)

gdzie x jest ustalonym obiektem wejściowym, a ref

l

ustalonym dla warstwy wyjściowym zbiorem refe-

rencyjnym. Oznacza to, że wewn¸atrz warstwy mog¸a być używane różne zbiory referencyjne dla poszcze-

gólnych komparatorów. Jednakże w procesie agregacji i translacji nast¸epuje synteza i przekształcenie

obliczonych podobieństw lokalnych, pochodz¸acych z poziomu komparatorów, na poziom podobieństwa

(10)

do ustalonego wyjściowego zbioru referencyjnego warstwy. W celu przeprowadzenia tego przetwarzania używana jest macierz translacji opisana w [31]. Funkcja (4.4) stanowi złożenie poszczególnych funkcji składowych, takich jak: funkcja komparatora (3.1), funkcja agreguj¸aca dane w warstwie oraz funkcja translacji spełniaj¸aca cz¸esto funkcj¸e filtracji na poziomie danych lokalnie zagregowanych.

Każda sieć komparatorów składa si¸e z jednej warstwy wejściowej, jednej wyjściowej i dowolnej licz- by warstw pośrednich [30]. W warstwie wejściowej oraz pośrednich znajduj¸a si¸e komparatory opisane funkcj¸a (3.1) oraz agregatory lokalne i translatory [31]. Warstwa wyjściowa zawiera agregator globalny oraz translator [28].

4.1.2. Agregator lokalny

Agregator lokalny ma za zadanie syntez¸e wyników cz¸eściowych. Agregator zależy od rodzaju prze- twarzanych obiektów referencyjnych (strukturalnych lub monolitycznych). W ogólnej postaci może być zapisany jako:

f

_agg^ref^l

: [0, 1]

^ref¹

× ... × [0, 1]

^ref^k

→ [0, 1]

^ref^l

, (4.5) gdzie k jest liczb¸a komparatorów w danej warstwie, co jednoznacznie przekłada si¸e na liczb¸a sygnałów wchodz¸acych do agregatora. Natomiast ref

l

jest wyjściowym zbiorem referencyjnym obowi¸azuj¸acym dla warstwy, zawieraj¸acym elementy powi¸azane z obiektami referencyjnymi lokalnych zbiorów referencyjnych (ref

i

, gdzie i = 1, .., k) używanych przez komparatory poprzez tzw. reguły składania. Reguły bazuj¸a na strukturze obiektu i definiuj¸a, w jaki sposób z podobieństw dotycz¸acych podobiektów wyliczyć podobień- stwo wyższego poziomu (ogólniejszego obiektu).

4.1.3. Translator

Kolejnym elementem wyst¸epuj¸acym w warstwie jest translator, którego zadaniem jest konwersja wy- ników jednej warstwy do postaci akceptowalnej przez kolejn¸a warstw¸e [26]. Translator zdefiniowany jest w postaci macierzy przejścia:

M

_ref^ref_l^k

= [m

ij

], (4.6)

gdzie i ∈ {1, ..., m}, j ∈ {1, ..., n}, a m i n oznaczają odpowiednio liczności zbiorów ref

^k

i ref

l

. Macierz M

_ref^ref_l^k

definiuje mapowanie obiektów zbioru ref

k

na obiekty zbioru ref

l

. W praktyce zbiór ref

k

jest sumą zbiorów referencyjnych poszczególnych komparatorów warstwy, a ref

l

zbiorem docelowym (z punktu widzenia translacji). Wartościami mapowania mog¸a być wartości z przedziału [0, 1]. W zależności od rodzaju relacji wzajemnej, w jakiej s¸a oba zbiory (uogólnienie lub dekompozycja), macierz przyjmuje różne wartości. Dla dekompozycji na jeden element zbioru ref

k

przeważnie przypada wiele elementów ref

l

, co przejawia si¸e poprzez wyst¸epowanie wielu wartości 1 w wierszu odpowiadaj¸acym obiektowi z ref

k

. W przypadku uogólnienia wartości macierzy przeważnie s¸a mniejsze od 1.

4.1.4. Moduł rzutowania

Element sieci występujący w wybranych warstwach, który odpowiada za selekcję współrzędnych wek-

tora bliskości, które biorą udział w dalszym przetwarzaniu. Selekcja może następować według różnych

kryteriów. Jednym z nich może być ustalona wartość progowa, inny warunek liczności akceptowalnych

współrzędnych. Moduł ten dla i-tej współrzędnej wektora bliskości może być zapisany w postaci nastę-

pującej funkcji:

(11)

μ

proj

(v[i]) =

 



~ v[i] projection(~ v[i]) = 1 0 projection(~ v[i]) = 0

(4.7)

gdzie i ∈ {1, ..., |ref|}, a projection(a) dla a ∈ [0, 1] jest funkcją w postaci:

projection : [0, 1] → {0, 1}, (4.8)

Funkcja ta dokonuje właściwej selekcji atrybutów wektora. Może mieć postać funkcji progowania, max, obciętego rankingu lub innej postaci określającej, czy dana współrzędna wektora zostanie lub nie zostanie wyzerowana.

4.1.5. Agregator globalny

W warstwie wyjściowej znajduje si¸e agregator globalny. Różnica pomi¸edzy agregatorem lokalnym a globalnym polega na zasi¸egu przetwarzanych wyników. Lokalny przetwarza jedynie wyniki cz¸eściowe jednej warstwy, podczas gdy globalny umożliwia przetwarzanie wszystkich osi¸agni¸etych wyników lokalnych w całej sieci. Dla przypadku, gdzie w każdej warstwie mamy ten sam zbiór referencyjny, agregator można zapisać w postaci funkcji:

μ

^ref_agg^out

: [0, 1]

^ref

^m

→ [0, 1]

^ref^out

, (4.9)

gdzie m jest liczb¸a wszystkich komparatorów sieci i jednocześnie liczb¸a wejść agregatora globalnego.

Dla przypadku różnych zbiorów referencyjnych w warstwach rozważmy wyjściowy zbiór referencyjny ref

out

. Każdy element y ∈ ref

^out

rozbija si¸e na y

1

w zbiorze referencyjnym ref

1

, y

2

w zbiorze referen- cyjnym ref

2

i tak aż do y

m

w zbiorze referencyjnym ref

m

. Dla elementu wejściowego x ∈ X wyliczono wektory podobieństw do elementów ze zbiorów ref

₁

,...,ref

m

. W celu otrzymania wyniku zagregowanego używamy funkcji w postaci:

μ

^ref_agg^out

: [0, 1]

^|ref¹^|

× ... × [0, 1]

^|ref^m^|

→ [0, 1]

^ref^out

(4.10) Jak widać, wzór (4.10) stanowi analogi¸e do wzoru (4.5) przedstawionego dla agregatora lokalnego. Różnica polega na wzięciu pod uwagę innej liczby komparatorów. W przypadku wzoru (4.10) s¸a to wszystkie komparatory sieci, a w przypadku agregacji lokalnej jedynie komparatory danej warstwy.

4.1.6. Podsumowanie

Bior¸ac pod uwag¸e powyższe definicje, sieć komparatorów można przedstawić jako złożenie funkcji warstw, w nast¸epuj¸acej postaci:

μ

^ref_net^out

(x) = μ

^ref_layer−out^out

(μ

^ref_layer−int^k⁻¹

..(μ

^ref_layer−in¹

(x))..), (4.11) gdzie ref

i

s¸a ustalonymi dla odpowiednich warstw zbiorami referencyjnymi, a ref

out

jest zbiorem refe- rencyjnym wyjściowym dla całej sieci. Ogólny schemat sieci przedstawiono na rys. 4.1.

4.2. Projektowanie sieci komparatorów

Sieć komparatorów zbudowana jest z warstw komunikujących się między sobą poprzez translator. Cen-

tralnym elementem warstwy jest agregator, z którym powiązane są pozostałe elementy. Jego zadaniem

(12)

Rys. 4.1. Ogólny schemat sieci komparatorów. Schemat nie jest wykonany przy użyciu UML, a jedynie używa dost¸epnej tam analogicznej notacji. Użyte skróty: com

ji

- komparatory, T

j

- translatory. Symbole: owale - kompa- ratory, pionowe pogrubione czarne linie - agregatory, romby - translatory, koła z krzyżykiem w środku - moduły

rzutowania.

w poszczególnych warstwach jest wytypowanie najlepszego rozwiązania na potrzeby dalszego przetwa- rzania. Stanowi on element spajający, gdyż tylko dzięki niemu następuje jednokierunkowa komunikacja pomiędzy poszczególnymi elementami. Do elementów warstwy zaliczają się także komparatory (różne rodzaje), moduły rzutowania oraz translator (zgodnie z rys. 4.1). Każdy komparator przekazuje wyniki do agregatora. Komparatory nie są ze sobą bezpośrednio połączone. Poszczególne komparatory badają zdefiniowane cechy niezależnie. Przeprowadzają swoje obliczenia współbieżnie oraz zwracają niezależne wyniki. Zadaniem translatora jest konwersja wyniku danej warstwy do użytecznej i akceptowalnej postaci w kolejnej warstwie lub na wyjściu sieci.

4.3. Agregacja wyników częściowych

Zgodnie z definicj¸a sieci komparatorów i wzorem (4.1) na wyjściu sieci pojawia si¸e wektor bliskości.

Wymiar wektora jest taki, jak liczność zbioru referencyjnego wyjściowego określonego dla sieci. Problem agregacji wyników cz¸eściowych polega na przekształceniu macierzy zbudowanej z lokalnych wektorów bli- skości w wektor przedstawiający globalne wartości podobieństwa. Wektor ten powstaje na skutek syntezy wektorów lokalnych, dokonanej przy użyciu funkcji agregacji zgodnej z wzorami (4.9) lub (4.10). Proces ten jest optymalizacj¸a doboru elementów zbioru referencyjnego do rankingu, budowanego z wartości podobieństwa pomi¸edzy obiektami.

Macierz zbudowana z wektorów lokalnych ma wymiar m × n, gdzie m jest liczb¸a komparatorów, a

n moc¸a zbioru referencyjnego traktowanego jako suma podzbiorów lokalnych. Zbiór ten budujemy po-

przez dodawanie elementów kolejnych lokalnych zbiorów referencyjnych niewyst¸epuj¸acych w dotychczas

dodawanych zbiorach. W przypadku agregatora lokalnego pod uwag¸e brane s¸a wartości dla wszystkich

komparatorów z danej warstwy. W przypadku agregatora globalnego dost¸epne s¸a wartości wszystkich

komparatorów całej sieci, lecz mog¸a być brane pod uwag¸e dowolne z nich, w zależności od intencji projek-

(13)

tanta sieci. Załóżmy, iż w danej warstwie występuje n komparatorów. Dla ustalonego zbioru referencyjnego ref dla warstwy lub sieci każdy z komparatorów zwróci wektor bliskości rz¸edu m. Następnie budowana jest macierz z poszczególnych wektorów bliskości pochodzących z komparatorów com

^ref₁ ¹

, com

^ref₂ ²

, ..., com

^ref_n ⁿ

, w taki sposób, że każdy kolejny wektor stanowi wiersz macierzy A

ⁿ_m

. Wartości danego wektora wstawiamy w pozycje odpowiadaj¸ace odpowiednim obiektom referencyjnym. Pozostałe pozycje wiersza macierzy uzu- pełniamy wartościami zerowymi. Poszczególne elementy macierzy odpowiadaj¸a wartościom funkcji podo- bieństwa danego komparatora oraz zadanego obiektu referencyjnego, czyli poszczególnym współrz¸ednym wyliczonego wektora bliskości. Dzi¸eki temu uzyskujemy obraz wyników poszczególnych komparatorów dla poszczególnych obiektów referencyjnych. Dla przedstawionego przykładu macierz ta wygl¸ada nast¸epuj¸aco:

A

ⁿ_m

=



 



sim

1

(x, y

1

) sim

1

(x, y

2

) ... sim

1

(x, y

m

) sim

2

(x, y

1

) sim

2

(x, y

2

) ... sim

2

(x, y

m

)

... ... ... ...

sim

n

(x, y

1

) sim

n

(x, y

2

) ... sim

n

(x, y

m

)



 

 (4.12)

Bazuj¸ac na macierzy (4.12), agregacja polega na dokonaniu operacji optymalizacyjnej wartości po- szczególnych kolumn macierzy. Poniżej opisane zostały wybrane metody możliwe do zastosowania w celu dokonania tej optymalizacji.

4.3.1. Metody podstawowe

Intuicyjnym podejściem do agregacji wyników lokalnych jest zastosowanie metod uśredniających. Po- szczególne kolumny macierzy (4.12) reprezentuj¸a wartości podobieństwa obiektu wejściowego do konkret- nego obiektu referencyjnego. Poszczególne wartości w wierszach reprezentuj¸a jednak różne badane cechy.

Dla badanych cech szukana jest jedna wartość, która reprezentuje ogólne podobieństwo uwzgl¸edniaj¸ace po cz¸eści każd¸a z przetworzonych cech. Jednym z podejść jest estymacja wartości podobieństwa poprzez wartość średni¸a.

Chociaż metody te s¸a wzgl¸ednie proste, w wielu przypadkach wyniki uzyskane za ich pomoc¸a s¸a wystarczaj¸aco dobre [24]. Niew¸atpliw¸a ich zalet¸a jest niska złożoność obliczeniowa oraz niewyrafinowanie metod ich obliczania. Daje to możliwość szybkiego i sprawnego przygotowania wyników dla celów dalszych obliczeń.

4.3.2. Metody bazujące na głosowaniu

Agregacja wyników lokalnych jest syntez¸a danych niekoniecznie polegaj¸ac¸a na typowych funkcjach agreguj¸acych. Przykładem jest metoda optymalizacji zaczerpni¸eta z zupełnie innej dziedziny, jak¸a s¸a algorytmy wyborcze. Metoda opiera si¸e na algorytmach przeprowadzania głosowania, które prowadz¸a do powstania rankingów wyborczych. Metody te maj¸a na celu dobre odwzorowanie preferencji wyborców, tzn. wybór takich kandydatów, którzy s¸a popierani przez jak najwi¸eksz¸a liczb¸e wyborców i w jak naj- wyższym stopniu. Cz¸eść z tych metod spełnia kryterium Condorceta [3], które gwarantuje, że wybrany kandydat ma poparcie wi¸eksze niż poparcie każdego innego. Jak widać, metody te, chociaż używane w odniesieniu zupełnie odmiennej dziedziny, sprowadzaj¸a si¸e do optymalizacji pewnej funkcji reprezentuj¸acej pogl¸ady wyborców. Metoda ta operuje dwoma podstawowymi poj¸eciami: kandydat oraz wyborca. Pierw- sze poj¸ecie reprezentuje obiekt poddawany głosowaniu i wchodz¸acy w skład potencjalnych rozwi¸azań.

Wyborca natomiast to obiekt oddaj¸acy głos na kandydata. W zależności od metody głosowania metody

(14)

oddawania głosów mog¸a wygl¸adać różnie. W niektórych przypadkach dany wyborca oddaje tylko jeden głos, w innych może oddać ich wi¸ecej. Różne s¸a również metody liczenia głosów. W każdym jednak przypadku efektem końcowym jest ranking szereguj¸acy kandydatów i wyznaczaj¸acy miejsca w rankingu, zgodnie z przyj¸et¸a reguł¸a liczenia głosów (ordynacj¸a wyborcz¸a [12]). Ordynacja wyborcza określa również metod¸e wyznaczania zwyci¸ezców, tzn. jak oddane głosy przekładaj¸a si¸e na decyzj¸e o wyborze kandydata.

W przypadku zastosowania tych metod do problemów optymalizacji również b¸edziemy operowali pod- stawowymi poj¸eciami używanymi przez te metody. B¸edziemy przypisywać znaczenie (rol¸e) kandydatom oraz wyborcom. W sieciach komparatorów problem optymalizacji zwi¸azany jest z agregatorami. W tych elementach składowych sieci możliwe jest zastosowanie algorytmów wyborczych jako metod wyboru roz- wi¸azań. Podobnie jak we wcześniejszych opisywanych rodzajach agregatorów, po przetwarzaniu obiektów przez komparatory dostajemy wiele wektorów bliskości. Należy dokonać wyboru w taki sposób, aby na końcu otrzymać jeden wektor bliskości. Kandytaci s¸a reprezentowani przez obiekty referencyjne. To z nich powstaj¸a rozwi¸azania, na ich podstawie konstruujemy wektory bliskości. Każdy wektor posiada ponadto wartości określaj¸ace podobieństwo. W przypadku algorytmów wyborczych wartość ta b¸edzie interpretowa- na jako siła głosów oddanych na kandydatów. Komparatory utożsamiane s¸a z wyborcami. To komparatory oddaj¸a głosy na kandydatów, przydzielaj¸ac odpowiedni poziom podobieństwa poszczególnym obiektom referenyjnym. W ten sposób mamy określone dwa podstawowe poj¸ecia niezb¸edne do przeprowadzenia wyborów. W dalszej cz¸eści opisane zostanie dostosowanie wybranych algorytmów wyborczych do użycia w kontekście sieci komparatorów.

4.3.3. Metody strukturalne inspirowane mereologią przybliżoną

W sieciach heterogenicznych w wi¸ekszości przypadków do poprawnego zagregowania wyników po- trzebna jest wiedza o strukturze obiektu i jego relacjach. Rozpatrywane relacje dotycz¸a bycia cz¸eści¸a jednego obiektu w drugim, wyszukiwania cz¸eści wspólnych lub podobnych pomi¸edzy obiektami, jak rów- nież analizowania cz¸eści składowych. Takimi zagadnieniami zajmuje si¸e dziedzina o nazwie mereologia.

Jej rozszerzenie operuj¸ace stopniami spełnialności relacji nosi nazw¸e mereologii przybliżonej [15]. Funkcje inkluzji przybliżonej mog¸a stanowić dobre źródło funkcji podobieństwa oraz ich składania [4]. Tak¸a rol¸e ma w tym kontekście agregator. Innymi słowy, poszukuje on odpowiedzi na pytanie, jak z zebranych informacji o podobiekatach i ich podobieństwie wywnioskować podobieństwo całego obiektu. Szczegóły zostały opisane w rozprawie doktorskiej w sekcji 4.6.3.

4.4. Wybrane zagadnienia uczenia sieci komparatorów

Sieci komparatorów charakteryzują się zdolnością uczenia wybranych parametrów, dzięki czemu zwięk-

szają swoją skuteczność poprzez dopasowanie do konkretnego problemu, przy zachowaniu ogólności w

odniesieniu do danych. Rozpatrywane są dwie podstawowe grupy algorytmów uczących: z nadzorem i

bez nadzoru. Pierwsza grupa wymaga posiadania danych uczących i testowych. Za pomocą tej grupy

metod sieć może uczyć się wartości parametrów p poszczególnych komparatorów, tak aby ta ich wartość

była jak najwyższą, lecz jednocześnie nie eliminowała poprawnych rozwiązań. Z drugiej strony wraz ze

wzrostem wartości parametru funkcji progującej (ozn. t

h

(z)) zmniejsza się liczba wymaganych porównań

do wykonania.

(15)

Innym problemem, który można tym sposobem optymalizować jest uczenie struktury sieci. Procedurę tę można wykonać pod warunkiem posiadania informacji o możliwych do wykorzystania komparatorach oraz ustalonych parametrach w postaci agregatorów oraz zbioru referencyjnego. Podobnym problemem jest dobór funkcji agregacji. W tym przypadku ustalone są nieco inne parametry, zaś szukane są subop- tymalne funkcje agregujące występujące w warstwach sieci.

Ostatnim elementem podlegającym uczeniu przy pomocy metod nadzorowanych jest wyznaczanie wag komparatorów w wybranych agregatorach. Problem ten został dość obszernie opisany we wcześniejszej publikacji [28].

Jeśli chodzi o metody samoorganizujące, przykładem w sieciach komparatorów jest konstrukcja zbioru referencyjnego, przy ustalonej strukturze sieci oraz na podstawie zbioru danych wejściowych.

Spośród wymienionych problemów do szerszego omówienia w doktoracie wybrane zostały dwa naj-

bardziej ciekawe. Pierwszy to zagadnienie uczenia struktury sieci homogenicznej, drugi zaś to problem

uczenia zbioru referencyjnego dla ustalonej sieci, który jednocześnie jest rozwinięciem opisanego w roz-

dziale 3 doktoratu, zagadnienia uczenia komparatorów. Szczegółowy opis tych algorytmów znajduje się

w sekcjach 4.9.1 oraz 4.9.2 rozprawy doktorskiej.

(16)

5. Wybrane zastosowania sieci komparatorów

5.1. Przegląd zastosowań

W doktoracie zaprezentowane zostały trzy wybrane eksperymenty stanowiące zastosowania praktyczne opisywanych metod postępowania. Zastosowania dotyczą zupełnie odrębnych dziedzin. Ich celem jest wykazanie, iż metoda jest uniwersalna ze względu na problematykę, w której może być zastosowana.

Podczas badań przeprowadzono znacznie więcej eksperymentów, które zostały opisane w publikacjach [21,23,25,29], dlatego nie ujęto ich w niniejszym rozdziale. Te trzy wybrane przykłady obejmują dziedziny związane z przetwarzaniem obrazów, zarządzaniem ryzykiem bazującym na założeniach systemów klasy CBR [1] oraz prezentują zastosowanie w dziedzinie przetwarzania tekstów. Pokazuje to szerokie możliwości zastosowań, a jednocześnie daje możliwość porównania zastosowanych metod.

5.2. Identyfikacja map konturowych

Eksperyment polegał na identyfikacji obszaru administracyjnego na podstawie cech wizualnych ob- razka przedstawiającego mapę konturową, która została pozyskana z mapy Polski przedstawionej na rys.

5.1. Zbiorem referencyjnym zostały mapki konturowe gmin, powiatów oraz miast na prawach powiatu z przypisanymi kodami TERYT, które zostały pozyskane z zewnętrznych źródeł aktualnych w roku 2012.

W pierwszej kolejności przeprowadzono eksperyment przy użyciu prostej homogenicznej sieci kompara- torów. Była to sieć dwuwarstwowa realizująca identyfikację w sposób bezpośredni, bazując na dwóch głównych cechach: kształcie konturu oraz powierzchni obszaru ograniczonego konturem. Dla kolejnych obiektów wejściowych sieć wskazywała wektor bliskości bazujący na zbiorze referencyjnym, którego war- tościami były podobieństwa poszczególnych map konturowych. Dla każdego z 2479 obiektów wejściowych zostało wykonanych 5716 porównań, co daje łącznie 14169964, po 7084982 wykonanych przez każdy z komparatorów. Spośród poprawnie zidentyfikowanych 2479 elementów wejściowych zostało 2281, co dało 92,01% skuteczności. Przyjęta miara skuteczności odpowiada miarze dokładności (ACC) (ang. Accuracy), opisanej szczegółowo w sekcji 2.4.3 doktoratu.

Druga część eksperymentu polegała na zastosowaniu wiedzy dziedzinowej i rozbudowaniu na jej bazie

sieci komparatorów o kolejne warstwy dokonujące selekcji obiektów referencyjnych, które brane są pod

uwagę w końcowej identyfikacji. W rezultacie osiągnięto optymalizację liczby porównań niezbędnych do

identyfikacji zbioru obiektów wejściowych. Wyniki tego procesu zostały przedstawione w tabeli 5.1. W za-

leżności od rodzaju dodatkowej wiedzy dziedzinowej, liczba porównań odpowiednio się zmniejszała. Miało

to wpływ na skuteczność identyfikacji. Przy zastosowaniu maksymalnego wariantu wiedzy dziedzinowej

(województwo i powiat) liczba poprawnie zidentyfikowanych obiektów wzrosła do 2355, co przełożyło się

(17)

Rys. 5.1. Mapy konturowe podziału administracyjnego Polski. Po lewej mapa gmin, po prawej mapa powiatów i województw. Pojedyncze gminy i powiaty stanowią obiekty do identyfikacji w opisywanym eksperymencie.

Tabela 5.1. Tabela wyników optymalizacji liczby porównań przy użyciu wiedzy dziedzinowej o przetwarzanym obiekcie. Użyte skróty i oznaczenia: Min - minimalna liczba porównań, Max - maksymalna liczba porównań.

Warianty Liczność zbioru ref. Min Max brak wiedzy dziedzinowej 2874 2874 2874

tylko województowa 16 16 16

tylko powiaty 379 379 379

tylko gminy 2479 2479 2479

znane województwo średnio: 155 71 314

znany powiat średnio: 8 3 19

na wzrost ACC do 94,99%. Te dodatkowo zidentyfikowane przypadki pochodziły z wektorów, dla których wcześniejsza metoda zwróciła kilka bardzo podobnych rozwiązań, jednakże to prawidłowe nie znajdo- wało się na pierwszym miejscu. Zastosowanie wiedzy dziedzinowej spowodowało ograniczenie liczności elementów referencyjnych i przez to eliminację konkurencyjnych rozwiązań.

Przedstawione wyniki świadczą o bardzo dobrej skuteczność zastosowanej metody. Uzyskana wartość

oznacza, iż średnio ponad 9 na 10 przetwarzanych mapek gmin, powiatów lub miast na prawach powiatu

zostało zidentyfikowanych poprawnie. Pokazano również, iż posiadanie dodatkowej wiedzy dziedzinowej

może w znaczący sposób wpłynąć na złożoność obliczeniową, jak również skuteczność rozwiązania. Dzięki

tej wiedzy liczba porównań, pomimo zastosowania trzykrotnie większej liczby komparatorów, spadła

średnio do 237984, co stanowi liczbę mniejszą o 2 rzędy wielkości. Analiza przypadków błędnie zidentyfi-

kowanych wykazała, iż wiele z nich stanowiło przypadki szczególne, które nie mogły zostać dobrze ziden-

tyfikowane w sposób bezpośredni, bez dodatkowej obsługi. Jednym z takich elementów było zawieranie się

jednego obszaru w drugim, co powodowało zaszumienie danych związanych z komparatorem dotyczącym

powierzchni. Przykład takiego przypadku przedstawiono na rys. 5.2. Innym problemem okazała się zbyt

niska rozdzielczość niektórych obiektów wejściowych.

(18)

Rys. 5.2. Przykład przypadku szczególnego obszarów gmin zawierających wewnątrz inne obszary (zaznaczone ciemniejszym kolorem).

Podsumowując, metoda ta osiągnęła bardzo wysoki wynik skuteczności, co pozwoliło na zautomaty- zowanie skomplikowanego problemu identyfikacji w dziedzinie przetwarzania obrazów.

5.3. Klasyfikacja referencji w publikacjach naukowych

5.3.1. Opis zagadnienia

Motywacja wykonania niniejszego eksperymentu pojawiła się przy okazji realizacji projektu badawczo- rozwojowego SYNAT

¹

, zrealizowanego dla NCBiR

²

. Projekt ten dotyczył stworzenia uniwersalnej, otwar- tej, repozytoryjnej platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy. Jednym z zadań wchodzących w skład zakresu projektu było zaprojektowanie i zaimplementowanie podsystemu wyszukiwania dla repozytorium wiedzy o publikacjach naukowych (np. artykułów, notek biograficznych itd.). Funkcjonalność wyszukiwania miała być realizo- wana przy użyciu semantyki pochodzącej z danych (baza SONCA) [2]. Przetwarzane dokumenty były ze swej natury złożone, a odkrywane relacje pomiędzy ich częściami niejednokrotnie okazywały się kluczowe dla poprawnego zaindeksowania. Jednym ze złożonych komponentów przetwarzanych dokumentów były opisy tekstowe referencji bibliograficznych. Celem niniejszego eksperymentu było rozpoznanie seman- tycznej struktury referencji bibliograficznych, reprezentowanej przez ich tekstowe opisy. Wynik miał być wyrażony poprzez obiekty zaklasyfikowane do znanych klas, takich jak: autorzy, tytuły, czasopisma, daty publikacji itd. Przykładowo, opis tekstowy referencji w postaci: “Sosnowski, L., Slezak, D.: Networks of Compound Object Comparators. In: Proc. of FUZZ-IEEE 2013 (2013) ” powinien zostać przyporząd- kowany do wzorca ATRY. Wzorzec ten składa się z następujących elementów składowych: A - autor lub autorzy, T - tytuł, R - materiały konferencyjne, Y - rok wydania. Szukanie struktury w referencjach bibliograficznych przetwarzanych dokumentów miało na celu lepsze zrozumienie treści dokumentu i dzięki temu zwiększenie skuteczności wyszukiwania całego systemu.

1 www.synat.pl

2 Narodowe Centrum Badań i Rozwoju

(19)

Tabela 5.2. Wybrane wielkości charakteryzujące podobieństwo najbliższych obiektów.

Charakterystyka Wartość

Max 1.00

Min 0.50

Średnia arytmetyczna 0.85

Mediana 0.87

Odchylenie standardowe 0.12

Wariancja 0.02

5.3.2. Opis wyników

Przeprowadzono dwa eksperymenty, do których użyto zbiór losowo wybranych danych, składający się z 400 przypadków referencji bibliograficznych. Eksperyment nr 1 polegał na wygenerowaniu wzorców na podstawie podobieństwa podobiektów (kawałków referencji) i złożenia (poprzez konkatenację) w jeden wzorzec. Eksperyment nr 2 zawierał cały eksperyment nr 1, lecz dodatkowo wygenerowany wzorzec był porównywany z referencyjnym zbiorem możliwych wzorców.

Jako zbiory referencyjne zastosowano dane wcześniej przetwarzane w podsystemie SONCA w postaci zbiorów autorów, tytułów, czasopism itd. Z tego punktu widzenia istotne jest, iż zbiory posiadają wiedzę o rodzaju obiektów, jaki opisują, gdyż wcześniej były już klasyfikowane. Ta wiedza jest istotna w kontekście opisywanego eksperymentu.

Zbiór danych został podzielony na dwa podzbiory: zbiór uczący i zbiór testowy. Pierwszy składał się ze 132 obiektów, a drugi z 268. Zbiór uczący był używany do budowania zbioru referencyjnego oraz dostra- jania parametrów sieci. Procedura ta działa zgodnie z opisanym w sekcji 4.9.2 doktoratu postępowaniem uczenia zbioru referencyjnego dla sieci komparatorów.

Zbiór testowy wykorzystany został do zbadania skuteczności klasyfikacji. Eksperyment został podzie- lony na dwie części. Pierwsza obejmowała wygenerowanie wzorców struktury referencji na podstawie podobieństwa podobiektów. Druga dodatkowo obejmowała porównywanie zbudowanego wzorca ze zbio- rem referencyjnym wzorców referencji bibliograficznych.

Oba eksperymenty wykonane zostały przy użyciu przygotowanej sieci komparatorów, bazującej na wnioskowaniu na podstawie podobieństwa. Najczęstszymi wartościami podobieństwa były wartości z za- kresu [0.8, 0.85]. Wyniki te zostały osiągnięte z domyślnymi wartościami parametrów sieci komparatorów, tzn. parametr p funkcji progowania posiadał wartość 0.5, a metoda agregacji wyników w agregatorach ustawiona była na średnią arytmetyczną, czyli z jednakową wagą każdej z badanych cech. W tabeli 5.3.2 przedstawiono wybrane charakterystyki opisujące wyliczone podobieństwo.

Skuteczność i wydajność rozwiązania była sprawdzana przy użyciu miar dedykowanych dla klasyfika-

torów. Miary te to precyzja, czułość (ang. recall) i F1-score. Zaproponowane rozwiązanie oparte o sieć

komparatorów osiągnęło globalną wartość f1-score w wysokości 0, 86 dla eksperymentu nr 1 oraz 0, 78

dla eksperymentu nr 2. W obu przypadkach wyniki są na dobrym poziomie, co pozwala zaproponowane

rozwiązanie stosować w praktyce. Tabela 5.3 zawiera szczegółowe wyniki w postaci wycinka najlepszych

i najsłabszych z punktu widzenia klasyfikacji dla obu eksperymentów.

(20)

Tabela 5.3. Lewy górny róg: Najlepsze wyniki dla eksperymentu nr 1, Prawy górny róg: Najsłabsze wyniki dla eksperymentu nr 1, Lewy dolny róg: Najlepsze wyniki dla eksperymentu nr 2, Prawy dolny róg: Najsłabsze wyniki dla eksperymentu nr 2. Przyjęte oznaczenia: P

1

- precyzja dla eksperymentu nr 1, R

1

- czułość dla eksperymentu nr 1, F 1

1

- F1-score dla eksperymentu nr 1, P

2

- precyzja dla eksperymentu nr 2, R

2

- czułość dla eksperymentu

nr 2, F 1

2

- F1-score dla eksperymentu nr 2.

Wzorzec P1 R1 F11 P2 R2 F12

ATR 1.00 1.00 1.00 0.75 1.00 0.86

RY 1.00 1.00 1.00 1.00 1.00 1.00

ATJVY 1.00 1.00 1.00 1.00 0.80 0.89

AT 1.00 0.98 0.99 0.61 0.92 0.73

ATRYP 1.00 0.93 0.96 1.00 0.73 0.83

ATVPYD 0.91 0.98 0.95 0.92 0.84 0.86

ATJVPYD 1.00 0.90 0.94 0.98 0.71 0.81

ATJVPY 1.00 0.86 0.92 1.00 0.58 0.72

AJVPYD 0.86 1.00 0.92 0.86 1.00 0.92

ATVPY 1.00 0.85 0.91 1.00 0.60 0.75

ATC 0.33 0.67 0.44 0.00 0.00 0.00

ATYATYP 0.60 0.43 0.50 1.00 0.43 0.60

AYTRY 0.43 0.60 0.50 1.00 0.60 0.75

ATPYC 0.54 0.80 0.64 0.60 0.60 0.60

ATJVYP 1.00 0.50 0.65 0.50 0.25 0.33

ATVY 0.60 0.75 0.67 1.00 0.75 0.86

ATVYPR 0.56 0.83 0.67 1.00 0.50 0.67

ATJPY 0.94 0.58 0.70 0.89 0.60 0.71

ATRPYC 0.71 0.77 0.73 1.00 0.77 0.86

ATAT 0.57 1.00 0.73 0.00 0.00 0.00

RY 1.00 1.00 1.00 1.00 1.00 1.00

ATRY 0.89 0.88 0.86 1.00 0.88 0.93

ATRPY 0.93 0.90 0.90 0.99 0.88 0.92

AJVPYD 0.86 1.00 0.92 0.86 1.00 0.92

ATRJPY 0.83 0.83 0.83 1.00 0.83 0.91

ATRPYCD 0.84 0.85 0.84 0.97 0.85 0.91

ATPYD 0.83 1.00 0.91 0.83 1.00 0.91

ATY 0.88 0.91 0.87 0.90 0.90 0.90

ATJVY 1.00 1.00 1.00 1.00 0.80 0.89

ATRP 1.00 0.75 0.86 0.88 0.88 0.88

AYTJP 1.00 0.70 0.82 0.00 0.00 0.00

ATC 0.33 0.67 0.44 0.00 0.00 0.00

ATAT 0.57 1.00 0.73 0.00 0.00 0.00

ATJYR 1.00 0.60 0.75 0.00 0.00 0.00

AYT 0.94 0.87 0.87 0.13 0.13 0.13

ATJVYP 1.00 0.50 0.65 0.50 0.25 0.33

AYTP 0.73 0.85 0.76 0.37 0.30 0.33

ATYR 1.00 0.75 0.86 0.50 0.50 0.50

ATYP 0.83 0.69 0.75 0.61 0.47 0.53

ATPYC 0.54 0.80 0.64 0.60 0.60 0.60

Tabela 5.4. Przykłady próbek zbiorów referencyjnych zastosowanych w użytej sieci komparatorów.

Lata

$START-CYYYY$

Jan $START-CYYYY$

Dec $START-CYYYY$

Strony [p][0-9]{1,}-[0-9]{1,}p>p [\.][0-9]{1,}-[0-9]{1,} p>p [0-9]{1,}–[0-9]{1,} p>p

[\.][0-9]{1,}–[0-9]{1,}

Doi u00A0\[doi>.{0,}\]

u00A0\[doi>.{0,}

Tomy v\.\d+

v\d+\.

v\d+

v\.\d+ n\.\d+

Tytuły

A comparison between conceptual clustering and conventional clustering

A Kalman-filter approach to equalization of CDMA downlink channels

A KDD System for the Discovery of Quantified Exception Rules

Czasopisma Fundamenta Informormaticae IEEE transactions on computers Journal of computer and system scien.

Materiały konferencyjne .{0,}\bproceedings\b \.{0,}

.{0,}\bproc\b\..{0,}

.{0,}\bproc\b\.\s.{0,}

.{0,}\bproc\b\s.0,

Kraje POLAND UNITED STATES

CHINA INDIA

Wzorce struktur ATJPY ATRPY ABTSVY

ATJY ATJYP

Autorzy A. A. Abatan A. A. Abonamah

A. A. Agrawal C. W. Lin F. Bonner

5.3.3. Podsumowanie

Zaprezentowane wyniki pokazują, iż skuteczność metody z eksperymentu nr 1 z niniejszego przykładu

była większa od skuteczności metody z eksperymentu nr 2. Analiza wyników na poziomie poszczególnych

przypadków wykazała, iż zastosowany zbiór referencyjny wzorców w drugiej warstwie sieci dla ekspery-

mentu nr 2 był zbyt ubogi. Wsród przetwarzanych obiektów znalazło się bowiem kilka takich referencji,

dla których w tym zbiorze nie było odpowiedniego reprezentanta. Inne przypadki natomiast wykazały

błędy w zapisie referencji, które na pierwszym etapie przetwarzania nie miały szans na wykrycie, nato-

miast warstwa pośrednia sieci poprawnie je przefiltrowała, jednocześnie niestety zmniejszając wskaźniki

skuteczności. W ogólności jednak metoda w bardzo dobry sposób zapewniła klasyfikację, co pozwoliło na

zautomatyzowanie tak skomplikowanego problemu przetwarzania danych tekstowych.

(21)

5.4. Rozpoznawanie ryzyka dla akcji ratowniczo-gaśniczej

5.4.1. Opis zagadnienia

Akcja ratowniczo-gaśnicza stanowi jedno z największych wyzwań dla modelowania systemów wspoma- gania decyzji. Dotychczas podjęto tylko kilka prób automatyzacji procesu wsparcia podejmowania decyzji na polu akcji [5, 7]. Jednym z nich jest projekt naukowo-badawczy o nazwie ICRA

³

. Główny cel ICRA to stworzenie nowoczesnego, bazującego na sztucznej inteligencji, systemu informowania i zarządzania ryzykiem dla dowódcy akcji ratowniczo-gaśniczej. Wprowadzenie systemu ma zwiększyć bezpieczeństwo strażaków i rozszerzyć świadomość sytuacyjną dowódcy podczas trwającej akcji.

Założenia oraz szczegółowy opis działania systemu ICRA przedstawione zostały w pracy [27]. Na potrzeby doktoratu omówiony został ogólny zarys systemu oraz kontekst związany z przeprowadzonym eksperymentem.

Na potrzeby systemu ICRA zaadaptowana została tzw. macierz zagrożeń, która grupuje najważniej- sze zagrożenia oraz podmioty, które mogą być podatne na dane zagrożenie. Macierz ta jest autorskim rozwinięciem metody stosowanej w niemieckiej straży pożarnej, wykonanym przez zespół projektu ICRA.

Różnica polega na wprowadzeniu stopniowania zagrożeń, co w lepszy sposób oddaje aktualny stan akcji.

Ta rozszerzona wersja nosi nazwę macierzy ryzyka. Wersja wykorzystywana w systemie ICRA została przedstawiona w tabeli 5.5. Wypełniona macierz wskazuje wszystkie rozważane zagrożenia podczas akcji ratowniczo-gaśniczej.

Tabela 5.5. Macierz ryzyka określająca występowanie ryzyka w podziale na zagrożenia i podmioty posiadające podatności na zagrożenia. Oznaczenia: A1 - strach, A2 - toksyczny dym, A3 - promieniowanie, A4 - rozprzestrze- nianie ognia, C - substancje chemiczne, E1 - zawalenie, E2 - elektryczność, E3 - choroba lub obrażenia, E4 -

eksplozja

Podmiot/Zagrożenie A1 A2 A3 A4 C E1 E2 E3 E4 Ludzie (ME)

Zwierzęta (T)

Środowisko (U) -

Mienie (S) - - - - -

Ratownicy (MA) -

Ekwipunek (G) - - -

Eksperyment bazuje na założeniu, iż dwie podobne do siebie akcje będą powiązane z podobnymi rodza- jami ryzyka. Celem głównym jest określenie zbioru rodzajów ryzyka dla trwającej akcji ratowniczo-gaśnieczej.

Eksperyment technicznie polega na zbadaniu podobieństwa pomiędzy zadaną akcją a repozytorium akcji historycznych w celu wyselekcjonowania najbardziej podobnych. Jeśli podobieństwo jest wystarczająco dobre, rodzaje ryzyka przypisane do odnalezionej akcji stają się kandydatami ryzyka dla zadanej akcji.

W tym celu należy zbudować reprezentację dla akcji w postaci wektorów cech, aby można było wykonać

porównania dwóch akcji między sobą. Wynikiem końcowym eksperymentu jest zmierzona skuteczność

metody oraz wykonane porównanie z innymi wybranymi metodami możliwymi do użycia do rozwiązania

tego problemu.

(22)

Rys. 5.3. Rozkłady podobieństw dla: wszystkich, najlepszych i najgorszych par obiektów, wyznaczonych przy użyciu metody leave-one-out. Wykres po lewej stronie odpowiada wynikom osiągniętym na zbiorze z 406 akcjami, a po prawej stronie na zbiorze z akcjami interwencyjnymi. Obydwa wykresy używają skali logarytmicznej. Oś Y

przedstawia liczbę par a oś X poklastrowaną wartość podobieństwa.

Tabela 5.6. Wybrane wskaźniki tendencji centralnej dla zbioru wyników, * - wynik dla zbioru 406 obiektów,

** - wynik dla zbioru 3736 obiektów. Skróty: wsz - wszystkie rozważane pary obiektów, njp - pary obiektów z najlepszą wartością podobieństwa dla poszczególnych akcji wejściowych, njg - pary obiektów z najniższą wartością

podobieństwa dla poszczególnych akcji wejściowych.

Wskaźnik -wsz -njp *-njg -all -njp **-njg

max 0.985 0.985 0.690 1.000 1.000 0.676

min 0.530 0.791 0.530 0.477 0.797 0.477

średnia arytmetyczna 0.815 0.940 0.627 0.811 0.956 0.606

mediana 0.820 0.946 0.630 0.824 0.961 0.608

odchylenie standardowe 0.061 0.028 0.031 0.062 0.023 0.030

wariancja 0.004 0.001 0.001 0.004 0.001 0.001

5.4.2. Opis wyników

Przeprowadzono dwa eksperymenty. Pierwszy został wykonany na małym zbiorze danych pochodzą- cym z systemu EWID

⁴

– zbiór zawierał 406 raportów z akcji ratowniczo -gaśniczej. Był to ten sam zbiór, który został użyty przez autorów pracy [8]. Eksperymenty z tej pracy bazowały na tych samych założe- niach i miały osiągnąć ten sam cel - zidentyfikować rodzaje ryzyka akcji ratowniczo-gaśniczej. Różnica polegała na doborze innych metod, niż opisane w niniejszym eksperymencie.

Drugi eksperyment przeprowadzony został na większym zbiorze danych, również pochodzącym z syste- mu EWID. Zbiór ten składał się z 3736 raportów. W przypadku obu eksperymentów użyta została metoda leave-one-out. W ogólności zbiory danych zawierały odpowiednio 164430 i 13953960 przetwarzanych par obiektów.

Liczby te nie są odzwierciedleniem pełnego iloczynu kartezjańskiego dla zbioru referencyjnego, gdyż część par została wyeliminowana poprzez funkcję progującą za zbyt niską wartość podobieństwa pomiędzy obiektami. Podstawowe wskaźniki tendencji centralnej dla obu zbioru wyników pokazane zostały w ta-

3 http://www.icra-project.org

4 System raportująco-ewidencyjny używany przez Państwową Straż Pożarną