• Nie Znaleziono Wyników

Rozdział 4. Ontologia Cyc

5.1. Ogólny problem mapowania

5.1.1. Definicja

Po opisaniu Słownika Semantycznego J˛ezyka Polskiego oraz ontologii Cyc mo˙zemy szczegółowo przedstawi´c zagadnienia ich mapowania.

Z definicji 3.1 oraz 4.1 wynika, ˙ze obiekty te s ˛a strukturami abstrakcyjnymi słu˙z ˛acymi do opisu ogólnie poj˛etej rzeczywisto´sci i wykorzystuj ˛a w tym celu pewne ´sci´sle okre´slone

´srodki wyrazu (w przypadku słownika s ˛a to słowa i relacje semantyczne, w przypadku on-tologii – koncepty, indywidua, relacje, etc.).

Łatwo mo˙zna zauwa˙zy´c pewne podobie´nstwo pomi˛edzy tymi strukturami – poszczególne elementy słownika posiadaj ˛a swoje odpowiedniki w ontologii. Na tym wła´snie polega mapowanie jednej struktury na drug ˛a – na wskazaniu odpowiadaj ˛acych sobie elementów tych struktur i zachowaniu tej informacji w jednej ze struktur.

Definicja 5.1. Mapowanie struktury abstrakcyjnej A na struktur˛e abstrakcyjn ˛a B (ozn.

A ; B) polega na rozpoznaniu elementów struktury B, które odpowiadaj ˛a elementom struktury A i zachowaniu informacji o tym w jednej ze struktur.

Problemem tej definicji jest jednak to, ˙ze nie wskazuje podstawy, która wykorzysty-wana jest do rozpoznania odpowiadaj ˛acych sobie elementów. Wskazanie owej podstawy jest czynnikiem koniecznym dla oceny poprawno´sci proponowanego mapowania. Jak wskazal-i´smy wcze´sniej – obie struktury, na swój sposób, odzwierciedlaj ˛a rzeczywisto´s´c – dlatego te˙z wył ˛acznie ona mo˙ze by´c poszukiwan ˛a podstaw ˛a.

40

5.1. Ogólny problem mapowania 41 Odwołuj ˛ac si˛e do modelu znaczenia przedstawionego w punkcie 2.2, mo˙zemy sfor-mułowa´c warunki poprawno´sci mapowania poszczególnych symboli1wyst˛epuj ˛acych w tych strukturach.

Definicja 5.2. Warunkiem koniecznym semantycznej poprawno´sci mapowania sym-bolu x wyst˛epuj ˛acego w strukturze abstrakcyjne A, na symbol y wyst˛epuj ˛acy w strukturze abstrakcyjne B, jest posiadanie przez symbol x tej samej denotacji (lub ekstensji) co symbol y.

Innymi słowy – aby mo˙zna było uzna´c, ˙ze symbole te odpowiadaj ˛a sobie, obiekt (resp.

zbiory obiektów), do którego odnosi si˛e symbol wyst˛epuj ˛acy w pierwszej ze struktur, musi by´c identyczny z obiektem (resp. zbiorem obiektów), do którego odnosi si˛e symbol wys-t˛epuj ˛acy w drugiej ze struktur.

Nale˙zy zwróci´c tutaj uwag˛e na dwa problemy. Pierwszy dotyczy ogólnej mo˙zliwo´sci mapowani ró˙znych struktur na siebie. Aby zachowa´c ´sci´sle warunek 5.2, konieczne jest, aby konceptualizacja wyra˙zona w obu strukturach była identyczna. Jest to w zasadzie bardzo mało prawdopodobne, w szczególno´sci dla symboli posiadaj ˛acych wieloelementowe ek-stensje. Dlatego te˙z warunek ten mo˙ze zosta´c osłabiony poprzez zast ˛apienie wymogu iden-tyczno´sci ekstensji, wymogiem istotnego nachodzenia na siebie ekstensji. Oczywi´scie nie da si˛e tutaj ´sci´sle sformułowa´c na czym owa istotno´s´c miałaby polega´c – st ˛ad te˙z bior ˛a si˛e podstawowe problemy w mapowaniu2.

Drugi problem wynika z faktu, ˙ze znaczenie poszczególnych symboli nie zale˙zy wył ˛acznie od ich ekstensji, ale konstytuowane jest przez relacje w jakie wchodz ˛a z pozostałymi symbo-lami. Dlatego przedstawiony wcze´sniej warunek konieczny musi zosta´c uzupełniony warunk-iem wystarczaj ˛acym:

Definicja 5.3. Warunkiem wystarczaj ˛acym semantycznej poprawno´sci mapowania sym-bolu x wyst˛epuj ˛acego w strukturze A na symbol y wyst˛epuj ˛acy w strukturze B, jest zachodze-nie tych samych relacji pomi˛edzy symbolem x, a symbolami struktury A, które posiadaj ˛a swoje odpowiedniki w strukturze B oraz pomi˛edzy symbolem y a symbolami wyst˛epuj ˛acymi w strukturze B, b˛ed ˛acymi odpowiednikami symboli ze struktury A.

Bardziej formalnie – je´sli warunek:

∀z1, z2 :µ³R(x, z1) ∧ z1 ; z2

´→ R(y, z2)

gdzie:

– x ; y oznacza: symbol y odpowiada symbolowi x (symbol x jest zmapowany na symbol y).

– x, z1 nale˙z ˛a do struktury A – y, z2 nale˙z ˛a do struktury B

zachodzi dla ka˙zdej relacji R wyst˛epuj ˛acej zarówno w strukturze A jak i w strukturze B, to mapowanie x ; y jest poprawne.

Równie˙z z tym warunkiem wi ˛a˙z ˛a si˛e dalsze problemy – podstawowy dotyczy relacji R. Relacja ta musi by´c identyczna w obu strukturach, aby definicja ta mogła zosta´c zas-tosowana. Poniewa˙z mapowane struktury zwykle konstruowane s ˛a niezale˙znie, to nie mo˙zna

1 Symbole to takie elementy badanych struktur, które mog ˛a by´c opisane za pomoc ˛a modelu znaczenia przedstawionego w punkcie 2.2.

2 Istotno´s´c ta nie mo˙ze by´c wyra˙zona np. w postaci liczbowej (90% pokrycie ekstensji), gdy˙z zwykle nie dysponuje si˛e dostatecznie licznymi ekstensjami (o ile w ogóle s ˛a one dost˛epne).

5.1. Ogólny problem mapowania 42

Rysunek 5.1. Ogólny schemat mapowania Słownika Semantycznego na ontologi˛e Cyc.

zagwarantowa´c, ˙ze relacje takie b˛ed ˛a faktycznie wyst˛epowa´c. Tym niemniej w wi˛ekszo´sci systemów ontologicznych oraz słowników semantycznych mo˙ze wskaza´c co najmniej kilka relacji, które mog ˛a zosta´c uto˙zsamione.

Warunek ten wskazuje równie˙z, ˙ze pierwszym, strategicznym krokiem, od którego nale˙zy rozpocz ˛a´c mapowanie, jest rozpoznanie w mapowanych strukturach odpowiadaj ˛acych sobie relacji.

Inny problem dotyczy procesu mapowania – przedstawiony warunek mo˙zna sprawdzi´c dopiero po zmapowaniu wszystkich symboli. Natomiast mapowanie (szczególnie r˛eczne oraz półautomatyczne) zwykle dokonywane jest iteracyjnie – tzn. w jednym kroku mapuje si˛e tylko jeden symbol i dla niego sprawdza odpowiednie warunki, bazuj ˛ac na wcze´sniej zmapowanych symbolach. Mo˙ze si˛e jednak zdarzy´c, ˙ze symbole, które zostan ˛a zmapowane pó´zniej, spowoduj ˛a naruszenie tego warunku (tzn. proces mapowania nie jest monotoniczny ze wzgl˛edu na ten warunek). Problem ten podobny jest do problemu nauki j˛ezyka obcego jedynie poprzez wskazywanie przedmiotów i formułowanie zda´n z wykorzystanie ju˙z poz-nanych słów. Wła´sciwa identyfikacja pierwotnego zestawu słów (symboli) konieczna jest aby proces ten zako´nczył si˛e sukcesem.

Problem ten mo˙zna rozwi ˛aza´c poprzez r˛eczne zmapowanie najbardziej ogólnych sym-boli (tzn. symsym-boli posiadaj ˛acych najwi˛eksze ekstensje) i bazowaniu na tej informacji w dalszym procesie mapowania. Najbardziej ogólne symbole wchodz ˛a bowiem w relacje z na-jwi˛eksz ˛a liczb ˛a innych symboli. Dodatkowo mo˙zna zastosowa´c strategi˛e top-down, w której, wychodz ˛ac od najbardziej ogólnych symboli, mapuje si˛e je zgodnie z rosn ˛acym stopniem ich specyficzno´sci.

Ogólny schemat mapowania Słownika Semantycznego na ontologi˛e Cyc przedstawiony jest na rys. 5.1. Wi˛eksze owale reprezentuj ˛a słowa wyst˛epuj ˛ace w słowniku, mniejsze – kolekcje i indywidua ontologii Cyc; linie proste – ró˙zne rodzaje relacji; natomiast łuki za-ko´nczone strzałkami wskazuj ˛a odpowiadaj ˛ace sobie elementy.

5.1. Ogólny problem mapowania 43 5.1.2. Ró˙znice

Poni˙zej przedstawiamy, konieczne do uwzgl˛ednienia w procesie mapowania, ró˙znice jakie mog ˛a wyst ˛api´c pomi˛edzy ontologiami oraz pomi˛edzy ontologiami i słownikami se-mantycznymi.

Ró˙znice wyst˛epuj ˛ace pomi˛edzy ontologiami

Zagadnienie mapowania formułowane jest głównie dla ontologii (np. [3, 6, 34]) – tzn. w definicji 5.1 okre´slenie abstrakcyjna struktura odnosi si˛e zwykle do ontologii. Dlatego te˙z w literaturze przedmiotu mo˙zna znale´z´c najwi˛ecej informacji na temat ró˙znic wyst˛epuj ˛acych pomi˛edzy ontologiami.

W [5, 34] wymienia si˛e nast˛epuj ˛ace ró˙znice:

1. Składnia j˛ezyka reprezentacji wiedzy.

2. Ekspresywno´s´c j˛ezyka reprezentacji wiedzy (np. obecno´s´c negacji, kwantyfikatorów, warto´sci domy´slnych, operatorów modalnych, zbiorów, etc.).

3. Fundamentalne ró˙znice reprezentacyjne (np. logika prawdziwo´sciowa vs. probabilistyka bayesowska).

4. Konwencje modelowania (np. modelowanie bardziej specyficznego konceptu za pomoc ˛a nowego konceptu lub „atrybutu-typu”).

5. Zasady reprezentacji „trudnych” poj˛e´c (np. reprezentacja czasu za pomoc ˛a interwałów lub punktów czasowych).

6. Odmienne nazewnictwo dla elementów posiadaj ˛acych t˛e sam ˛a semantyk˛e.

7. Odmienna semantyka dla elementów posiadaj ˛acych t˛e sam ˛a nazw˛e.

8. Reprezentacja własno´sci za pomoc ˛a atrybutów vs. funkcji vs. predykatów.

9. Proste ró˙znice strukturalne (np. jedna ontologia jest reorganizacj ˛a drugiej ontologii).

10. Zło˙zone ró˙znice strukturalne (np. predykaty akcji vs. zreifikowane zdarzenia).

Ró˙znice wyst˛epuj ˛ace pomi˛edzy ontologiami a słownikami semantycznymi

Ró˙znice, które wyst˛epuj ˛a pomi˛edzy poszczególnymi ontologiami, s ˛a jednak zwykle mniejsze ni˙z pomi˛edzy ontologiami a słownikami semantycznymi. Do najistotniejszych ró˙znic wys-t˛epuj ˛acych pomi˛edzy tymi strukturami nale˙z ˛a:

1. Przyj˛ety punkt widzenia.

2. Opisywana dziedzina wiedzy.

3. ´Srodki opisu.

4. ´Srodki identyfikacji.

5. G˛esto´s´c poj˛eciowa.

Punkt wiedzenia ontologii jest zazwyczaj naukowy, tzn. wiedza zawarta w ontologiach odzwierciedla, a przynajmniej powinna odzwierciedla´c, mniej lub bardziej aktualny stan wiedzy naukowej na temat wybranej dziedziny wiedzy. Tymczasem w słownikach semanty-cznych dominuje j˛ezykowy, czy te˙z zdroworozs ˛adkowy punkt widzenia. Aby uzna´c, ˙ze jaka´s relacja zachodzi pomi˛edzy wybranymi słowami, czy znaczeniami, wystarczy ´swiadectwo u˙zytkowników j˛ezyka lub ´swiadectwo tekstu w danym j˛ezyku. Cz˛estokro´c takie ´swiadectwo byłoby nieakceptowalne z naukowego punktu wiedzenia.

Dziedzina wiedzy: tylko niektóre ontologie nadaj ˛a si˛e do mapowania na nie słowników semantycznych, mianowicie – ontologie ogólne. Ontologie dziedzinowe zawieraj ˛a wiedz˛e specjalistyczn ˛a, natomiast słowniki semantyczne zawieraj ˛a słownictwo wykorzystywane

5.1. Ogólny problem mapowania 44 w dyskursie niefachowym. Gdyby u˙zy´c ontologii dziedzinowej jako ontologii, na któr ˛a mapowany jest słownik semantyczny, to wi˛ekszo´s´c słów wyst˛epuj ˛acych w słowniku nie znalazłaby swoich odpowiedników.

Srodki opisu to poj˛ecia jakie wykorzystywane s ˛´ a do opisu konceptualizacji w ontologii oraz relacje i ich elementy, które pojawiaj ˛a si˛e w słownikach semantycznych. Zidenty-fikowanie odpowiadaj ˛acych sobie klas ´srodków opisu nie jest jednak problematyczne, aczkol-wiek nale˙zy zwróci´c uwag˛e na pewne niebezpiecze´nstwa. Poszczególne odpowiadaj ˛ace so-bie klasy przedstawione s ˛a w tabeli 5.1.

Ontologia Słownik semantyczny

Koncepty Rzeczowniki pospolite, przymiotniki Indywidua Nazwy własne

Relacje Relacje semantyczne

Zdarzenia Czasowniki, rzeczowniki pospolite

Tablica 5.1. Klasy ´srodków opisu w ontologiach i słownikach semantycznych

Najbardziej problematyczne jest uto˙zsamienie relacji wyst˛epuj ˛acych w ontologiach z relacjami semantycznymi wyst˛epuj ˛acymi w słownikach semantycznych. Co prawda niek-tóre relacje wyst˛epuj ˛ace w słownikach, jak np. meronimia, posiadaj ˛a swoje odpowiedniki w ontologiach – gdy˙z relacja ta mo˙ze wyst˛epowa´c np. pomi˛edzy indywiduami wybranej ontologii. Tym niemniej relacja synonimii zazwyczaj nie wyst˛epuje w ontologiach, gdy˙z z zało˙zenia, w systemach tych identyfikacja poszczególnych klas obiektów powinna by´c jednoznaczna, dlatego te˙z nie powinny wyst˛epowa´c np. dwa koncepty, które byłyby syn-onimiczne. Dlatego, z wyj ˛atkiem sytuacji, w której chce si˛e wskaza´c synonimiczne poj˛ecia wyst˛epuj ˛ace w innej ontologii, relacja ta nie powinna pojawia´c si˛e w ontologiach.

Srodki identyfikacji to ´srodki słu˙z ˛´ ace do identyfikacji poszczególnych elementów danej struktury abstrakcyjnej. Zarówno w ontologiach jak i w słownikach semantycznych wyko-rzystuje si˛e w pewien sposób identyfikacj˛e słown ˛a – tzn. nazwa danego elementu wskazuje do czego on si˛e odnosi. Tym niemniej, z powodu zjawiska homonimii konieczne jest rozró˙z-nianie poszczególnych konceptów, które odnosz ˛a si˛e do poszczególnych homonimów. W ontologiach cz˛esto wykorzystuje si˛e zło˙zone nazwy, które wskazuj ˛a z którym z homonimów mamy do czynienia (np. zamek-urz ˛adzenia, zamek-budynek, zamek-pistoletu, etc.) natomi-ast w słownikach semantycznych nie mo˙zna skorzysta´c z tego rozwi ˛azania. Poszczególne homonimy s ˛a wyró˙znione, ale ka˙zdy z nich posiada t˛e sam ˛a etykiet˛e3. Problem ten mo˙ze by´c rozwi ˛azany w przypadku, gdy ontologia posiada leksykon dla wybranego j˛ezyka natu-ralnego.

G˛esto´s´c poj˛eciowa to liczba poj˛e´c wykorzystywanych do opisu jakiego´s fragmentu rzeczy-wisto´sci – mo˙ze by´c ona jedynie porównywana, gdy˙z trudno wyodr˛ebni´c jak ˛a´s „jednostk˛e rzeczywisto´sci”. Powiemy, ˙ze dana struktura abstrakcyjna posiada wi˛eksz ˛a g˛esto´s´c poj˛e-ciow ˛a od innej, je´sli do opisu pewnego obszaru wiedzy wykorzystuje wi˛ecej poj˛e´c, ni˙z inna struktura. Zazwyczaj ontologie posiadaj ˛a wi˛eksz ˛a g˛esto´s´c poj˛eciow ˛a ni˙z słowniki

seman-3 Czasami ró˙znice pomi˛edzy homonimami przekładaj ˛a si˛e na pewne ró˙znice gramatyczne, ale nie jest to zjawisko cz˛este i nie mogłoby w pełni wystarczy´c do identyfikacji poszczególnych homonimów.

5.2. Mapowanie Słownika Semantycznego J ˛ezyka Polskiego na ontologi ˛e Cyc 45

Powiązane dokumenty