Wybór plaRormy agentowej
2. Problemy inteligentnego wyszukiwania informacji
2.1.3. Analiza zapytań użytkownika i odpowiedź systemu
wyszukiwania
System wyszukiwania informacji zaproponowany przez autora rozprawy uwzględnia zapytanie w postaci frazy logicznej z operatorami AND i OR, przy czym samo zapytanie stanowi złożenie list słów dla każdego wspieranego parametru, a operatory logiczne są deWiniowane dla każdej listy oraz sumarycznie pomiędzy listami (więcej w sekcjach
Simple Search i Inverted Index Search, str. 107).
W innych rozważanych systemach zapytanie użytkownika może w podobny sposób uwzględniać operatory logiczne lub wspierać zadawanie zapytań w języku natu-‐ ralnym. Zapytanie takie jest wtedy analizowane przez dany system w sposób podobny do indeksacji samych dokumentów, czyli usuwane są (o ile istnieją i jest to celowe) słowa nieznaczące (dla zapytań w języku naturalnym), a następnie ma miejsce proces uzyski-‐ wania rdzenia słów użytych w zapytaniu i taką też zasadę przyjęto również w omawia-‐ nym systemie. Analiza dopasowań sprowadza się w takich systemach na sprawdzeniu występowania rdzeni w zapytaniu z rdzeniami terminów indeksowych opisujących dany dokument.
Poza zastosowanym przez autora podejściem w systemach stosowane są też następujące modele wyszukiwania informacji: wektorowy oraz probabilistyczny [140]. Modele te uwzględniają stopień dopasowania pomiędzy zapytaniem, a wektorową repre-‐ zentacją dokumentu opisywaną wcześniej jako wynik dostarczają użytkownikowi listę dokumentów wraz z miarą dopasowania dokumentów do zapytania. Wartość dopasowa-‐ nia jest wyliczana poprzez porównanie wektorów dokumentów oraz wektora terminów zapytania, uwzględniając także rozkład wszystkich terminów indeksowych w całym zbiorze dokumentów. Rozwiązanie to nie zostało jednak uwzględnione z uwagi, iż przede wszystkim w pracy koncentrowano się na szybkości działania metod wyszukiwa-‐ nia. Analiza dotyczyła aspektów wyszukiwania spersonalizowanego, a nie na rozbudowy algorytmów wyszukiwania treści.
2.2. Możliwości wyszukiwania w systemach rozproszonych
2.2.1. Metody wyszukiwania w rozproszonych systemach repozytoriów
W zależności od konstrukcji systemu rozproszonego autor rozprawy zaproponował następujące podejścia [83]:– dla lokalnego wyszukiwania danych w systemie lokalnym stanowiącym część złożo-‐ nego systemu rozproszonego.
– dla wyszukiwania danych w odległych repozytoriach systemu rozproszonego. Strukturę modelu przedstawia rysunek 7 (str. 21).
Zaproponowano różne podejścia do wyszukiwania obiektów w zależności od specyWiki lokalnej grupy użytkowników docelowych i tak:
(A) Komunikacja wewnątrz intranetu opiera się o szybkie narzędzia wyszukiwania w bazach danych lokalnych ośrodków naukowo-‐badawczych. Realizacja winna być nastawiona na zminimalizowanie czasu dostępu do danych zasobów. Stosowanie technik agentowych nie wydaje się w tym przypadku wskazane, gdyż obsługa agentów jest procesem czasochłonnym [92]. Przeprowadzone testy wykazały, że skuteczniejszym rozwiązaniem jest zastosowanie typowej komunikacji klient-‐serwer (Rys. 17)[83].
Rysunek 17. Wyszukiwanie obiektów w intranecie
(B) Komunikacja w sieci globalnej Internet wymaga już innego podejścia. Zakładając, że informacja może być zlokalizowana w różnych lokalnych intranetach, które razem tworzą rozproszony system, transmisja zapytań poprzez Internet winna być ograniczona do minimum. W tym przypadku wykorzystanie podejścia agentowego sprawdza się. Nakład pracy związany z obsługą agentów pomiędzy ośrodkami jest akceptowalny i niższy w przypadku rozbudowanych zapytań [92], których realizacja (zgodnie z algo-‐ rytmem agenta) dokonywana jest już po stronie serwera w intranecie (Rys. 18)[83].
Rysunek 18. Wyszukiwanie obiektów w Internecie w przypadku użytkowników intranetów.
W przypadku użytkowników Internetu zaproponowano wprowadzenie serwerów obsługujących i pośredniczących w generowaniu zapytań, delegowaniu agenta i przecho-‐
wywaniu zgromadzonych wyników w sytuacji kiedy użytkownik nie korzysta w danej chwili z systemu (Rys. 19)[83].
Rysunek 19. Wyszukiwanie obiektów w Internecie w przypadku użytkowników Internetu.
Użytkownik końcowy w zależności od charakteru poszukiwanej informacji może poszukiwać jej w ogólnodostępnej sieci globalnej, lub w sieci swojego przedsiębiorstwa, czy grupy roboczej. Przedstawiony powyżej podział systemów informacyjnych uwzględ-‐ nia charakter zgromadzonej w nich, czy szukanej za ich pośrednictwem, informacji. Przedstawione dwie koncepcje opisu określają sposób dostępu do informacji i ewentual-‐ nego jej rozprzestrzeniania.
Zaproponowano także inną strategię mającą zwiększyć wydajność wyszukiwania, przy rzadko zmieniających się zasobach lokalnych intranetów i znacznej liczbie często korzystających z nich użytkowników [89]. Dotychczasowa prezentowana strategia doty-‐ czyła procesu tworzenia i delegowania agentów do wykonania operacji wyszukiwania w zdalnych repozytoriach w imieniu użytkownika. W alternatywnym podejściu zapropo-‐ nowano zastosowanie techniki agentowej do automatycznej aktualizacji baz danych czy metadanych pomiędzy współpracującymi ze sobą jednostkami (Rys. 20) [89].
Rysunek 20. Wyszukiwanie obiektów w Internecie w przypadku użytkowników Internetu.
Prezentowane rozwiązanie zostało nie tylko zaprojektowane, ale jego szczególny przypadek jakim jest aktualizacja metadanych został w pełni zaimplementowany. Szcze-‐ gółowy opis procesu aktualizacji został przedstawiony w: [84]. Przy tworzeniu agento-‐ wego systemu aktualizacji baz metadanych wykorzystano platformę Voyager Firmy ObjectSpace pozwalającą na zarówno delegowanie agentów jak i komunikację klient-‐ serwer w oparciu o standard CORBA (www.omg.org) [43].
Strukturę komunikacji API przedstawia rysunek 21.
Rysunek 21. Wyszukiwanie obiektów w Internecie w przypadku użytkowników Internetu.
Autor rozprawy zaproponował również możliwość wykorzystania opisów ontolo-‐ gicznych [85] przy wyszukiwaniu danych zarówno w zdalnych repozytoriach, przez użyt-‐ kowników lokalnych systemów, jak i użytkowników internetowych. Zastosowanie onto-‐ logii wydaje się być korzystne w obu tych sytuacjach:
1. W przypadku wyszukiwania obiektów przez użytkowników lokalnych intranetów, w intranetach innych ośrodków, korzyści zastosowania ontologii polegają przede wszystkim na uzyskaniu jednoznaczności pojęć i ich różnych powiązań stosowanych przez użytkowników wewnątrz danego systemu. Ponadto wprowadzenie serwisu pośredniczącego (ontology service) (Rys. 22) [85] pozwali na mapowanie relacji znaczeniowej pojęć stosowanych do opisu dokumentów w różnych systemach lokalnych.
Rysunek 22. Wykorzystanie serwisów zorientowanych na ontologie w przypadku użytkowników intranetu.
2. W przypadku użytkowników internetowych istotne jest zapewnieniu możliwości odnalezienia poszukiwanych treści w globalnej sieci. Schemat interfejsów został przedstawiony na rysunku 23 [85]. Użytkownik mając dostęp do globalnej sieci może deWiniować zapytanie, uwzględniające wszelkie aspekty poszukiwanych zagadnień (charakter, aspekty kulturowe, etc.), w oparciu o już istniejące ontologie (E1), albo w oparciu o samodzielnie zdeWiniowaną ontologię (E2). Kolejną możliwością jest umieszczenie w sieci własnych stron z osadzonymi znacznikami semantycznymi (A/B). Dzięki takiemu rozwiązaniu unikniemy niepotrzebnego indeksowania treści zbędnych, a treść zindeksowana w pełni będzie odpowiadać intencjom autora strony. Osoba poszukująca, korzystając z takich serwisów (zorientowanych na ontologie), ma pewność uzyskania poszukiwanych treści (D). Należy także nadmienić, iż zasto-‐ sowanie serwisów wspierających ontologie (C) pozwoli „przetłumaczyć” pojęcia i ich wzajemne relacje pomiędzy ontologiami, w pełni dostarczając użytkownikom wsparcia przy dotarciu do poszukiwanej informacji. Stworzenie globalnej rozszerzal-‐
nej sieci semantycznej pozwala ponadto odciążyć użytkownika od Wiltrowania znale-‐ zionej treści, gdyż znaczenia zawarte w ontologiach mogą być przetwarzane przez same aplikacje realizowane np. poprzez agentów mobilnych, działających naszym imieniu w sieci [85].
Rysunek 23. Wykorzystanie serwisów zorientowanych na ontologie w przypadku indywidualnych użytkowników internetowych.