• Nie Znaleziono Wyników

i format wymiany danych terminologicznych

2.2.2. Sieć Semantyczna

2.2.2.3. Mapy tematów

Projekt Sieci Semantycznej można realizować na wiele sposobów. Pod-stawowym narzędziem umożliwiającym współpracę zasobów i procesów w internecie, bez udziału człowieka, jest RDF, który ma niejako status lingua franca Sieci Semantycznej. Równolegle do RDF -u rozwija się inna, niezależna koncepcja realizacji wizji Sieci Semantycznej — mapy tematów. Mapa tematów to „zbiór zasobów informacyjnych, traktowany przez aplikację map tematów jak zbiór połączonych ze sobą obiektów, których dokumentem centralnym jest mapa tematów, zgodna z architekturą języka SGML” (ISO/IEC 13250:2003 Information technology — SGML applications — Topic maps).

Mapy tematów nie przechowują dokumentów, lecz tylko odsyłają do nich za pomocą hiperłączy. Oznacza to, że mapa jest osobną, niezależną od zasobów strukturą i że można ją tworzyć nawet wówczas, gdy nie istnieją jeszcze zasoby związane z opisanymi przez nią tematami46.

Mapa tematów, będąca środkiem wyrażania i opisu ontologii, składa się z trzech rodzajów obiektów: tematów (topics), powiązań (associations) i wystą-pień (occurrences) (Zob.).

Rys. 7. Struktura map tematów Źródło: (tomaSzczyK, 2013).

45 Zob. zasoby serwisu LinkedDataTools.com pod adresem http://www.linkeddatatools.com.

46 Tworzenie mapy przebiega więc odwrotnie niż rzeczowe opracowywanie dokumentów

— w przypadku mapy temat łączymy z zasobem (dokumentem), a w opracowaniu rzeczowym punktem wyjścia jest dokument, któremu przyporządkowujemy hasło (temat).

Temat to dowolne, konkretne lub abstrakcyjne pojęcie. Na mapie temat reprezentuje przedmiot — osobę, rzecz, cechę, relację, zjawisko, zdarzenie, proces etc., czyli wszystko to, o czym można cokolwiek pomyśleć i wyrazić to słownie lub pisemnie. Temat posiada:

— nazwy: podstawową, do wyświetlania, do sortowania; możliwe jest również zapisywanie wariantów nazwy podstawowej oraz objaśnianie homonimów, na przykład: Wisła (miasto);

— zakres: określa kontekst, w którym dana nazwa jest używana; zakres jest definiowany za pomocą pojęć, takich jak język, dziedzina, zakres, zasięg etc.;

— typ tematu: tworzy z tematem relację mereologiczną o wzorcu obiekt — kla‑

sa (np. Warszawa — miasto); typ tematu jest również tematem.

(ISO/IEC 13250:2003 Information technology — SGML applications — Topic maps).

Powiązania tworzą sieć zależności między tematami. Powiązanie określa relację między dwoma lub większą liczbą tematów. Każde powiązanie repre- zentuje określony typ, a każdy temat biorący udział w relacji pełni w niej określoną rolę. Zarówno typy powiązań, jak i role tematów w powiązaniach są tematami.

Wystąpienia odsyłają do zasobów informacyjnych lub je reprezentują, czyli dostarczają opisów i adresów relewantnych dokumentów (zawierających informacje bibliograficzne) oraz podają fakty dotyczące tematów (informacje faktograficzne), w tym definicje pojęć, ekwiwalenty terminów w językach ob-cych oraz inne atrybuty, w zależności od zastosowania mapy. Inaczej mówiąc, wystąpienia wiążą tematy z zewnętrznymi zasobami, a także z wartościami cech tematów, które są przechowywane wewnątrz mapy. Każde wystąpienie ma określony typ (occurrence type), który również jest tematem.

Mapy tematów są nazywane GPS -em wszechświata informacji (the GPS of the information universe), ponieważ pozwalają na poruszanie się wśród ogrom-nej liczby danych i informacji różnego typu i w różnych formatach. Ich użytecz-ność wiąże się z właściwościami, jakie posiadają. Łącząc w sobie informacje faktograficzne i dokumentacyjne, mapy tematów przede wszystkim umożliwiają opisywanie dowolnych obiektów, ich cech i funkcji oraz — w przeciwieństwie na przykład do tezaurusów — pozwalają na definiowanie nieograniczonej liczby relacji. Mapa tematów jest samoistnym dokumentem, niezależnym od zasobów, z czego wynika że:

— tematy i powiązania między nimi mogą istnieć niezależnie od zasobów in-formacyjnych;

— jedna mapa może być użyta do wielu zbiorów zasobów;

— jeden zbiór zasobów może mieć wiele map;

— mapa umożliwia zarówno przeglądanie (w tym graficzną wizualizację) i fil-trowanie, jak i wieloaspektowe wyszukiwanie;

— mapa może odsyłać do tematów innej mapy, np. w celu weryfikacji znacze-nia tematu lub uzyskaznacze-nia dodatkowych informacji z nim związanych;

— można łączyć wiele map, aby uszczegółowić informacje lub poszerzyć za-kres tworzonego systemu (tomaSzczyK, 2013, s. 397).

Mapy tematów, które jako jedyne z map semantycznych47 doczekały się standaryzacji w postaci norm48, znajdują wiele zastosowań w organizacji informacji, zwłaszcza w przypadku nieustrukturalizowanych danych zgroma-dzonych w wielu heterogenicznych zasobach. Mogą okazać się szczególnie użyteczne w:

— katalogach bibliotek, muzeów i archiwów49 (również w celu integracji wielu katalogów50),

— automatycznym klasyfikowaniu zasobów (bibliotecznych, internetowych),

— zarządzaniu dokumentami i metadanymi w bibliotekach cyfrowych,

— e -learningu i transferze wiedzy,

— zarządzaniu witryną internetową (struktura witryny i system nawigacji mogą mieć postać map tematów),

— zarządzaniu informacją w instytucjach51 oraz przedsiębiorstwach i firmach (np. farmaceutycznych, samochodowych, wydawniczych) — wydawnic- twach encyklopedycznych (ułatwienie wyszukiwania informacji),

— modelowaniu procesów biznesowych. (tomaSzczyK, 2013, s. 398).

Mapa tematów to struktura dwuwarstwowa — ma warstwę tematów wraz z opisem ich cech i relacji, oraz warstwę zasobów, mimo że mapa przechowuje tylko hiperłącza do nich, a nie gromadzi ich w swojej bazie. Warto zwrócić

47 Istnieją również mapy: myśli, umysłu, pojęć, wiedzy. Nazewnictwo stosowane w odnie-sieniu do map jest mało precyzyjne i niekonsekwentnie używane. Częstym błędem jest np. za-mienne stosowanie określeń mapa pojęć i mapa tematów. Mapa pojęć różni się od mapy tematów tym, że posiada tylko warstwę konceptualną i nie zawiera powiązań z zasobami zewnętrznymi.

48 1) ISO/IEC 13250:2003 Information technology — SGML applications — Topic maps;

2) ISO/IEC 13250 -2: 2006 Information technology — Topic Maps — Part 2: Data Model; 3) ISO/

IEC 13250 -3: 2007 Information technology — Topic Maps — Part 3: XML Syntax; 4) ISO/IEC 13250 -4: 2009 Information technology — Topic Maps — Part 4: Canonicalization; 5) ISO/IEC 13250 -5, Information technology — Topic Maps — Part 5: Reference Model (w trakcie two-rzenia); 6) ISO/IEC 13250 -6:2010 Information technology — Topic Maps — Part 6: Compact syntax.

49 Zastosowanie map tematów do reprezentacji katalogu bibliotecznego testuje się np.

w National Digital Library of Korea (Koreańska Narodowa Biblioteka Cyfrowa).

50 Prototypowe systemy map tematów integrujące różne katalogi funkcjonują np. w Dan-marks Kunstbiblioteks (Duńska Narodowa Biblioteka Sztuki) i Det Kongelige Bibliotek (Biblio-teka Królewska, Dania).

51 Mapy tematów są wykorzystywane np. w Departamencie Energii Stanów Zjednoczonych i w amerykańskim urzędzie podatkowym.

uwagę na fakt, że mapa ma ogromną wartość informacyjną, w tym terminolo-giczną, nawet wtedy, gdy ma tylko warstwę tematów, bez odesłań do zewnętrz-nych zasobów.

Struktura i funkcje map tematów pozwalają sądzić, iż są one odpowied-nim narzędziem do zarządzania informacją terminologiczną, która obejmuje zarówno opisy pojęć i terminów, jak i źródeł (zasobów), a także zawiera szereg danych faktograficznych. Warstwa tematów może zawierać wszystkie dane ter-minologiczne oraz relacje między pojęciami. Oprócz relacji generycznych, koja-rzeniowych i ekwiwalencji, można w niej dodatkowo zdefiniować wiele innych ich typów, na przykład specyfikacje relacji kojarzeniowych52 oraz szczegółowe relacje pozajęzykowe. Warstwa zasobów zawierałaby odnośniki do obiektów in-formacyjnych: stron i serwisów WWW, materiałów multimedialnych, katalogów i bibliograficznych baz danych (hiperłącza mogłyby odsyłać do konkretnego opisu bibliograficznego w bazie, na przykład w katalogu NUKAT lub WorldCat).

Jeśli system informacji terminologicznej dopuszczałby wiele definicji terminów, co — jak już zostało wspomniane — jest bardzo przydatnym rozwiązaniem, opisy źródeł definicji znajdą się w warstwie tematów i mogą jednocześnie stano-wić hiperłącza do zasobów zewnętrznych. Warto również zauważyć, że łącząc system terminologiczny z zasobami informacyjnymi i uzupełniając dane fak-tograficzne, tworzymy dziedzinową bazę wiedzy, ponieważ opisujemy pojęcia, ich funkcje, cechy, wartości tych cech oraz relacje, a dodatkowo gromadzimy związaną z każdym tematem bibliografię.

Porównując standardy RDF (w tym SKOS) z mapami tematów, można dostrzec między nimi zarówno podobieństwa, jak i różnice. Nadrzędnym, wspólnym celem tych dwóch technologii jest zdefiniowanie i wdrożenie formatu umożliwiającego zapisywanie i wymianę informacji w internecie. Inne podo-bieństwa między nimi to między innymi: wykorzystanie ontologii, tworzenie abstrakcyjnych, relacyjnych modeli, stosowanie języka XML oraz opisywanie obiektów za pomocą dowolnej liczby cech i relacji.

Podstawową różnicę między RDF a mapami tematów daje się zauważyć w zastosowaniu tych standardów — RDF jest przeznaczony przede wszystkim do automatycznego integrowania dużych ilości danych oraz wykorzystywania sztucznej inteligencji w mechanizmach wnioskowania i systemach agentowych, mapy tematów zaś służą głównie organizowaniu oraz wyszukiwaniu (przeglą-daniu, filtrowaniu) informacji i są ukierunkowane na działania człowieka, a nie na automatyczne przetwarzanie przez programy komputerowe. RDF opiera się na logice formalnej, aby ułatwić przetwarzanie danych maszynom, natomiast

52 Badania przeprowadzone przez Barbarę Wereszczyńską -Cisło i i Wiesławę Ogórkiewicz wykazały, że „jednoczesne wykorzystanie specyfikacji relacji kojarzeniowych w tezaurusie i od-powiednio skonstruowanego systemu wskaźników roli może wpływać znacząco korzystnie za-równo na kompletność, jak i na trafność wyszukiwania, a więc może zwiększać efektywność stosowanego JIW” (weresZcZyńska­‍‑cisło, oGórKiewicz, 1986, s. 69).

mapy tematów bazują na języku naturalnym, aby ułatwić pracę ludziom. Można więc wysunąć ogólne twierdzenie, że RDF prezentuje podejście technocen-tryczne, mapy tematów zaś — humanocentryczne. Żadne z tych narzędzi nie jest w sposób obiektywny lepsze od drugiego, a wybór między nimi zależy od typu realizowanego zadania.

Niezależne stosowanie RDF i map tematów powoduje wprowadzanie do internetu kolejnych niekompatybilnych formatów danych, co jest obecnie jednym z największych problemów internetowych zasobów informacyjnych.

Ponieważ RDF i mapy tematów mają szeroki zakres zastosowań, a operując na różnych poziomach abstrakcji często się uzupełniają, ważne jest opracowanie metody zintegrowania tych technologii. Powstało kilka propozycji rozwiązania tego problemu — zob. np. (lacher, decKer, 2001; oGievetSKy, 2001; GarShol, 2003), ale na razie żadne z nich nie zostało uznane za oficjalny standard (PePPer et al., 2006).

* * *

Technologia informatyczna umożliwia wieloaspektowe przetwarzanie da-nych terminologiczda-nych, pomagając w prowadzeniu badań naukowych nad istotą i rozwojem słownictwa danej dziedziny, a także oferując niespotykane jak dotąd możliwości wykorzystania terminologii do organizacji i udostępniania wiedzy.

Zarządzanie terminologią oraz szeroko rozumianym słownictwem specjalistycz-nym przyczynia się do wzrostu jakości i wydajności pracy, ułatwia przystoso-wanie produktów do sprzedaży na rynkach międzynarodowych, wpływa na poprawę komunikacji między naukowcami i specjalistami z różnych dziedzin nauki i techniki oraz ułatwia organizację i wyszukiwanie informacji.

Struktura modelu systemu

W dokumencie Model systemu informacji terminologicznej (Stron 161-167)