i format wymiany danych terminologicznych
2.2.2. Sieć Semantyczna
2.2.2.3. Mapy tematów
Projekt Sieci Semantycznej można realizować na wiele sposobów. Pod-stawowym narzędziem umożliwiającym współpracę zasobów i procesów w internecie, bez udziału człowieka, jest RDF, który ma niejako status lingua franca Sieci Semantycznej. Równolegle do RDF -u rozwija się inna, niezależna koncepcja realizacji wizji Sieci Semantycznej — mapy tematów. Mapa tematów to „zbiór zasobów informacyjnych, traktowany przez aplikację map tematów jak zbiór połączonych ze sobą obiektów, których dokumentem centralnym jest mapa tematów, zgodna z architekturą języka SGML” (ISO/IEC 13250:2003 Information technology — SGML applications — Topic maps).
Mapy tematów nie przechowują dokumentów, lecz tylko odsyłają do nich za pomocą hiperłączy. Oznacza to, że mapa jest osobną, niezależną od zasobów strukturą i że można ją tworzyć nawet wówczas, gdy nie istnieją jeszcze zasoby związane z opisanymi przez nią tematami46.
Mapa tematów, będąca środkiem wyrażania i opisu ontologii, składa się z trzech rodzajów obiektów: tematów (topics), powiązań (associations) i wystą-pień (occurrences) (Zob.).
Rys. 7. Struktura map tematów Źródło: (tomaSzczyK, 2013).
45 Zob. zasoby serwisu LinkedDataTools.com pod adresem http://www.linkeddatatools.com.
46 Tworzenie mapy przebiega więc odwrotnie niż rzeczowe opracowywanie dokumentów
— w przypadku mapy temat łączymy z zasobem (dokumentem), a w opracowaniu rzeczowym punktem wyjścia jest dokument, któremu przyporządkowujemy hasło (temat).
Temat to dowolne, konkretne lub abstrakcyjne pojęcie. Na mapie temat reprezentuje przedmiot — osobę, rzecz, cechę, relację, zjawisko, zdarzenie, proces etc., czyli wszystko to, o czym można cokolwiek pomyśleć i wyrazić to słownie lub pisemnie. Temat posiada:
— nazwy: podstawową, do wyświetlania, do sortowania; możliwe jest również zapisywanie wariantów nazwy podstawowej oraz objaśnianie homonimów, na przykład: Wisła (miasto);
— zakres: określa kontekst, w którym dana nazwa jest używana; zakres jest definiowany za pomocą pojęć, takich jak język, dziedzina, zakres, zasięg etc.;
— typ tematu: tworzy z tematem relację mereologiczną o wzorcu obiekt — kla‑
sa (np. Warszawa — miasto); typ tematu jest również tematem.
(ISO/IEC 13250:2003 Information technology — SGML applications — Topic maps).
Powiązania tworzą sieć zależności między tematami. Powiązanie określa relację między dwoma lub większą liczbą tematów. Każde powiązanie repre- zentuje określony typ, a każdy temat biorący udział w relacji pełni w niej określoną rolę. Zarówno typy powiązań, jak i role tematów w powiązaniach są tematami.
Wystąpienia odsyłają do zasobów informacyjnych lub je reprezentują, czyli dostarczają opisów i adresów relewantnych dokumentów (zawierających informacje bibliograficzne) oraz podają fakty dotyczące tematów (informacje faktograficzne), w tym definicje pojęć, ekwiwalenty terminów w językach ob-cych oraz inne atrybuty, w zależności od zastosowania mapy. Inaczej mówiąc, wystąpienia wiążą tematy z zewnętrznymi zasobami, a także z wartościami cech tematów, które są przechowywane wewnątrz mapy. Każde wystąpienie ma określony typ (occurrence type), który również jest tematem.
Mapy tematów są nazywane GPS -em wszechświata informacji (the GPS of the information universe), ponieważ pozwalają na poruszanie się wśród ogrom-nej liczby danych i informacji różnego typu i w różnych formatach. Ich użytecz-ność wiąże się z właściwościami, jakie posiadają. Łącząc w sobie informacje faktograficzne i dokumentacyjne, mapy tematów przede wszystkim umożliwiają opisywanie dowolnych obiektów, ich cech i funkcji oraz — w przeciwieństwie na przykład do tezaurusów — pozwalają na definiowanie nieograniczonej liczby relacji. Mapa tematów jest samoistnym dokumentem, niezależnym od zasobów, z czego wynika że:
— tematy i powiązania między nimi mogą istnieć niezależnie od zasobów in-formacyjnych;
— jedna mapa może być użyta do wielu zbiorów zasobów;
— jeden zbiór zasobów może mieć wiele map;
— mapa umożliwia zarówno przeglądanie (w tym graficzną wizualizację) i fil-trowanie, jak i wieloaspektowe wyszukiwanie;
— mapa może odsyłać do tematów innej mapy, np. w celu weryfikacji znacze-nia tematu lub uzyskaznacze-nia dodatkowych informacji z nim związanych;
— można łączyć wiele map, aby uszczegółowić informacje lub poszerzyć za-kres tworzonego systemu (tomaSzczyK, 2013, s. 397).
Mapy tematów, które jako jedyne z map semantycznych47 doczekały się standaryzacji w postaci norm48, znajdują wiele zastosowań w organizacji informacji, zwłaszcza w przypadku nieustrukturalizowanych danych zgroma-dzonych w wielu heterogenicznych zasobach. Mogą okazać się szczególnie użyteczne w:
— katalogach bibliotek, muzeów i archiwów49 (również w celu integracji wielu katalogów50),
— automatycznym klasyfikowaniu zasobów (bibliotecznych, internetowych),
— zarządzaniu dokumentami i metadanymi w bibliotekach cyfrowych,
— e -learningu i transferze wiedzy,
— zarządzaniu witryną internetową (struktura witryny i system nawigacji mogą mieć postać map tematów),
— zarządzaniu informacją w instytucjach51 oraz przedsiębiorstwach i firmach (np. farmaceutycznych, samochodowych, wydawniczych) — wydawnic- twach encyklopedycznych (ułatwienie wyszukiwania informacji),
— modelowaniu procesów biznesowych. (tomaSzczyK, 2013, s. 398).
Mapa tematów to struktura dwuwarstwowa — ma warstwę tematów wraz z opisem ich cech i relacji, oraz warstwę zasobów, mimo że mapa przechowuje tylko hiperłącza do nich, a nie gromadzi ich w swojej bazie. Warto zwrócić
47 Istnieją również mapy: myśli, umysłu, pojęć, wiedzy. Nazewnictwo stosowane w odnie-sieniu do map jest mało precyzyjne i niekonsekwentnie używane. Częstym błędem jest np. za-mienne stosowanie określeń mapa pojęć i mapa tematów. Mapa pojęć różni się od mapy tematów tym, że posiada tylko warstwę konceptualną i nie zawiera powiązań z zasobami zewnętrznymi.
48 1) ISO/IEC 13250:2003 Information technology — SGML applications — Topic maps;
2) ISO/IEC 13250 -2: 2006 Information technology — Topic Maps — Part 2: Data Model; 3) ISO/
IEC 13250 -3: 2007 Information technology — Topic Maps — Part 3: XML Syntax; 4) ISO/IEC 13250 -4: 2009 Information technology — Topic Maps — Part 4: Canonicalization; 5) ISO/IEC 13250 -5, Information technology — Topic Maps — Part 5: Reference Model (w trakcie two-rzenia); 6) ISO/IEC 13250 -6:2010 Information technology — Topic Maps — Part 6: Compact syntax.
49 Zastosowanie map tematów do reprezentacji katalogu bibliotecznego testuje się np.
w National Digital Library of Korea (Koreańska Narodowa Biblioteka Cyfrowa).
50 Prototypowe systemy map tematów integrujące różne katalogi funkcjonują np. w Dan-marks Kunstbiblioteks (Duńska Narodowa Biblioteka Sztuki) i Det Kongelige Bibliotek (Biblio-teka Królewska, Dania).
51 Mapy tematów są wykorzystywane np. w Departamencie Energii Stanów Zjednoczonych i w amerykańskim urzędzie podatkowym.
uwagę na fakt, że mapa ma ogromną wartość informacyjną, w tym terminolo-giczną, nawet wtedy, gdy ma tylko warstwę tematów, bez odesłań do zewnętrz-nych zasobów.
Struktura i funkcje map tematów pozwalają sądzić, iż są one odpowied-nim narzędziem do zarządzania informacją terminologiczną, która obejmuje zarówno opisy pojęć i terminów, jak i źródeł (zasobów), a także zawiera szereg danych faktograficznych. Warstwa tematów może zawierać wszystkie dane ter-minologiczne oraz relacje między pojęciami. Oprócz relacji generycznych, koja-rzeniowych i ekwiwalencji, można w niej dodatkowo zdefiniować wiele innych ich typów, na przykład specyfikacje relacji kojarzeniowych52 oraz szczegółowe relacje pozajęzykowe. Warstwa zasobów zawierałaby odnośniki do obiektów in-formacyjnych: stron i serwisów WWW, materiałów multimedialnych, katalogów i bibliograficznych baz danych (hiperłącza mogłyby odsyłać do konkretnego opisu bibliograficznego w bazie, na przykład w katalogu NUKAT lub WorldCat).
Jeśli system informacji terminologicznej dopuszczałby wiele definicji terminów, co — jak już zostało wspomniane — jest bardzo przydatnym rozwiązaniem, opisy źródeł definicji znajdą się w warstwie tematów i mogą jednocześnie stano-wić hiperłącza do zasobów zewnętrznych. Warto również zauważyć, że łącząc system terminologiczny z zasobami informacyjnymi i uzupełniając dane fak-tograficzne, tworzymy dziedzinową bazę wiedzy, ponieważ opisujemy pojęcia, ich funkcje, cechy, wartości tych cech oraz relacje, a dodatkowo gromadzimy związaną z każdym tematem bibliografię.
Porównując standardy RDF (w tym SKOS) z mapami tematów, można dostrzec między nimi zarówno podobieństwa, jak i różnice. Nadrzędnym, wspólnym celem tych dwóch technologii jest zdefiniowanie i wdrożenie formatu umożliwiającego zapisywanie i wymianę informacji w internecie. Inne podo-bieństwa między nimi to między innymi: wykorzystanie ontologii, tworzenie abstrakcyjnych, relacyjnych modeli, stosowanie języka XML oraz opisywanie obiektów za pomocą dowolnej liczby cech i relacji.
Podstawową różnicę między RDF a mapami tematów daje się zauważyć w zastosowaniu tych standardów — RDF jest przeznaczony przede wszystkim do automatycznego integrowania dużych ilości danych oraz wykorzystywania sztucznej inteligencji w mechanizmach wnioskowania i systemach agentowych, mapy tematów zaś służą głównie organizowaniu oraz wyszukiwaniu (przeglą-daniu, filtrowaniu) informacji i są ukierunkowane na działania człowieka, a nie na automatyczne przetwarzanie przez programy komputerowe. RDF opiera się na logice formalnej, aby ułatwić przetwarzanie danych maszynom, natomiast
52 Badania przeprowadzone przez Barbarę Wereszczyńską -Cisło i i Wiesławę Ogórkiewicz wykazały, że „jednoczesne wykorzystanie specyfikacji relacji kojarzeniowych w tezaurusie i od-powiednio skonstruowanego systemu wskaźników roli może wpływać znacząco korzystnie za-równo na kompletność, jak i na trafność wyszukiwania, a więc może zwiększać efektywność stosowanego JIW” (weresZcZyńska‑cisło, oGórKiewicz, 1986, s. 69).
mapy tematów bazują na języku naturalnym, aby ułatwić pracę ludziom. Można więc wysunąć ogólne twierdzenie, że RDF prezentuje podejście technocen-tryczne, mapy tematów zaś — humanocentryczne. Żadne z tych narzędzi nie jest w sposób obiektywny lepsze od drugiego, a wybór między nimi zależy od typu realizowanego zadania.
Niezależne stosowanie RDF i map tematów powoduje wprowadzanie do internetu kolejnych niekompatybilnych formatów danych, co jest obecnie jednym z największych problemów internetowych zasobów informacyjnych.
Ponieważ RDF i mapy tematów mają szeroki zakres zastosowań, a operując na różnych poziomach abstrakcji często się uzupełniają, ważne jest opracowanie metody zintegrowania tych technologii. Powstało kilka propozycji rozwiązania tego problemu — zob. np. (lacher, decKer, 2001; oGievetSKy, 2001; GarShol, 2003), ale na razie żadne z nich nie zostało uznane za oficjalny standard (PePPer et al., 2006).
* * *
Technologia informatyczna umożliwia wieloaspektowe przetwarzanie da-nych terminologiczda-nych, pomagając w prowadzeniu badań naukowych nad istotą i rozwojem słownictwa danej dziedziny, a także oferując niespotykane jak dotąd możliwości wykorzystania terminologii do organizacji i udostępniania wiedzy.
Zarządzanie terminologią oraz szeroko rozumianym słownictwem specjalistycz-nym przyczynia się do wzrostu jakości i wydajności pracy, ułatwia przystoso-wanie produktów do sprzedaży na rynkach międzynarodowych, wpływa na poprawę komunikacji między naukowcami i specjalistami z różnych dziedzin nauki i techniki oraz ułatwia organizację i wyszukiwanie informacji.