2. Metodyka generowania danych semantycznych w przestrzennych
2.2. Predyspozycje odmiennych technik zarz ˛ adzania danymi i infor-
2.2.3. Technologie sieci semantycznych (Semantic Web)
Budowa Semantic Web to kolejny etap rozwoju Internetu, zmierzaj ˛acy do
prze-kształcenia rozproszonych zasobów w globaln ˛a baz˛e danych, zawieraj ˛ac ˛a infor-macje zrozumiałe zarówno dla ludzi, jak i dla maszyn. Wykorzystywany tam
mo-del sieci semantycznych nie jest czystym momo-delem matematycznym, ale ł ˛aczy
mno-Rys. 2.3. Wizualizacja danych przestrzennych zapisanych w modelu relacyjnym
go´sci, teorii grafów i logiki opisowej, prezentowane w formie sieciowej lub hierar-chicznej.
Istot ˛a sieci WWW i ´zródłem jej sukcesu s ˛a elastyczno´s´c i otwarto´s´c wynikaj ˛ace z braku narzuconego schematu danych. Koncepcja sieci semantycznej zmierza do zachowania zalet WWW, tworz ˛ac kolejn ˛a warstw˛e uzupełniaj ˛ac ˛a zasoby WWW o informacj˛e, czym one s ˛a. Powstaj ˛acy semantyczny opis okre´sla model logiczny dla zgromadzonych zasobów, definiuj ˛ac dla nich hierarchi˛e klas i wła´sciwo´sci bez narzuconego sztywnego schematu. Do technologii Semantic Web zalicza si˛e: • Linked data – koncepcja nadawania danym struktury poprzez ich wzajemne
powi ˛azanie. Wykorzystuje standardy stworzone dla WWW: HTTP (ang.
Hyper-text Transfer Protocol, http://www.w3.org/Protocols/rfc2616/rfc2616. html) i URI (ang. Uniform Resource Identifier,http://tools.ietf.org/html/ rfc3986) oraz standard RDF (ang. Resource Description Framework, http: //www.w3.org/RDF/).
• Ontologie – struktury słu˙z ˛ace do formalnego udost˛epniania reprezentacji
wie-dzy z okre´slonej dziedziny w postaci modelu logicznego. Model ten organizuje fakty w kategorie oraz definiuje ich wła´sciwo´sci i wzajemne relacje. Zarówno kategorie, jak i wła´sciwo´sci mog ˛a by´c zhierarchizowane.
• Systemy wyszukiwania i wnioskowania – obejmuj ˛a tzw. silniki
wnioskowa-nia (np. FaCT++ (http://owl.man.ac.uk/factplusplus/), Pellet (http:// clarkparsia.com/pellet), Hermit (http://www.hermit-reasoner.com/)),
zaprojektowane, aby w modelach wykorzystuj ˛acych logik˛e opisow ˛a DL
odkry-wa´c fakty na temat przynale˙zno´sci obiektów (które nie s ˛a wyra˙zone wprost,
a wynikaj ˛a np. ze zdefiniowanych ogranicze ´n na wła´sciwo´sciach) oraz j˛ezyki
org/Submission/SWRL/), ł ˛acz ˛acy konstrukcje j˛ezyka RuleML (ang. Rule
Mar-kup Language,http://ruleml.org/) ze składni ˛a OWL).
• J˛ezyki zapyta ´n – tym czym dla baz relacyjnych jest SQL, tym dla
gra-fów RDF jest SPARQL (ang. SPARQL Protocol and RDF Query
Langu-age,http://www.w3.org/TR/rdf-sparql-query/;http://www.w3.org/TR/ rdf-sparql-protocol/). SPARQL ma składni˛e podobn ˛a do SQL, przy czym SPARQL zamiast krotek z relacji (wierszy z tabel) zwraca trójki i w˛ezły z anali-zowanych grafów. Warunki ograniczaj ˛ace zwracan ˛a kolekcj˛e obiektów odnosz ˛a si˛e nie do warto´sci kolumn w tabelach, ale do poszczególnych elementów
tró-jek, np. do warto´sci okre´slonych predykatów stanowi ˛acych kraw˛edzie grafu.
Ontologie wykorzystuj ˛a pełn ˛a ekspresj˛e systemu formalnego logiki opisowej.
Fakty (obiekty, indywidua) s ˛a organizowane w kategorie (klasy, typy, koncepty).
Wła´sciwo´sci mog ˛a mie´c charakter atrybutów, którym mo˙zna przypisa´c konkretne
warto´sci lub cech definiuj ˛acych wzajemne relacje pomi˛edzy obiektami. Wi ˛azanie obiektów przez wła´sciwo´sci definiowane jest przez okre´slenie dziedziny (ang.
do-main) i zbioru warto´sci (ang. range).
Zarówno klasy, jak i wła´sciwo´sci mog ˛a by´c zhierarchizowane. Klasy, oprócz
miejsca w hierarchii, mog ˛a by´c definiowane poprzez restrykcje na
wła´sciwo-´sciach. Stanowi ˛a one system reguł opisuj ˛acych istot˛e klasy. Pozwala to na wpro-wadzanie bogatszej informacji ni˙z ta, któr ˛a zapewnia opis relacji pomi˛edzy ró˙z-nymi zasobami. Hierarchia klas (taksonomia) wraz z relacjami definiuje schemat poj˛eciowy dziedziny – meta-model opisywanych danych, czyli tzw. TBox (ang.
ter-minological component).
Zestaw faktów, opisanych w formie twierdze ´n (asercji), odwołuj ˛acych si˛e do
schematu poj˛eciowego, nosi nazw˛e ABox (ang. assertional component). Asercje
komponentu ABox stanowi ˛a opis rzeczywistych obiektów, zwanych te˙z
indywi-duami, których wła´sciwo´sciom przypisane s ˛a konkretne warto´sci i relacje. ABox
jest de facto grafem RDF.
Do zapisu ontologii wykorzystywane s ˛a standardy W3C: RDF, RDFS
(ang. RDF Vocabulary Description Language: RDF Schema,http://www.w3.org/
TR/rdf-schema/), OWL (ang. Web Ontology Language, obecnie w wersji 2.0 http://www.w3.org/TR/owl2-overview/), SKOS (ang. SKOS Simple Knowledge
Organization System,http://www.w3.org/2004/02/skos/). Najcz˛e´sciej
wyko-rzystywan ˛a notacj ˛a do kodowania zasobów w wy˙zej wymienionych
standar-dach jest RDF/XML, czyli zapis w j˛ezyku RDF ze składni ˛a j˛ezyka XML, który
jest wygodny, gdy˙z otwiera te zasoby do przetwarzania przez wszystkie
na-rz˛edzia tworzone dla XML. Ale istniej ˛a równie˙z mo˙zliwo´sci wykorzystania dla
ontologii lub grafów RDF innych notacji: Manchester Syntax (http://www. co-ode.org/resources/reference/manchester_syntax/), Turtle (ang. Terse
RDF Triple Language,http://www.w3.org/TeamSubmission/turtle/) lub N3
(ang. Notation 3 Logic,http://www.w3.org/DesignIssues/Notation3), a tak˙ze
OWL/XML (ang. OWL Web Ontology Language XML Presentation Syntax –
skład-nia XML, ale z własnymi elementami OWL, niezapo˙zyczonymi z RDF,http://
• kategoryzacj˛e semantyczn ˛a pomi˛edzy poj˛eciami, opisuj ˛ac ˛a relacje takie jak
sy-nonimia, hiponimia, hiperonimia; poj˛ecia te mog ˛a by´c wykorzystywane np.
jako słowa kluczowe w metadanych; tego typu słownikami s ˛a tezaurusy,
wy-korzystuj ˛ace do zapisu m.in. standard W3C SKOS (w formie grafu RDF);
• kategoryzacj˛e według relacji mi˛edzy zasobami stanowi ˛acych wła´sciwo´sci
za-sobów; w ten sposób definiowane s ˛a klasy obiektów, ich hierarchia
taksono-miczna oraz hierarchia wła´sciwo´sci (standardem jest tu np. RDF Schema, roz-szerzenie RDF);
• kategoryzacj˛e opart ˛a na formalizmie logiki opisowej; metoda ta uzupełnia
kla-syfikacj˛e opart ˛a na wła´sciwo´sciach o predefiniowane relacje typu logicznego,
takie jak to˙zsamo´s´c, rozł ˛aczno´s´c obiektów, wzbogaca opis wła´sciwo´sci (wła´sci-wo´sci przej´sciowe, symetryczne, odwrotne) oraz pozwala na definiowanie klas poprzez okre´slanie ogranicze ´n na warto´sciach wła´sciwo´sci.