Technologie sieci semantycznych (Semantic Web)

2. Metodyka generowania danych semantycznych w przestrzennych

2.2. Predyspozycje odmiennych technik zarz ˛ adzania danymi i infor-

2.2.3. Technologie sieci semantycznych (Semantic Web)

Budowa Semantic Web to kolejny etap rozwoju Internetu, zmierzaj ˛acy do

prze-kształcenia rozproszonych zasobów w globaln ˛a baz˛e danych, zawieraj ˛ac ˛a infor-macje zrozumiałe zarówno dla ludzi, jak i dla maszyn. Wykorzystywany tam

mo-del sieci semantycznych nie jest czystym momo-delem matematycznym, ale ł ˛aczy

mno-Rys. 2.3. Wizualizacja danych przestrzennych zapisanych w modelu relacyjnym

go´sci, teorii grafów i logiki opisowej, prezentowane w formie sieciowej lub hierar-chicznej.

Istot ˛a sieci WWW i ´zródłem jej sukcesu s ˛a elastyczno´s´c i otwarto´s´c wynikaj ˛ace z braku narzuconego schematu danych. Koncepcja sieci semantycznej zmierza do zachowania zalet WWW, tworz ˛ac kolejn ˛a warstw˛e uzupełniaj ˛ac ˛a zasoby WWW o informacj˛e, czym one s ˛a. Powstaj ˛acy semantyczny opis okre´sla model logiczny dla zgromadzonych zasobów, definiuj ˛ac dla nich hierarchi˛e klas i wła´sciwo´sci bez narzuconego sztywnego schematu. Do technologii Semantic Web zalicza si˛e: • Linked data – koncepcja nadawania danym struktury poprzez ich wzajemne

powi ˛azanie. Wykorzystuje standardy stworzone dla WWW: HTTP (ang.

Hyper-text Transfer Protocol, http://www.w3.org/Protocols/rfc2616/rfc2616. html) i URI (ang. Uniform Resource Identifier,http://tools.ietf.org/html/ rfc3986) oraz standard RDF (ang. Resource Description Framework, http: //www.w3.org/RDF/).

• Ontologie – struktury słu˙z ˛ace do formalnego udost˛epniania reprezentacji

wie-dzy z okre´slonej dziedziny w postaci modelu logicznego. Model ten organizuje fakty w kategorie oraz definiuje ich wła´sciwo´sci i wzajemne relacje. Zarówno kategorie, jak i wła´sciwo´sci mog ˛a by´c zhierarchizowane.

• Systemy wyszukiwania i wnioskowania – obejmuj ˛a tzw. silniki

wnioskowa-nia (np. FaCT++ (http://owl.man.ac.uk/factplusplus/), Pellet (http:// clarkparsia.com/pellet), Hermit (http://www.hermit-reasoner.com/)),

zaprojektowane, aby w modelach wykorzystuj ˛acych logik˛e opisow ˛a DL

odkry-wa´c fakty na temat przynale˙zno´sci obiektów (które nie s ˛a wyra˙zone wprost,

a wynikaj ˛a np. ze zdefiniowanych ogranicze ´n na wła´sciwo´sciach) oraz j˛ezyki

org/Submission/SWRL/), ł ˛acz ˛acy konstrukcje j˛ezyka RuleML (ang. Rule

Mar-kup Language,http://ruleml.org/) ze składni ˛a OWL).

• J˛ezyki zapyta ´n – tym czym dla baz relacyjnych jest SQL, tym dla

gra-fów RDF jest SPARQL (ang. SPARQL Protocol and RDF Query

Langu-age,http://www.w3.org/TR/rdf-sparql-query/;http://www.w3.org/TR/ rdf-sparql-protocol/). SPARQL ma składni˛e podobn ˛a do SQL, przy czym SPARQL zamiast krotek z relacji (wierszy z tabel) zwraca trójki i w˛ezły z anali-zowanych grafów. Warunki ograniczaj ˛ace zwracan ˛a kolekcj˛e obiektów odnosz ˛a si˛e nie do warto´sci kolumn w tabelach, ale do poszczególnych elementów

tró-jek, np. do warto´sci okre´slonych predykatów stanowi ˛acych kraw˛edzie grafu.

Ontologie wykorzystuj ˛a pełn ˛a ekspresj˛e systemu formalnego logiki opisowej.

Fakty (obiekty, indywidua) s ˛a organizowane w kategorie (klasy, typy, koncepty).

Wła´sciwo´sci mog ˛a mie´c charakter atrybutów, którym mo˙zna przypisa´c konkretne

warto´sci lub cech definiuj ˛acych wzajemne relacje pomi˛edzy obiektami. Wi ˛azanie obiektów przez wła´sciwo´sci definiowane jest przez okre´slenie dziedziny (ang.

do-main) i zbioru warto´sci (ang. range).

Zarówno klasy, jak i wła´sciwo´sci mog ˛a by´c zhierarchizowane. Klasy, oprócz

miejsca w hierarchii, mog ˛a by´c definiowane poprzez restrykcje na

wła´sciwo-´sciach. Stanowi ˛a one system reguł opisuj ˛acych istot˛e klasy. Pozwala to na wpro-wadzanie bogatszej informacji ni˙z ta, któr ˛a zapewnia opis relacji pomi˛edzy ró˙z-nymi zasobami. Hierarchia klas (taksonomia) wraz z relacjami definiuje schemat poj˛eciowy dziedziny – meta-model opisywanych danych, czyli tzw. TBox (ang.

ter-minological component).

Zestaw faktów, opisanych w formie twierdze ´n (asercji), odwołuj ˛acych si˛e do

schematu poj˛eciowego, nosi nazw˛e ABox (ang. assertional component). Asercje

komponentu ABox stanowi ˛a opis rzeczywistych obiektów, zwanych te˙z

indywi-duami, których wła´sciwo´sciom przypisane s ˛a konkretne warto´sci i relacje. ABox

jest de facto grafem RDF.

Do zapisu ontologii wykorzystywane s ˛a standardy W3C: RDF, RDFS

(ang. RDF Vocabulary Description Language: RDF Schema,http://www.w3.org/

TR/rdf-schema/), OWL (ang. Web Ontology Language, obecnie w wersji 2.0 http://www.w3.org/TR/owl2-overview/), SKOS (ang. SKOS Simple Knowledge

Organization System,http://www.w3.org/2004/02/skos/). Najcz˛e´sciej

wyko-rzystywan ˛a notacj ˛a do kodowania zasobów w wy˙zej wymienionych

standar-dach jest RDF/XML, czyli zapis w j˛ezyku RDF ze składni ˛a j˛ezyka XML, który

jest wygodny, gdy˙z otwiera te zasoby do przetwarzania przez wszystkie

na-rz˛edzia tworzone dla XML. Ale istniej ˛a równie˙z mo˙zliwo´sci wykorzystania dla

ontologii lub grafów RDF innych notacji: Manchester Syntax (http://www. co-ode.org/resources/reference/manchester_syntax/), Turtle (ang. Terse

RDF Triple Language,http://www.w3.org/TeamSubmission/turtle/) lub N3

(ang. Notation 3 Logic,http://www.w3.org/DesignIssues/Notation3), a tak˙ze

OWL/XML (ang. OWL Web Ontology Language XML Presentation Syntax –

skład-nia XML, ale z własnymi elementami OWL, niezapo˙zyczonymi z RDF,http://

• kategoryzacj˛e semantyczn ˛a pomi˛edzy poj˛eciami, opisuj ˛ac ˛a relacje takie jak

sy-nonimia, hiponimia, hiperonimia; poj˛ecia te mog ˛a by´c wykorzystywane np.

jako słowa kluczowe w metadanych; tego typu słownikami s ˛a tezaurusy,

wy-korzystuj ˛ace do zapisu m.in. standard W3C SKOS (w formie grafu RDF);

• kategoryzacj˛e według relacji mi˛edzy zasobami stanowi ˛acych wła´sciwo´sci

za-sobów; w ten sposób definiowane s ˛a klasy obiektów, ich hierarchia

taksono-miczna oraz hierarchia wła´sciwo´sci (standardem jest tu np. RDF Schema, roz-szerzenie RDF);

• kategoryzacj˛e opart ˛a na formalizmie logiki opisowej; metoda ta uzupełnia

kla-syfikacj˛e opart ˛a na wła´sciwo´sciach o predefiniowane relacje typu logicznego,

takie jak to˙zsamo´s´c, rozł ˛aczno´s´c obiektów, wzbogaca opis wła´sciwo´sci (wła´sci-wo´sci przej´sciowe, symetryczne, odwrotne) oraz pozwala na definiowanie klas poprzez okre´slanie ogranicze ´n na warto´sciach wła´sciwo´sci.

W dokumencie Charakterystyka i przetwarzanie zasobów urzędowych związanych z czasem i przestrzenią (Stron 48-51)