W 1909 roku, Charles S. Peirce proponuje graficzny zapis węzłów i krawędzi o nazwie "egzystencjalne wykresy", który nazwał "logiką przyszłości".
Zostały wynalezione dla komputerów przez Richarda H.
Richensa w Cambridge Language Research Unit w 1956 roku jako "Interlingua" dla automatycznego tłumaczenia języków naturalnych.
Zostały one opracowane przez Roberta F. Simmonsa w System Development Corporation na początku 1960 i później rozwijane we współpracy m.in. z Allanem M. Collinsem i współpracownikami np. Quillianem czy Loftusem.
W latach 1960 - 1980 opracowano ideę semantycznych Linków w ramach systemów hipertekstowych jako najbardziej podstawowa jednostka, lub krawędź, w sieci semantycznej.
Idea te była niezwykle wpływowa, i można zauważyć wiele prób, by dodać linki semantyczne do HTML i XML.
Sieci semantycznej używamy, gdy mamy pewność, że dobrze rozumiemy pojęcia z danej dziedziny i powiązania między nimi.
Większość sieci semantycznych jest oparta na kognitywistyce (poznawczo).
Składają się z łuków i węzłów, które mogą być zorganizowane w hierarchii taksonomicznej.
Sieci semantyczne pozwalają także odzwierciedlać dziedziczenie i prezentację węzłów jako proto-obiektów.
O czym należy pamiętać o sieci semantyczne ?
Niektórych właściwości nie da się łatwo wyrazić za pomocą
sieci semantycznej. Na przykład negacji, alternatywy i
ogólnego braku wiedzy taksonomicznej. Wyrażanie tych
relacji wymaga rozwiązania, takie jak uzupełnienie o
rachunek predykatów i przy użyciu specjalistycznych
procedur.
Pytania możliwe:
• Kto jest martwy?
• Kto gra Jazz/Trumpet ?
Wiedza o relacjach to:
• atrybuty
• odpowiednie związane z nimi wartości.
Mechanizmy wnioskowania możliwe są dzięki:
• Właściwościom dziedziczenia (elementy
dziedziczą wartości z bycia członkami klasy).
Dane muszą być zorganizowane w hierarchię
klas.
• Boxed nodes -- objects and values of attributes of objects.
• Values can be objects with attributes and so on.
• Arrows -- point from object to its value.
• This structure is known as a slot and filler
structure, semantic network or a collection of
frames.
• Prostokąty (węzły) – obiekty i wartości atrybutów obiektów.
• Strzałki - punkt od obiektu do jego
wartości.
The algorithm to retrieve a value for an attribute of an instance object:
1. Find the object in the knowledge base
2. If there is a value for the attribute report it
3. Otherwise look for a value of instance if none fail
4. Otherwise go to that node and find a value for the attribute and then report it
5. Otherwise search through using isa until a
value is found for the attribute.
1. Znajdź obiekt w bazie wiedzy
2. Jeśli jest wartość atrybutu to zwróć ją.
3. W przeciwnym razie szukaj wartości instancji.
4. W przeciwnym razie przejdź do węzła i znajdź wartość atrybutu, a następnie zwróć ją.
5. W przeciwnym razie dokonaj
przeszukiwania za pomocą isa dopóki nie
znajdziesz wartości dla atrybutu.
isa(person, mammal)
Instance(Mike-Hall, person) team(Mike-Hall, Cardiff)
zdanie: John dał Mary książki . Tutaj mamy
kilka aspektów zdarzenia.
Prosty mechanizm wnioskowania po prostu śledzi połączenia między węzłami sieci .
2 metody:
Intersection search
Inheritance
Aktywacja dwóch węzłów i poszukiwanie ich przecięcia i szukanie w ten sposób zależności między obiektami. Odwiedzone węzły
odpowiednio oznaczamy.
Dziedziczenie opiera się na reprezentacji „isa”
Dziedziczenie również zapewnia środki do rozumowania domyślnego.
przykład:
•Emus are birds.
• Typically birds fly and have wings.
• Emus run.
1. Emus are birds.
2. Typically birds fly and have wings.
3. Emus run.
dog: any of a large and varied group of domesticated animals related to the fox, wolf, and jackal
chihuahua: any of an ancient Mexican breed of very small dog with large, pointed ears
bird: any of a class of warm-blooded, two-legged, egg-laying vertebrates with feathers and wings
penguin: any of an order of flight-less birds found in the Southern Hemisphere, having webbed feet and paddle-like flippers for swimming and diving
ostrich: a large, swift-running bird of Africa and the Near East; the largest and most powerful of living birds; it has a long neck, long legs, two toes on each foot, and small useless wings
canary: a small yellow songbird of the finch family, native to the Canary Islands
Najpierw szukamy klas obiektów, przedmiotów.
Potem dopiero definiujemy poszczególne obiekty tak by je jakoś między sobą
rozróżnić.
vertebrate ^
| is-a
has-part
| /--- wings / reproduction | /--- egg-laying | / body-temp
| /--- warm-blooded bird--< no. of legs
^ ^ ^ \--- 2 / | \ \ covering
is-a / | \ \--- feathers / | \ \ movement
color / | \ \--- flight yellow ---canary
size / | is-a \ is-a
small ---/ | \ movement | ostrich--- run movement | \ size
swim ---penguin \--- big
sieci semantyczne związane z odpowiednimi zestawami narzędzi programowych służących do inżynierii wiedzy leksykalnej:
1.
Semantic Network Processing System (SNePS) Stuarta C.
Shapiro lub
2.
paradygmat MultiNet Hermanna Helbig (w szczególności nadaje się do reprezentacji semantycznej wyrażeń języka naturalnego i używane w różnych aplikacjach NLP).
3.
Sieci semantyczne są stosowane w specjalistycznych
zadaniach wyszukiwania informacji, takich jak
wykrywanie plagiatu. Sieci semantyczne pozwalają wtedy
na kompresję w celu zmniejszenia różnorodności
językowej i umożliwiają przez to określenie znaczenia
słowa, niezależnie od zestawów słów.
The MemberOf link between Jill and FemalePersons indicates that Jill belongs to the category of female persons.
O ile nie ma przeciwwskazań, zakłada się, że obiekty
należące do pewnej klasy dziedziczą po niej wszelkie jej własności.
Dziedziczenie jest wielokrotne. Można należeć do więcej niż jednej kategorii.
Jill ma 2 nogi !
Link: HasSister odwrotny do linku SisterOf .
Czasami po prostu takie linki ułatwiają wnioskowanie:
„Czyją siostrą jest Jack”.
Gdy odkryjemy że link HasSister jest linkiem
odwrotnymi do SisterOf , wówczas proces wnioskowania może iść za linkiem HasSister od Jack do Jill i
odpowiedzieć na pytanie.
Wady:
Reprezentacja tylko binarnych relacji co tworzy problem
dla relacji Run(ChennaiExpress,
Chennai,Bangalore,Today).
Nie ma standardowej definicji nazw linków.
Zalety:
Potrafią reprezentować wartości domyślne dla kategorii.
Jack ma 1 nogę, ale przecież jest osobą a każda osoba ma 2 nogi. Wtedy 2 nogi będzie wartością domyślną, ale jeśli dla Jack określono inaczej to ta wartość zostaje nadpisana.
Są łatwe do interpretacji.