S ie ci se m a n ty cz n e
Siecisemantycznes ֒agrafowymschematemreprezentacjiwiedzy: Fishareanimals. Mammalsareanimals. Mammalshavevertebra. Whalesaremammals. Catsaremammals. Bearsaremammals. Fishliveinthewater. Whalesliveinthewater. Catshavefur. Bearshavefur. Sie´czawieraw֒ez lyodpowiadaj֒acepoj֒eciomdanejdziedzinyproblemowej,i luki odpowiadaj֒acezwi֒azkom(relacjom)zachodz֒acympomi֒edzytymipoj֒eciami: •sie´cjestczytelna—ludziecz ֒estowyra˙zaj ֒ainformacjegraficznie, •sie´cjestelastyczna—mo˙zemywprowadza´cinformacjewdowolnejformie. Powy˙zszasie´c(´zr´od lo:Wikipedia)skonstruowanajestbezrozr´o˙znianiaklasod indywidu´ow,konsekwencjiwnazwachrelacji(isa/isan),itp. Siecisemantyczne—wprowadzenie1S ie ci se m a n ty cz n e : re la cj e IS A i A K O
Abyprawid lowoodr´o˙zni´cwsieciachsemantycznychklasyobiekt´owodindywidu´ow, orazwyrazi´cr´o˙znezale˙zno´scimi֒edzynimi,stosujesi֒epewnestandardowerelacje: •ISA(ang.isa)jestrelacj֒apomi֒edzyindywiduumajegoklas֒a •HASA(ang.hasa)jestrelacj֒acz֒e´s´c-ca lo´s´c,alternatywnie:PART •AKO(ang.akindof)jestrelacj֒apomi֒edzypodklas֒aanadklas֒a,zapisywane cz֒estor´ownie˙zjako:SUBCLASS,alboSS(subset) Przyk lad:Iownatanleatherchair. Siecisemantyczne—wprowadzenie2S ie ci se m a n ty cz n e : re la cj e b in ar n e i re ifi k a cj a
Mo˙znatraktowa´cinformacjezawartewsiecisemantycznejjakozbi´or(koniunkcj֒e) formu llogicznych.Formu lywyra˙zaj֒abezpo´sredniozachodzenierelacjipomi֒edzy obiektami(termami).Zauwa˙zmy,˙zewpowy˙zszychprzyk ladachwszystkierelacje (iodpowiadaj ֒aceimformu ly)s ֒arelacjamibinarnymi(dwuargumentowymi).Tojest podstawowacechasiecisemantycznych. Jakmo˙znawyrazi´crelacj֒ez lo˙zon֒azapomoc֒azestawurelacjibinarnych? Wniekt´orychprzypadkachz lo˙zonarelacjanaturalniedekomponujesi֒enask ladowe binarne.Jednakniezawszetaksi֒euda.Wpozosta lychprzypadkachstosujesi֒e zabiegreifikacji,czyliprzekszta lceniarelacjiwobiekty. Przyk lad:JohngivesthebooktoMary. Siecisemantyczne—wprowadzenie3S ie ci se m a n ty cz n e : p rz yk la d y
BilbofindsthemagicringinGollum’scave. Odczytajinformacjeztejsieci! Spr´obujprzekszta lci´cobiekty reifikowanenarelacjez lo˙zone. Siecisemantyczne—wprowadzenie4S ie ci se m a n ty cz n e : o d p o w ia d a n ie n a p yt a n ia
Rozwa˙zmyprzyk ladzdaniaiodpowiadaj ֒acejmusiecisemantycznej: MaryisJohn’swife.Johnwife −−−−−−−−→Mary Sie´cwyra˙zawpewnymj֒ezykuformalnyminformacjewcze´sniejzawarte woryginalnejwypowiedzij֒ezykanaturalnego.Odsystemusztucznejinteligencji oczekiwaliby´smy,˙zeposiadaj ֒acpewn ֒awiedz ֒e,b ֒edziewstanieodpowiada´cna dotycz ֒acejejpytania. Inaczejm´owi֒ac,jakzaimplementowa´cwnioskowaniedlasiecisemantycznych? Naprzyk lad: IsMaryJohn’swife? WhoisJohn’swife? WhosewifeisMary? Whoiswhosewife? Siecisemantyczne—wnioskowanie5S ie ci se m a n ty cz n e : d o p a so w a n ie
Wnioskowaniewsieciachsemantycznychmo˙zeby´czaimplementowaneprzez: 1.wyra˙zeniepytaniawpostacioddzielnej,zapytaniowej,siecisemantycznej, 2.pr´ob ֒edopasowaniasiecizapytaniowejdosiecifaktowej, 3.wprzypadkubrakudopasowania,odpowied´zjestnegatywna, 4.wprzypadkuuzyskaniadopasowania,odpowied´zjestpozytywna. IsMaryJohn’swife?Johnwife −−−−−−−−→Marywife(John,Mary)? WhoisJohn’swife?Johnwife −−−−−−−−→y∃ywife(John,y)? WhosewifeisMary?xwife −−−−−−−−→Mary∃xwife(x,Mary)? Whoiswhosewife?xwife −−−−−−−−→y∃x,ywife(x,y)? Formu lowaniepyta´nwsieciachsemantycznychwymagau˙zyciazmiennych domy´slniekwantyfikowanychkwantyfikatoremegzystencjalnym,podobniejak wlogicepredykat´ow.Je´slichcemyuzyska´cwarto´s´codpowiedziwostatnichtrzech pytaniach,tomusimyotrzyma´codmechanizmuwnioskowaniaobiektydopasowane doobiekt´ow-zmiennych. Siecisemantyczne—wnioskowanie6S ie ci se m a n ty cz n e : d zi e d zi cz e n ie
Rozwa˙zmyinnyprzyk lad: Elephantshavefourlegs. Elephantshaveonetrunk. Elephantshaveonetail. Elephantshavegreyskin. Thiselephant’snameisclyde. Jakiegokolorusk´or ֒emaclyde? Wtejsiecimamywiedz֒eog´oln֒aos loniachpo l֒aczon֒azwiedz֒aopewnym s loniowymindywiduumoimieniuclyde.Tworzeniesiecizapytaniowych idopasowanieichdosiecifaktowejdajeodpowiedzinapojedynczefakty.Mo˙zna rozszerzy´ctenmechanizmprzezwykorzystaniesemantykirelacjiisaiako,poniewa˙z indywiduadanejklasynormalnieposiadaj ֒aw lasno´sciwyra˙zonedlaklasy,jak r´ownie˙zwszystkichklasnadrz ֒ednych. Takierozszerzenienazywamydziedziczeniem,iwpowy˙zszymprzypadkupozwala ononp.uzyska´codpowied´z,˙zeclydemask´or֒ekoloruszarego. Siecisemantyczne—wnioskowanie7S ie ci se m a n ty cz n e : w ie d za d o m y´s ln a
Wiedzaog´olnaoklasachjestprzyk lademwiedzydomy´slnej(default).Umo˙zliwia onawnioskowanieniemonotoniczne,specjalnieimplementowanewniekt´orych systemachlogicznych.Wsieciachsemantycznychpojawiasi֒eononaturalniedzi֒eki dziedziczeniu. Gdybywprzyk ladzieos loniachzdanie:Thiselephant’snameisclyde. zast֒api´czdaniem:Thispinkelephant’snameisclyde. todosieciprzyby labydodatkowakraw֒ed´z:e1skin −−−→pink. Wtedyodpowied´znapytanie:e1skin −−−→zmog labyby´cuzyskanabez dziedziczeniaprzezdopasowaniez=pink.Takaodpowied´znormalniemapriorytet, tzn.wykluczauzyskanieodpowiedzinatosamopytanieprzezdziedziczenie. Wog´olno´sciwiedzadomy´slnapodleganormalnemuprocesowidziedziczenia.Gdyby klasaCz lowiekmia law lasno´s´ctypowy-wzrost(´sredni),todlajakiego´sanonimowego cz lowiekam´og lbyonwynosi´cnp.170cm,aledlapodklasyM֒e˙zczyznaraczej180cm, adlapodklasyM ֒e˙zczyzna-koszykarzpewnie190cm. Siecisemantyczne—wnioskowanie8S ie ci se m a n ty cz n e : d zi e d zi cz e n ie w ie lo k ro tn e
Mo˙znaby lobyzada´csobiepytanie,czyindywiduumwsiecisemantycznejmo˙ze nale˙ze´cdowi ֒ecejni˙zjednejklasyprzezrelacj ֒eisa(lub la´ncuchisa-ako*).Gdyby takby lo,tomechanizmwnioskowaniazdziedziczeniemm´og lbyteoretycznie uzyskiwa´cr´o˙zneodpowiedziprzezr´o˙zne´scie˙zkidziedziczenia. Popularnymprzyk lademwwielu podr ֒ecznikachjestzagadnienie czyNixon1by lpacyfist ֒a(∼1980). Wiadomoonim,˙zeby lkwakrem2 ijednocze´snierepublikaninem.3Quakers
Pacifists Nixon
Republicans isa
not akoako isa Zewzgl֒edunaproblemywielokrotnegodziedziczenia,wniekt´orychsystemach obiektowychjestonowykluczone. 1RichardM.Nixon—prezydentU.S.A.wlatach1969–1974.Powygraniuwybor´ownadrug֒akadencj֒ew1973r. by lzamieszanywnast֒epstwaaferyWatergateizrezygnowa lzurz֒eduprezydentapodgro´zb֒ausuni֒ecia. 2Quakersjestnazw֒agrupystowarzysze´nreligijnychwywodz֒acychsi֒ezXVII-wiecznejAngliiidzia laj֒acychna ca lym´swiecie,m.in.wStanachZjednoczonych.G losilim.in.skromno´s´cubioruiodmow֒eudzia luwwojnach. 3PartiaRepublika´nskawStanachZjednoczonychjestsymbolemkonserwatyzmu,pogl֒ad´owwolnorynkowych,pry- watnejw lasno´sci,ograniczeniarolizwi֒azk´owzawodowychiinterwencjonizmupa´nstwowego,zatosilnejarmii. Siecisemantyczne—wnioskowanie9
S ie ci se m a n ty cz n e : w n io sk o w a n ie z d zi e d zi cz e n ie m
Chcieliby´smy,abyalgorytmwnioskowaniazdziedziczeniemsamrozwi֒azywa l istniej֒acekolizje,oiletotylkomo˙zliwe.Rozwa˙zmyprzyk lad: falseOstrichBirdtrue is−ais−acan−flycan−flyako Tweety Tweetyjeststrusiem,ijednocze´snieptakiem.Pytanie:czypotrafifruwa´c?Zdolno´s´c fruwaniajestcech֒aptak´ow,aleniestrusi.Poniewa˙zfakt,˙zetweetyjeststrusiem jestbardziejszczeg´o lowy,wi֒ecwydajesi֒e,˙zekwesti֒efruwaniapowinnarozstrzyga´c domy´slnawiedzaostrusiach. Wog´olno´scidefiniujesi ֒eodleg lo´s´cinferencyjn ֒aklaswtaksonomii.KlasaCjest dalejni˙zklasaBodklasyA,je´sli´scie˙zkadziedziczeniazAdoCbiegnieprzezB. Algorytmwnioskowaniarozstrzygawielokrotnedziedziczenienakorzy´s´cklasy bli˙zszej.Poniewa˙zjednaktakaodleg lo´s´cwprowadzatylkoporz֒adekcz֒e´sciowy, rozwi֒azujeonaproblemtweety,alenierozwi֒azujeproblemuNixona. Siecisemantyczne—wnioskowanie10
S ie ci se m a n ty cz n e : fo rm a li za cj a
Jednymzproblem´owsiecisemantycznychjestbrakstandardowegokatalogurelacji (link´ow).Mo˙znawprowadza´cdowolnerelacjeistosowa´cdowolnenazwy.Utrudnia tozrozumienienieznanejsieci(przezkomputer),sprawdzeniejejpoprawno´sci,itp. Abyrozwi֒aza´ctenproblemwprowadzonopewnestandardy. typlinkuznaczenieprzyk lad Aisa −−→BA∈Btweety⊆Ostrich Aako −−→BA⊆BOstrich⊆Bird AR −→BR(A,B)tweetycan-fly −−−−→false AR −−−→B∀xx∈A⇒R(x,B)Bird#legs −−−−−→2 A
R −−−−→B∀x∃yx∈A⇒y∈B∧R(x,y)Birdparent −−−−−−→Bird Jednaknadmiernaformalizacjasiecisemantycznych,iwprowadzaniekolejnych mechanizm´owdlaw ֒ez l´owi luk´owsieciniwelujezasadnicz ֒azalet ֒e,jak ֒ajest czytelno´s´creprezentacjigraficznej. Siecisemantyczne—wnioskowanie11 Siecisemantyczne—wnioskowanie12
S ys te m y ra m e k
Systemramek(framesystem)sk ladasi֒ezkolekcjiramekopisuj֒acychelementy modelowanejdziedziny.Ramkazawierazbi´oratrybut´ow(ang.slots) reprezentuj֒acychjejw la´sciwo´sci.Atrybutyramkiwpolskiejliteraturzebywaj֒a nazywaneklatkami(K.Goczy la)lubszufladkami(W.Duch). Ramkimog֒areprezentowa´cpoj֒eciazdziedziny—maj֒awtedycharakterklasy— jakr´ownie˙zindywidualneobiekty.Ramkamo˙zeposiada´cdwarodzajeatrybut´ow: w lasne(own)alboszablonowe(template).Atrybutyw lasnenale˙z ֒adodanejramki, aichwarto´scis ֒aprywatnedlaramki.Atrybutyszablonowedanejklasystaj ֒asi ֒e atrybutamiw lasnymiwszystkichjejinstancji.Ramkimog֒adziedziczy´codsiebie zar´ownoatrybutyw lasne,jakiszablonowe.Ramka,kt´oranieposiadaatrybut´ow szablonowych,jestobiektem. Atrybutmo˙zeposiada´cwarto´s´c,kt´orajestwarto´sci֒ados lown֒a(literal), odno´snikiem-relacj֒adoinnejramki,orazpewnecechy(facets).Tecechymog֒a okre´sla´cwarto´s´cdomy´sln֒a,wi֒ezytakiejak:liczb֒ewarto´sci(atrybutjedno-lub wielowarto´sciowy,minimaxwarto´sci),typizakreswarto´sci,lubzbi´or dopuszczalnychwarto´sci,do l ֒aczoneprocedury(np.if-needed,if-added,if-removed), atrybutyodwrotne,itp. Siecisemantyczne—systemyramek13 Systemyrameks֒aprekursoremsystem´owobiektowych,jednaks֒ami֒edzynimi istotner´o˙znice.Naprzyk lad,systemprogramowaniaobiektowegodefiniuje hierarchi ֒eklaszmetodami,kt´orapozwalanatworzenieobiekt´owidziedziczenie przezniezar´ownostrukturyobiektu,jakimetod.Wsystemieramekniema zasadniczejr´o˙znicypomi֒edzyklasamiaobiektami,wi֒ecca lataksonomiajest dost֒epnadlaprogramuwczasiewykonania. Siecisemantyczne—systemyramek14J
֒e zy k RDF
Podstawowyelementsk ladowy:tr´ojkaobiekt-atrybut-warto´s´c:4 •Nazywasi֒etostwierdzeniem(statement). •Przyk ladstwierdzenia: WitoldPaluszy´nskiprowadzikursSztucznaInteligencja. •GrafRDFreprezentuj֒acypowy˙zszestwierdzenia: WitoldPaluszynskiSztucznaInteligencjaprowadziKurs Podstawowepoj֒eciaRDF: •zasoby(resources), •w la´sciwo´sci(properties), •stwierdzenia(statements). 4Uwaga:cz֒estostosowanajestalternatywna(miejscamimyl֒aca)terminologia:podmiot-predykat-przedmiot (subject-predicate-object),awpolskiejliteraturzer´ownie˙z:podmiot-orzeczenie-dope lnienie[K.Goczy la].Poniewa˙z rzadkopowodujetonieporozumienia,trzebapogodzi´csi֒ezpraktyk֒amieszaniatejterminologii,inieprzywi֒azywa´c zbytwielkiejwagidou˙zytegowdanymkontek´scies lowa. Siecisemantyczne—j֒ezykRDF15 Siecisemantyczne—j֒ezykRDF16Z a so b y: U RL , U RI , IRI
•Mo˙znamy´sle´cozasobachjakoobiektach,okt´orychchcemym´owi´c: –np.:ludzie,miejsca,miasta,naukowcy,studenci,uczelnie,itp. •Ka˙zdyzas´obmaURI(UniversalResourceIdentifier). •URImo˙zeby´c: –adresemURL(internetowym),lub –jakim´sinnymunikalnymidentyfikatorem. •Wtychrozwa˙zaniachb ֒edziemyprzyjmowaliadresyURLjakoURI. IRIs֒azinternacjonalizowan֒awersj֒aURI. •ZaletykorzystaniazURI: –globalny,uniwersalnywskali´swiata,unikalnyschematnazewnictwa, –cz֒e´scioworozwi֒azujeproblemhomonimii(wieloznaczno´sciidentycznych nazw)rozproszonychreprezentacjidanych. Siecisemantyczne—j֒ezykRDF17 Siecisemantyczne—j֒ezykRDF18W la ´sc iw o´ sc i
•W la´sciwo´sciopisuj֒abinarnerelacjemi֒edzyinnymizasobami: –np.: ”prowadzikurs”, ”kieruje”, ”tytu l”,itd. •W la´sciwo´scis֒aobywatelamipierwszejklasy,tzn.s֒ar´ownie˙ztraktowanejako zasoby,mog֒amie´cr´o˙znecharakterystyki,itworz֒aw lasn֒ataksonomi֒e. •W la´sciwo´scijakozasobys֒ar´ownie˙zidentyfikowaneprzezURI. Siecisemantyczne—j֒ezykRDF19 Siecisemantyczne—j֒ezykRDF20S tw ie rd ze n ia
•Stwierdzeniastwierdzaj֒aposiadaniew la´sciwo´sciprzezzasoby,adok ladniej: zwi֒azekpewnejparyzasob´owpewn֒arelacj֒a(binarn֒a). •Stwierdzeniejesttr´ojk֒a:obiekt-atrybut-warto´s´c –Sk ladasi֒ezzasobu,w la´sciwo´sciiwarto´sci. •Warto´sciamimog֒aby´czasobylublitera ly. –Litera lys ֒awarto´sciamiatomowymi(typustring). Siecisemantyczne—j֒ezykRDF21T rz y re p re ze n ta cj e st w ie rd ze ´n
Stwierdzeniemo˙zemyreprezentowa´cjako: •tr´ojk ֒eobiekt-atrybut-warto´s´c, •elementarnygrafzdwomaw֒ez lamipo l֒aczonymi lukiemskierowanym, •zapistekstowy,zwanyserializacj ֒a. Zatemzbi´orstwierdze´n,wyra˙zaj֒acypewienzas´obwiedzymo˙zeby´cpostrzegany jako: •zbi´ortr´ojekobiekt-atrybut-warto´s´c, •grafzwanysieci ֒asemantyczn ֒a, •dokument(np.plik)zawieraj֒acyserializacj֒ezbiorutr´ojek. Siecisemantyczne—j֒ezykRDF22S tw ie rd ze n ia ja k o tr ´o jk i
•Tr´ojk֒e(x,P,y)mo˙znauwa˙za´czaformu l֒elogiczn֒aP(x,y),gdziebinary predykatPwi֒a˙zeobiektxzobiektemy. •Tr´ojk֒emo˙znar´ownie˙zuwa˙za´czaskierowanygrafzetykietowanymiw֒ez lami i lukami: –skierowanyodzasobupodmiotu(obiektu)stwierdzenia, –skierowanydoprzedmiotu(warto´sci)stwierdzenia, –warto´s´cstwierdzeniamo˙zeby´cinnymzasobemlublitera lem. •WRDFzar´ownozasobyjakiw la´sciwo´scimusz֒aby´cidentyfikowaneprzezURI. Mo˙zliwejestjednakstosowanieprzestrzeninazw,skracaj֒acychzapis. (foaf:Person#WitoldPaluszynski, dbpedia-owl:employer, http://www.pwr.edu.pl/)WitoldPaluszynski pracujeW PolitechnikaWroclawska Siecisemantyczne—j֒ezykRDF23
Z b i´o r tr ´o je k ja k o si e´ c se m a n ty cz n a
WitoldPaluszynskiSztucznaInteligencjaprowadziKurs PolitechnikaWroclawskapracujeWhttp://www.kcir.pwr.edu.pl/~witold/ai/ autorStrony maStrone Siecisemantycznes ֒aelastycznymiekspresyjnymnarz ֒edziemreprezentacjiwiedzy. Ichgrafowawersjajestbardzozrozumia la,aleprzetwarzaniereprezentacji graficznychprzezkomputeryniejestefektywne. Istniej֒areprezentacjetekstowesiecisemantycznych.Jednakznichjestopartana XML,zwanaRDF/XML.Jednakniejestonacz ֒e´sci ֒amodeludanychRDF. Siecisemantyczne—j֒ezykRDF24