Laboratorium z przedmiotu „Sztuczna inteligencja” Temat: Sieci Bayesa, Wnioskowanie probabilistyczne, GeNIe

(1)

Laboratorium z przedmiotu „Sztuczna inteligencja”

Temat: Sieci Bayesa, Wnioskowanie probabilistyczne, GeNIe

Laboratorium nr 1

Sied Bayesowska służy do przedstawiania zależności pomiędzy zdarzeniami bazując na rachunku

prawdopodobieostwa. Klasycznym przykładem jest reprezentowanie zależności pomiędzy symptomami a chorobą. Sied Bayesa to skooczony, acykliczny graf skierowany, zbudowany na podstawie

prawdopodobieostw warunkowych (które są zawarte w zbiorze CP).

Sied Bayesa to trójka: B = <N, E, Cp>

Gdzie: N – zbiór wierzchołków grafu, E – zbiór krawędzi grafu, Cp – zbiór prawdopodobieostw warunkowych.

Wierzchołkami grafu są stwierdzenia lub hipotezy. Krawędzie grafu to relacje określające przejście od wierzchołka do wierzchołka z prawdopodobieostwem określającym to przejście.

1. Jeśli nie istnieje połączenie pomiędzy węzłami sieci, oznacza to, że zdarzenia reprezentowane przez te węzły są niezależne. Na przykład, w poniższej sieci zdarzenia A i D są od siebie niezależne.

2. Prawdopodobieństwo danego węzła zależy od wartości węzłów rodzicielskich, które „zasłaniają”

poprzedzające węzły. Na przykład, dla przedstawionej poniżej sieci mamy:

(2)

3. W powyższej sieci prawdopodobieństwo p(E|A) można wyznaczyć wg następującego wzoru:

przy czym

Inny przykład:

4. Reguła łańcuchowa i wykorzystanie niezależności warunkowych:

5. Prawdopodobieństwo łączne wybranych zdarzeń, np.

Ćw. 1. Zbuduj Sied Bayesa dla określonego zbioru Cp:

P = {P(a), P(b|a), P(c|b), P(d|b), P(G|c), P(G|d), P(e|a), P(F|e), P(F|c)}

Rozwiązanie:

(3)

Taki graf pozwala na prowadzenie wnioskowania w oparciu o prawdopodobieostwo i wzór Bayesa.

Małe litery stwierdzenia lub zaobserwowane fakty. Wielkie litery hipotezy.

Koocową hipotezą może byd G lub F.

Zadania do wykonania samodzielnie:

Zadanie 1.

Proszę korzystając z programu GeNIe stworzyd sied Bayesa na wymyślony przez Paostwa temat (każdy inny) i przeprowadzid wnioskowanie

Zadanie 2

W podanym niżej tekście występują pewne zależności przyczynowo skutkowe opisane liczbowo prawdopodobieństwami warunkowymi. Proszę podać zbiór CP takich prawdopodobieństwa warunkowych oraz narysować graf przyczynowo–skutkowy.

Prawdopodobieństwo wystąpienia anginy w przypadku objawów takich jak ból gardła i gorączka jest wysokie i wynosić może 0.8. Jednak wystąpienie gorączki i bólu głowy może świadczyć o grypie, co jest hipoteza prawdopodobna na 0.6. W przypadku gdy pacjent cierpiący na grypę nie wyleczył się całkowicie może dojść do zapalenia oskrzeli z prawdopodobieństwem 0.4. Zapalenie oskrzeli może spowodować ból gardła z prawdopodobieństwem 0.3.

Zadanie 3

W podanym niżej tekście występują pewne zależności przyczynowo skutkowe opisane liczbowo prawdopodobieństwami warunkowymi. Proszę podać zbiór CP takich prawdopodobieństw warunkowych oraz narysować graf przyczynowo–skutkowy.

Prawdopodobieństwo awarii suportu roweru z powodu zawilgocenia wynosi 0.4, zabrudzenia 0.1, natomiast z powodu zużycia 0.3. Awaria suportu na pewno spowoduje większe opory w czasie jazdy. Awaria suportu może na30% spowodować uszkodzenie mufy suportowej, to z kolei na 85%

spowoduje konieczność zakupu nowej ramy. Zabrudzenie na pewno wpłynie na nieprecyzyjną pracę przerzutek a także na 5% może spowodować wzrost oporów w czasie jazdy. Wzrost oporów w czasie jazdy może spowodować z prawdopodobieństwem 0.35 awarię suportu.

(4)

Zadanie 4

W podanym niżej tekście występują pewne zależności przyczynowo skutkowe opisane liczbowo prawdopodobieństwami warunkowymi. Proszę podać zbiór CP takich prawdopodobieństw warunkowych oraz narysować graf przyczynowo–skutkowy.

Prawdopodobieństwo awarii tylniej przerzutki z powodu zawilgocenia wynosi 0.3, zabrudzenia 0.6, natomiast z powodu zużycia 0.7. Awaria tylniej przerzutki uniemożliwi jazdę na 40%. Zawilgocenie i zabrudzenie na 70% spowodują przedwczesne wytarcie się klocków hamulcowych. Wytarte klocki na 20% uniemożliwią jadę. Prawdopodobieństwo awarii suportu roweru z powodu zawilgocenia wynosi 0.6 a zabrudzenia 0.3. Awaria suportu na pewno uniemożliwi jazdę. Brak możliwości jazdy na rowerze na 40% spowoduje spadek zainteresowania jego stanem technicznym, a to na pewno negatywnie wpłynie na jego czystość – czyli na jego zabrudzenie.

Laboratorium nr 1 (dodatek) Prawdopodobieostwo łączne (całkowite)

Jeśli zbiór  podzielimy na zbiory B, ~B takie, że B  ~B = ,

B  ~B = ø i P(B) > 0 oraz P(~B) > 0, to dla dowolnego zdarzenia A   prawdziwy jest wzór:

P(A  B) = P(A|B)*P(B) + P(A|~B)*P(~B) gdzie:

P(B) – prawdopodobieostwo zajścia zdarzenia B

P(~B) – prawdopodobieostwo zajścia zdarzenia przeciwnego do B

P(A|B) – prawdopodobieostwo (warunkowe) zajścia zdarzenia A pod warunkiem zajścia zdarzenia B.

Uwaga !: Jeśli zdarzenia A i B są niezależne wówczas prawdopodobieostwo łączne liczone jest ze wzoru:

P(A  B) =P(A)*P(B)

Prawdopodobieostwo warunkowe (twierdzenie Bayesa) Przykład I: Rozważmy następującą sied:

(5)

Wiadomo, że test w 95% daje wynik negatywny jak dopingu nie brano. W 5% daje wynik pozytywny jeśli doping stosowano.

P(Test) = P(Test| Dopping)*P(Dopping) + P(Test| ~Dopping)*P~(~Dopping) = 0.98*0.5 + 0.05*0.5 = 0.49 + 0.025 = 0.515 ~= 0.52

Przykład II: Albo odwrotnie – jeśli wiemy, że test dał wynik pozytywny to jakie jest podobieostwo, że używam doppingu?

Wiadomo, że test w 95% daje wynik negatywny jak dopingu nie brano. W 5% daje wynik pozytywny jeśli doping stosowano.

Laboratorium nr 2 i 3

GeNIe narzędziem pozwalającym na budowę I analizę Sieci Bayesa

 Do modelowania i wnioskowania w sieciach Bayesa można wykorzystad oprogramowanie GeNIe:

http://genie.sis.pitt.edu

(6)

Ćwiczenie do rozpoznania i później w domu do wykonania (zadanie domowe).

Wyobraźmy sobie, że inwestor zastanawia się nad ryzykiem zainwestowania w nowo powstałą firmę. Źródłem niepewności jest tutaj sukces tej firmy. Inwestor jest świadom faktu, że tylko ok. 20% wszystkich

nowopowstałych firm osiąga sukces. Tą niepewnośd można zmniejszyd pytając o zdanie eksperta.

Przewidywania eksperta jednak nie zawsze się sprawdzają. Ekspert ocenia, że ze wszystkich firm które osiągają sukces 40% ma dobry pomysł na rozwój działalności, 40% ma średni pomysł, a 20% ma kiepski pomysł.

Spośród wszystkich firm którym się nie udaje, ekspert wyznaczył, że 10% ma świetny pomysł, 30% ma niezły pomysł, a 60% ma kiepski pomysł.

Załóżmy, że inwestor chce włożyd kwotę $5,000 w przedsięwzięcie. Wie on, że jeśli firma osiągnie sukces to zarobi na tym $10,000. Jeśli firma upadnie to straci on swój wkład $5,000, ale jeśli w ogóle nie zainwestuje, zyska $500 na bezpiecznej lokacie w banku.

Co zrobid? Inwestowad czy nie?

Rozwiązanie:

(7)

GeNIe – podstawy

Podstawowe elementy w pasku menu:

 Chance (szansa) – przyjmują wartości dyskretne.

 Deterministic (deterministyczne) – przyjmują wartości stałe, bądź wartośd nominalną określoną przez użytkownika ze skooczonego zbioru wartości.

 Equation (równanie) – wyraża bardziej skomplikowane zależności miedzy zmiennymi, które należy poddad ocenie.

 Decision (decyzja) – modeluje możliwe do podjęcia przez użytkownika decyzje.

 Value (wartość) – modelują wartości powiązane z każdą możliwą do wykonania decyzją użytkownika.

 Submodel – oznacza konceptualnie powiązaną grupę zmiennych.

Menu Node / View as umożliwia zmianę sposobu wyświetlania zaznaczonych węzłów sieci.

Menu Node / Set Evidence określenie które zdarzenie miało miejsce.

(8)

GeNIe – budujemy sieć Bayesa krok po kroku

Zbudujemy następującą sied Bayesa:

Użyjemy do tego narzędzia GeNIe.

Do budowy węzłów sieci używamy komponentu:

Do budowy krawędzi:

Definiujemy każdy węzeł w sieci. Klikając dwukrotnie w dany węzeł, otwieramy okno z właściwościami.

(9)

Również klikając prawym przyciskiem myszy w dany węzeł pokaże się menu podręczne. Klikając opcję *Node Properties+

otworzy się to samo okno *Node Properties. Node 1+

Pamiętając, że definicja sieci jest następująca:

Definiujemy poszczególne węzły:

(10)

Warto zauważyd, że GeNIe cały czas nadzoruje czy wartości prawdopodobieostw spełniają podstawowe założenia, o sumowaniu się do wartości 1. Gdy dla danego węzła (patrz rysunek poniżej) nie uzupełniono wartości w ostatniej kolumnie i wierszu, GeNIe sygnalizuje błąd rysunkiem .

(11)

Teraz cała sied jest już zdefiniowana:

Obliczamy prawdopodobieostwa różnych zdarzeo:

Gdy a=a4 i b=b2, wtedy

(12)

Gdy zaś chcemy wyznaczyd prawdopodobieostwo zdarzenia, że

P(c=c2|x=x3,a=a4,b=b2) = p(c=c2|x=x3)*p(X=x3|a=a4,b=b2)*p(A=a4)*p(B=b2) = 0.4 * 0.3 * 0.25 * 0.6 = 0.018

Proszę obliczyd prawdopodobieostwa zdarzeo: