Uˇcen´ı, rozhodovac´ı stromy, neuronov´e s´ıtˇe
Aleˇs Hor´ak
E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/uui/
Obsah:
Uˇcen´ı
Rozhodovac´ı stromy
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu Neuronov´e s´ıtˇe
Uˇcen´ı
Uˇcen´ı
uˇcen´ıje kl´ıˇcov´e pro nezn´am´e prostˇred´ı (kde n´avrh´aˇr nen´ı vˇsevˇedouc´ı) uˇcen´ı je tak´e nˇekdy vhodn´e jakometoda konstrukce syst´emu – vystavit agenta realitˇe m´ısto pˇrepisov´an´ı reality do pevn´ych pravidel uˇcen´ı agenta – vyuˇzit´ı jehovjem˚u z prostˇred´ı nejen pro vyvozen´ı dalˇs´ı akce
uˇcen´ımodifikuje rozhodovac´ı syst´em agenta pro zlepˇsen´ı jeho v´ykonnosti
Uvod do umˇ´ el´e inteligence 11/12 2 / 42
Uˇcen´ı Uˇc´ıc´ı se agent
Uˇc´ıc´ı se agent
V´ykonnostn´ı standard
Agent
Prostˇred´ı
Senzory
Akˇcn´ı prvky
V´ykonnostn´ı komponenta zmˇeny
znalosti c´ıle
uˇcen´ı Gener´ator
probl´em`u zpˇetn´a vazba
Komponenta uˇcen´ı Kritika
experimenty
Uˇcen´ı Uˇc´ıc´ı se agent
Uˇc´ıc´ı se agent
V´ykonnostn´ı standard
Agent
Prostˇred´ı
Senzory
Akˇcn´ı prvky V´ykonnostn´ı komponenta zmˇeny
znalosti c´ıle
uˇcen´ı Gener´ator probl´em`u zpˇetn´a vazba
Komponenta uˇcen´ı Kritika
experimenty
pˇr´ıklad automatick´eho taxi:
V´ykonnostn´ı komponenta – obsahuje znalosti a postupy pro v´ybˇer akc´ı pro vlastn´ı ˇr´ızen´ı auta
Kritika – sleduje reakce okol´ı na akce taxi.
Napˇr. pˇri rychl´em pˇrejet´ı 3 pod´eln´ych pruh˚u zaznamen´a a pˇred´a pohorˇsuj´ıc´ı reakce dalˇs´ıch ˇridiˇc˚u
Komponenta uˇcen´ı – z hl´aˇsen´ı Kritiky vyvod´ı nov´e pravidlo, ˇze takov´e pˇrej´ıˇzdˇen´ı je nevhodn´e, a modifikuje odpov´ıdaj´ıc´ım zp˚usobem V´ykonnostn´ı komponentu Gener´ator probl´em˚u – zjiˇst’uje, kter´e
oblasti by mohly potˇrebovat vylepˇsen´ı a navrhuje experimenty, jako je tˇreba brˇzdˇen´ı na r˚uzn´ych typech vozovky
Uvod do umˇ´ el´e inteligence 11/12 3 / 42
Uˇcen´ı Komponenta uˇcen´ı
Komponenta uˇcen´ı
n´avrh komponenty uˇcen´ız´avis´ı na nˇekolika atributech:
– jak´y typv´ykonnostn´ı komponentyje pouˇzit
– kter´a funkˇcn´ıˇc´ast v´ykonnostn´ı komponenty m´a b´ytuˇcena – jak je tato funkˇcn´ı ˇc´ast reprezentov´ana
– jak´azpˇetn´a vazba je k dispozici
v´ykonnostn´ı funkˇcn´ı ˇc´ast reprezentace zpˇetn´a vazba komponenta
Alfa-beta vyhodnocovac´ı funkce v´aˇzen´a line´arn´ı v´yhra/prohra
prohled´av´an´ı funkce
Logick´y agent urˇcen´ı akce axiomy Result v´ysledn´e sk´ore Reflexn´ı agent v´ahy preceptronu neuronov´a s´ıt’ spr´avn´a/ˇspatn´a akce
Uˇcen´ı Komponenta uˇcen´ı
Komponenta uˇcen´ı
n´avrh komponenty uˇcen´ız´avis´ı na nˇekolika atributech:
– jak´y typv´ykonnostn´ı komponentyje pouˇzit
– kter´a funkˇcn´ıˇc´ast v´ykonnostn´ı komponenty m´a b´ytuˇcena – jak je tato funkˇcn´ı ˇc´ast reprezentov´ana
– jak´azpˇetn´a vazba je k dispozici
v´ykonnostn´ı funkˇcn´ı ˇc´ast reprezentace zpˇetn´a vazba komponenta
Alfa-beta vyhodnocovac´ı funkce v´aˇzen´a line´arn´ı v´yhra/prohra
prohled´av´an´ı funkce
Logick´y agent urˇcen´ı akce axiomy Result v´ysledn´e sk´ore Reflexn´ı agent v´ahy preceptronu neuronov´a s´ıt’ spr´avn´a/ˇspatn´a akce
uˇcen´ıs dohledem(supervised learning )× bez dohledu(unsupervised learning ) s dohledem – uˇcen´ıfunkcez pˇr´ıklad˚u vstup˚u a v´ystup˚u
bez dohledu – uˇcen´ıvzor˚u na vstupu vzhledem k reakc´ım prostˇred´ı pos´ılen´e (reinforcement learning ) – nejobecnˇejˇs´ı, agent se uˇc´ı podle
odmˇen/pokut
Uvod do umˇ´ el´e inteligence 11/12 4 / 42
Uˇcen´ı Induktivn´ı uˇcen´ı
Induktivn´ı uˇcen´ı
zn´am´e taky jako vˇeda,
nejjednoduˇsˇs´ı forma – uˇcen´ı funkce z pˇr´ıklad˚u (agent jetabula rasa) f jec´ılov´a funkce
kaˇzd´ypˇr´ıklad je dvojice x, f (x)napˇr.
O O ×
×
×
, +1
´
ukol indukce:
najdi hypot´ezuh takovou, ˇze h≈ f
pomoc´ı sady tr´enovac´ıch pˇr´ıklad˚u
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Atributov´a reprezentace pˇr´ıklad˚ u
pˇr´ıklady popsan´e v´yˇctemhodnot atribut˚u (libovoln´ych hodnot) napˇr. rozhodov´an´ı, zdapoˇckat na uvolnˇen´ı stolu v restauraci:
Pˇr´ıklad Atributy
poˇckat?
Alt Bar P´a/So Hlad ˇS tam Cen D´eˇst′ Rez Typ C ekDˇ
X1 A N N A ˇc´ast. $$$ N A mexick´a 0–10 A
X2 A N N A plno $ N N asijsk´a 30–60 N
X3 N A N N ˇc´ast. $ N N bufet 0–10 A
X4 A N A A plno $ N N asijsk´a 10–30 A
X5 A N A N plno $$$ N A mexick´a >60 N
X6 N A N A ˇc´ast. $$ A A pizzerie 0–10 A
X7 N A N N nikdo $ A N bufet 0–10 N
X8 N N N A ˇc´ast. $$ A A asijsk´a 0–10 A
X9 N A A N plno $ A N bufet >60 N
X10 A A A A plno $$$ N A pizzerie 10–30 N
X11 N N N N nikdo $ N N asijsk´a 0–10 N
X12 A A A A plno $ N N bufet 30–60 A
Ohodnocen´ı tvoˇr´ıklasifikacipˇr´ıklad˚u –pozitivn´ı(A) anegativn´ı(N)
Uvod do umˇ´ el´e inteligence 11/12 6 / 42
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
napˇr. hled´an´ı kˇrivky:
x f(x)
Uvod do umˇ´ el´e inteligence 11/12 7 / 42
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
napˇr. hled´an´ı kˇrivky:
x f(x)
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
napˇr. hled´an´ı kˇrivky:
x f(x)
Uvod do umˇ´ el´e inteligence 11/12 7 / 42
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
napˇr. hled´an´ı kˇrivky:
x f(x)
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
napˇr. hled´an´ı kˇrivky:
x f(x)
Uvod do umˇ´ el´e inteligence 11/12 7 / 42
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı
zkonstruuj/uprav h, aby souhlasila sf na tr´enovac´ıch pˇr´ıkladech h jekonzistentn´ı ⇔ souhlas´ı ff na vˇsech pˇr´ıkladech
napˇr. hled´an´ı kˇrivky:
x f(x)
pravidloOckhamovy bˇritvy– maximalizovat kombinaci konzistence a jedno- duchosti (nejjednoduˇsˇs´ı ze spr´avn´ych je nejlepˇs´ı)
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı pokraˇc.
hodnˇe z´aleˇz´ı naprostoru hypot´ez, jsou na nˇej protich˚udn´e poˇzadavky:
– pokr´yt conejvˇetˇs´ı mnoˇzstv´ıhledan´ych funkc´ı – udrˇzetn´ızkou v´ypoˇcetn´ı sloˇzitost hypot´ezy
Uvod do umˇ´ el´e inteligence 11/12 8 / 42
Uˇcen´ı Atributov´a reprezentace pˇr´ıklad˚u
Metoda induktivn´ıho uˇcen´ı pokraˇc.
hodnˇe z´aleˇz´ı naprostoru hypot´ez, jsou na nˇej protich˚udn´e poˇzadavky:
– pokr´yt conejvˇetˇs´ı mnoˇzstv´ıhledan´ych funkc´ı – udrˇzetn´ızkou v´ypoˇcetn´ı sloˇzitost hypot´ezy
a)
x f(x)
b)
x f(x)
– stejn´a sada 7 bod˚u
– nejmenˇs´ı konzistentn´ı polynom – polynom 6-t´eho stupnˇe (7 parametr˚u) – m˚uˇze b´yt v´yhodnˇejˇs´ı pouˇz´ıt nekonzistentn´ıpˇribliˇznouline´arn´ı funkci – pˇritom existuje konzistentn´ı funkceax+ by + c sin x
Rozhodovac´ı stromy
Obsah
1 Uˇcen´ı
Uˇc´ıc´ı se agent Komponenta uˇcen´ı Induktivn´ı uˇcen´ı
Atributov´a reprezentace pˇr´ıklad˚u
2 Rozhodovac´ı stromy
Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚u Prostor hypot´ez
Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
3 Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu Induktivn´ı uˇcen´ı – shrnut´ı
4 Neuronov´e s´ıtˇe Neuron
Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe Aktivaˇcn´ı funkce
Logick´e funkce pomoc´ı neuronov´e jednotky Struktury neuronov´ych s´ıt´ı
Jednovrstv´a s´ıt’ – perceptronUvod do umˇ´ el´e inteligence 11/12 9 / 42
Rozhodovac´ı stromy
Rozhodovac´ı stromy
jedna z moˇzn´ych reprezentac´ı hypot´ez – rozhodovac´ı strompro urˇcen´ı, jestlipoˇckat na st˚ul:
Ne Ano
Ne Ano
Ne Ano
Ne Ano
Ne Ano
Ne Ano
>60 30−60 10−30 0−10
Ne Ano
N A
N A
A
A
N A
A N
A
A N
nikdo ˇc´ast. plno
Alternativa?
Hlad?
Rezervace?
Bar? D´eˇst’?
Alternativa?
ˇStamgast˚u?
P´a/So?
OdhadˇCek´an´ı?
Rozhodovac´ı stromy Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚u
Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚ u
rozhodovac´ı stromy vyj´adˇr´ı libovolnou Booleovskou funkci vstupn´ıch atribut˚u → odpov´ıd´a v´yrokov´e logice
∀s poˇckat?(s) ⇔ P1(s) ∨ P2(s) ∨ . . . ∨ Pn(s) ,
kdePi(s) = A1(s) = V1∧ . . . ∧ Am(s) = Vm
Uvod do umˇ´ el´e inteligence 11/12 11 / 42
Rozhodovac´ı stromy Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚u
Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚ u
rozhodovac´ı stromy vyj´adˇr´ı libovolnou Booleovskou funkci vstupn´ıch atribut˚u → odpov´ıd´a v´yrokov´e logice
∀s poˇckat?(s) ⇔ P1(s) ∨ P2(s) ∨ . . . ∨ Pn(s) ,
kdePi(s) = A1(s) = V1∧ . . . ∧ Am(s) = Vm
pro libovolnou Booleovskou funkci → ˇr´adek v pravdivostn´ı tabulce = cesta ve stromu (od koˇrene k listu)
N A A
B
N A
B A B A xor B
F F F
F T T
T F T
T T F
Ne
Ne Ne
Ano
Ano Ano
Rozhodovac´ı stromy Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚u
Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚ u
rozhodovac´ı stromy vyj´adˇr´ı libovolnou Booleovskou funkci vstupn´ıch atribut˚u → odpov´ıd´a v´yrokov´e logice
∀s poˇckat?(s) ⇔ P1(s) ∨ P2(s) ∨ . . . ∨ Pn(s) ,
kdePi(s) = A1(s) = V1∧ . . . ∧ Am(s) = Vm
pro libovolnou Booleovskou funkci → ˇr´adek v pravdivostn´ı tabulce = cesta ve stromu (od koˇrene k listu)
N A A
B
N A
B A B A xor B
F F F
F T T
T F T
T T F
Ne
Ne Ne
Ano
Ano Ano
trivi´alnˇe
pro libovolnou tr´enovac´ı sadu existuje konzistentn´ı rozhodovac´ı strom s jednou cestou k list˚um pro kaˇzd´y pˇr´ıklad
ale takov´y strom pravdˇepodobnˇe nebude generalizovat na nov´e pˇr´ıkladyUvod do umˇ´ el´e inteligence 11/12 11 / 42
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
= poˇcet vˇsech Booleovsk´ych funkc´ı nad tˇemito atributy
Uvod do umˇ´ el´e inteligence 11/12 12 / 42
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
= poˇcet vˇsech Booleovsk´ych funkc´ı nad tˇemito atributy
= poˇcet r˚uzn´ych pravdivostn´ıch tabulek s2nˇr´adky
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
= poˇcet vˇsech Booleovsk´ych funkc´ı nad tˇemito atributy
= poˇcet r˚uzn´ych pravdivostn´ıch tabulek s2nˇr´adky = 22n
napˇr. pro 6 atribut˚u existuje 18 446 744 073 709 551 616 r˚uzn´ych rozhodovac´ıch strom˚u
Uvod do umˇ´ el´e inteligence 11/12 12 / 42
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
= poˇcet vˇsech Booleovsk´ych funkc´ı nad tˇemito atributy
= poˇcet r˚uzn´ych pravdivostn´ıch tabulek s2nˇr´adky = 22n
napˇr. pro 6 atribut˚u existuje 18 446 744 073 709 551 616 r˚uzn´ych rozhodovac´ıch strom˚u
2. kdyˇz se omez´ıme pouze na konjunktivn´ı hypot´ezy (Hlad∧ ¬D´eˇst′) Kolik existuje takov´ych ˇcistˇe konjunktivn´ıch hypot´ez?
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
= poˇcet vˇsech Booleovsk´ych funkc´ı nad tˇemito atributy
= poˇcet r˚uzn´ych pravdivostn´ıch tabulek s2nˇr´adky = 22n
napˇr. pro 6 atribut˚u existuje 18 446 744 073 709 551 616 r˚uzn´ych rozhodovac´ıch strom˚u
2. kdyˇz se omez´ıme pouze na konjunktivn´ı hypot´ezy (Hlad∧ ¬D´eˇst′) Kolik existuje takov´ych ˇcistˇe konjunktivn´ıch hypot´ez?
kaˇzd´y atribut m˚uˇze b´yt v pozitivn´ı nebo negativn´ı formˇe nebo nepouˇzit
⇒ 3n r˚uzn´ych konjunktivn´ıch hypot´ez (pro 6 atribut˚u = 729)
Uvod do umˇ´ el´e inteligence 11/12 12 / 42
Rozhodovac´ı stromy Prostor hypot´ez
Prostor hypot´ez
1. vezmˇeme pouze Booleovsk´e atributy, bez dalˇs´ıho omezen´ı
Kolik existuje r˚uzn´ych rozhodovac´ıch strom˚u s nBooleovsk´ymi atributy?
= poˇcet vˇsech Booleovsk´ych funkc´ı nad tˇemito atributy
= poˇcet r˚uzn´ych pravdivostn´ıch tabulek s2nˇr´adky = 22n
napˇr. pro 6 atribut˚u existuje 18 446 744 073 709 551 616 r˚uzn´ych rozhodovac´ıch strom˚u
2. kdyˇz se omez´ıme pouze na konjunktivn´ı hypot´ezy (Hlad∧ ¬D´eˇst′) Kolik existuje takov´ych ˇcistˇe konjunktivn´ıch hypot´ez?
kaˇzd´y atribut m˚uˇze b´yt v pozitivn´ı nebo negativn´ı formˇe nebo nepouˇzit
⇒ 3n r˚uzn´ych konjunktivn´ıch hypot´ez (pro 6 atribut˚u = 729) prostor hypot´ez s vˇetˇs´ıexpresivitou
– zvyˇsuje ˇsance, ˇze najdeme pˇresn´e vyj´adˇren´ı c´ılov´e funkce – ALEzvyˇsujeipoˇcetmoˇzn´ych hypot´ez, kter´e jsou konzistentn´ı
s tr´enovac´ı mnoˇzinou
⇒ m˚uˇzeme z´ıskat niˇzˇs´ı kvalitupˇredpovˇed´ı (generalizace)
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Uˇcen´ı ve formˇe rozhodovac´ıch strom˚ u
trivi´aln´ı konstrukce rozhodovac´ıho stromu
• pro kaˇzd´y pˇr´ıklad v tr´enovac´ı sadˇe pˇridej jednu cestu od koˇrene k listu
• na stejn´ych pˇr´ıkladech jako v tr´enovac´ı sadˇe bude fungovat pˇresnˇe
• na nov´ych pˇr´ıkladech se bude chovat n´ahodnˇe –negeneralizujevzory z pˇr´ıklad˚u, pouzekop´ırujepozorov´an´ı
Uvod do umˇ´ el´e inteligence 11/12 13 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Uˇcen´ı ve formˇe rozhodovac´ıch strom˚ u
trivi´aln´ı konstrukce rozhodovac´ıho stromu
• pro kaˇzd´y pˇr´ıklad v tr´enovac´ı sadˇe pˇridej jednu cestu od koˇrene k listu
• na stejn´ych pˇr´ıkladech jako v tr´enovac´ı sadˇe bude fungovat pˇresnˇe
• na nov´ych pˇr´ıkladech se bude chovat n´ahodnˇe –negeneralizujevzory z pˇr´ıklad˚u, pouzekop´ırujepozorov´an´ı
heuristick´a konstrukce kompaktn´ıho stromu
• chceme naj´ıtnejmenˇs´ırozhodovac´ı strom, kter´y souhlas´ı s pˇr´ıklady
• pˇresn´e nalezen´ı nejmenˇs´ıho stromu je ovˇsem pˇr´ıliˇs sloˇzit´e
→ heuristikou najdeme alespoˇndostateˇcnˇe mal´y
• hlavn´ı myˇslenka – vyb´ır´ame atributy pro test v conejlepˇs´ım poˇrad´ı
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
V´ybˇer atributu
dobr´y atribut ≡rozdˇel´ı pˇr´ıklady na podmnoˇziny, kter´e jsou (nejl´epe)
“vˇsechny pozitivn´ı” nebo “vˇsechny negativn´ı”
nikdo ˇc´ast. plno
ˇStamgast˚u?
mexick´a pizzerie asijsk´a bufet
Typ?
S tamgast˚ˇ u? je lepˇs´ı volba atributu ← d´av´a lepˇs´ıinformacio vlastn´ı klasifikaci pˇr´ıklad˚u
Uvod do umˇ´ el´e inteligence 11/12 14 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
V´ybˇer atributu – m´ıra informace
informace – odpov´ıd´a na ot´azku
ˇc´ımm´enˇedopˇredu v´ım o v´ysledku obsaˇzen´em v odpovˇedi → t´ımv´ıce informace je v n´ı obsaˇzeno
mˇeˇr´ıtko: 1 bit = odpovˇed’ na Booleovskou ot´azku s pravdˇepodobnost´ı odpovˇedi hP(T ) = 12, P(F ) = 12i
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
V´ybˇer atributu – m´ıra informace
informace – odpov´ıd´a na ot´azku
ˇc´ımm´enˇedopˇredu v´ım o v´ysledku obsaˇzen´em v odpovˇedi → t´ımv´ıce informace je v n´ı obsaˇzeno
mˇeˇr´ıtko: 1 bit = odpovˇed’ na Booleovskou ot´azku s pravdˇepodobnost´ı odpovˇedi hP(T ) = 12, P(F ) = 12i
n moˇzn´ych odpovˇed´ıhP(v1), . . . , P(vn)i→ m´ıra informacev odpovˇedi obsaˇzen´a
I P(v1), . . . , P(vn)
=Pn
i=1−P(vi) log2P(vi) tato m´ıra se tak´e naz´yv´a entropie
Uvod do umˇ´ el´e inteligence 11/12 15 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
V´ybˇer atributu – m´ıra informace
informace – odpov´ıd´a na ot´azku
ˇc´ımm´enˇedopˇredu v´ım o v´ysledku obsaˇzen´em v odpovˇedi → t´ımv´ıce informace je v n´ı obsaˇzeno
mˇeˇr´ıtko: 1 bit = odpovˇed’ na Booleovskou ot´azku s pravdˇepodobnost´ı odpovˇedi hP(T ) = 12, P(F ) = 12i
n moˇzn´ych odpovˇed´ıhP(v1), . . . , P(vn)i→ m´ıra informacev odpovˇedi obsaˇzen´a
I P(v1), . . . , P(vn)
=Pn
i=1−P(vi) log2P(vi) tato m´ıra se tak´e naz´yv´a entropie
napˇr. pro h´azen´ı minc´ı: I(h12,12i) = −12log2 12− 12log2 12 = 12 +12 = 1 bit pro h´azen´ı faleˇsnou minc´ı, kter´a d´av´a na 99% vˇzdy jednu stranu mince:
I(h1001 ,10099i) = −1001 log2 1001 − 10099 log210099 = 0.08 bit˚u
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
pˇredpokl´adejme, ˇze m´ame p pozitivn´ıch a n negativn´ıch pˇr´ıklad˚u
⇒ I hp+np ,p+nn i
bit˚u je potˇreba pro klasifikaci nov´eho pˇr´ıkladu
napˇr. pro X1, . . . , X12z volby ˇcek´an´ı na st˚ul jep= n = 6, takˇze potˇrebujeme 1 bit
Uvod do umˇ´ el´e inteligence 11/12 16 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
pˇredpokl´adejme, ˇze m´ame p pozitivn´ıch a n negativn´ıch pˇr´ıklad˚u
⇒ I hp+np ,p+nn i
bit˚u je potˇreba pro klasifikaci nov´eho pˇr´ıkladu
napˇr. pro X1, . . . , X12z volby ˇcek´an´ı na st˚ul jep= n = 6, takˇze potˇrebujeme 1 bit
v´ybˇer atributu – kolik informace n´am d´a test na hodnotu atributu A?
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
pˇredpokl´adejme, ˇze m´ame p pozitivn´ıch a n negativn´ıch pˇr´ıklad˚u
⇒ I hp+np ,p+nn i
bit˚u je potˇreba pro klasifikaci nov´eho pˇr´ıkladu
napˇr. pro X1, . . . , X12z volby ˇcek´an´ı na st˚ul jep= n = 6, takˇze potˇrebujeme 1 bit
v´ybˇer atributu – kolik informace n´am d´a test na hodnotu atributu A?
=rozd´ıl odhadu odpovˇedipˇred apo testu atributu
Uvod do umˇ´ el´e inteligence 11/12 16 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
atribut A rozdˇel´ı sadu pˇr´ıklad˚u E na podmnoˇziny Ei
(nejl´epe tak, ˇze kaˇzd´a potˇrebuje m´enˇe informace) nikdo ˇc´ast. plno
ˇStamgast˚u?
necht’ Ei m´api pozitivn´ıch a ni negativn´ıch pˇr´ıklad˚u
⇒ je potˇreba I hpip+ni i,pin+ni ii bit˚u pro klasifikaci nov´eho pˇr´ıkladu
⇒oˇcek´avan´ypoˇcet bit˚u celkem je Remainder(A) =P
i pi+ni
p+n · I hpip+ni i,pin+ni ii
⇒ v´ysledn´yzisk atributuAje Gain(A) = I hp+np ,p+nn i − Remainder(A)
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
atribut A rozdˇel´ı sadu pˇr´ıklad˚u E na podmnoˇziny Ei
(nejl´epe tak, ˇze kaˇzd´a potˇrebuje m´enˇe informace) nikdo ˇc´ast. plno
ˇStamgast˚u?
necht’ Ei m´api pozitivn´ıch a ni negativn´ıch pˇr´ıklad˚u
⇒ je potˇreba I hpip+ni i,pin+ni ii bit˚u pro klasifikaci nov´eho pˇr´ıkladu
⇒oˇcek´avan´ypoˇcet bit˚u celkem je Remainder(A) =P
i pi+ni
p+n · I hpip+ni i,pin+ni ii
⇒ v´ysledn´yzisk atributuAje Gain(A) = I hp+np ,p+nn i − Remainder(A) v´ybˇer atributu = nalezen´ı atributu s nejvyˇsˇs´ı hodnotou Gain(A)
Uvod do umˇ´ el´e inteligence 11/12 17 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
atribut A rozdˇel´ı sadu pˇr´ıklad˚u E na podmnoˇziny Ei
(nejl´epe tak, ˇze kaˇzd´a potˇrebuje m´enˇe informace) nikdo ˇc´ast. plno
ˇStamgast˚u?
necht’ Ei m´api pozitivn´ıch a ni negativn´ıch pˇr´ıklad˚u
⇒ je potˇreba I hpip+ni i,pin+ni ii bit˚u pro klasifikaci nov´eho pˇr´ıkladu
⇒oˇcek´avan´ypoˇcet bit˚u celkem je Remainder(A) =P
i pi+ni
p+n · I hpip+ni i,pin+ni ii
⇒ v´ysledn´yzisk atributuAje Gain(A) = I hp+np ,p+nn i − Remainder(A) v´ybˇer atributu = nalezen´ı atributu s nejvyˇsˇs´ı hodnotou Gain(A) Gain(ˇS tamgast˚u?) ≈ 0.541 bit˚u Gain(Typ?) = 0 bit˚u
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Pouˇzit´ı m´ıry informace pro v´ybˇer atributu
atribut A rozdˇel´ı sadu pˇr´ıklad˚u E na podmnoˇziny Ei
(nejl´epe tak, ˇze kaˇzd´a potˇrebuje m´enˇe informace) nikdo ˇc´ast. plno
ˇStamgast˚u?
necht’ Ei m´api pozitivn´ıch a ni negativn´ıch pˇr´ıklad˚u
⇒ je potˇreba I hpip+ni i,pin+ni ii bit˚u pro klasifikaci nov´eho pˇr´ıkladu
⇒oˇcek´avan´ypoˇcet bit˚u celkem je Remainder(A) =P
i pi+ni
p+n · I hpip+ni i,pin+ni ii
⇒ v´ysledn´yzisk atributuAje Gain(A) = I hp+np ,p+nn i − Remainder(A) v´ybˇer atributu = nalezen´ı atributu s nejvyˇsˇs´ı hodnotou Gain(A) Gain(ˇS tamgast˚u?) ≈ 0.541 bit˚u Gain(Typ?) = 0 bit˚u
obecnˇe: Ei (pro A= vi) obsahujeci,k klasifikac´ı do tˇr´ıdc1, ..., ck
⇒Remainder(A) =P
iP(vi) · I hP(ci,1), ..., P(ci,k)i
⇒Gain(A) = I hP(v1), ..., P(vn)i − Remainder(A)
Uvod do umˇ´ el´e inteligence 11/12 17 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Algoritmus IDT – uˇcen´ı formou rozhodovac´ıch strom˚ u
% induce tree( +Attributes, +Examples, −Tree) induce tree( , [], null) :-!.
induce tree( , [example( Class, ) | Examples], leaf( Class)) :-% ∀ pˇr´ıklady stejn´e klasifikace
\+(member(example( ClassX, ), Examples), ClassX \== Class),!.
induce tree( Attributes, Examples, tree( Attribute, SubTrees)) :- choose attribute( Attributes, Examples, Attribute/ ), !,
del( Attribute, Attributes, RestAtts), attribute( Attribute, Values), induce trees( Attribute, Values, RestAtts, Examples, SubTrees).
induce tree( , Examples, leaf( ExClasses)) :-% ˇz´adn´y uˇziteˇcn´y atribut, distribuce klasifikac´ı findall( Class, member(example( Class, ), Examples), ExClasses).
% induce trees( +Att, +Values, +RestAtts, +Examples, −SubTrees):
% najdi podstromy SubTrees pro podmnoˇziny pˇr´ıklad˚u Examples podle hodnot (Values) atributu Att induce trees( , [], , , [] ). % ˇz´adn´e atributy, ˇz´adn´e podstromy
induce trees( Att, [Val1 | Vals], RestAtts, Exs, [Val1 : Tree1 | Trees]) :- attval subset( Att = Val1, Exs, ExampleSubset),
induce tree( RestAtts, ExampleSubset, Tree1), induce trees( Att, Vals, RestAtts, Exs, Trees).
% attval subset( +Attribute = +Value, +Examples, −Subset):
% Subset je podmnoˇzina pˇr´ıklad˚u z Examples, kter´e splˇnuj´ı podm´ınku Attribute = Value attval subset( AttributeValue, Examples, ExampleSubset) :-
findall( example( Class, Obj),
(member(example( Class, Obj), Examples), satisfy( Obj, [ AttributeValue])), ExampleSubset).
% satisfy( Object, Description)
satisfy( Object, Conj) :-\+(member( Att = Val, Conj),member( Att = ValX, Object), ValX \== Val).
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Algoritmus IDT – uˇcen´ı formou rozhodovac´ıch strom˚ u
% choose attribute( +Atts, +Examples, −BestAtt/BestGain) − v´ybˇer nejlepˇs´ıho atributu choose attribute([], , 0/0).
choose attribute([Att], Examples, Att/Gain):-!, gain(Examples, Att, Gain).
choose attribute([Att|Atts], Examples, BestAtt/BestGain):- choose attribute(Atts, Examples, BestAtt1/BestGain1), gain(Examples, Att, Gain),
(Gain>BestGain1, !, BestAtt=Att, BestGain=Gain ; BestAtt=BestAtt1, BestGain=BestGain1).
% gain( +Examples, +Attribute, −Gain) − zisk atributu
gain( Exs, Att ,Gain) :-attribute( Att ,AttVals ), length(Exs, Total), setof(Class, Xˆexample(Class,X), Classes), % mnoˇzina vˇsech Class findall(Nc, (member(C,Classes), cntclass(C,Exs,Nc)), CCnts),
info(CCnts,Total,I), rem(Att, AttVals,Exs,Classes,Total,Rem), Gain is I−Rem.
% info(+ValueCounts, +Total, −I)
% m´ıra informace I P(v1), . . . , P(vn) = Pni=1−P(vi) log2P(vi) info([], , 0).
info([VC|ValueCounts], Total, I) :-info(ValueCounts,Total,I1), (VC = 0, !, I is I1 ;
Pviis VC / Total, log2(Pvi, LogPvi), I is − Pvi ∗ LogPvi + I1).
Uvod do umˇ´ el´e inteligence 11/12 19 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Algoritmus IDT – uˇcen´ı formou rozhodovac´ıch strom˚ u
% rem( +Att, +AttVals, +Exs, +Classes, +Total, −Rem)
% ”zbytkov´a informace” po testu na Att: Remainder (A) =P
iP(vi) · I hP(ci,1), ..., P(ci,k)i rem( , [], , , , 0).
rem( Att, [V | Vs], Exs, Classes, Total, Rem) :-
findall(1, (member(example( , AVs),Exs), member(Att = V, AVs)), L1), length(L1, Nv),% Nv = pi+ ni
findall(Ni, (member(C, Classes), cntclassattv(Att,V,C,Exs,Ni)), VCnts), Pv is Nv / Total, % P(v)
info(VCnts,Nv,I), rem(Att,Vs,Exs,Classes,Total,Rem1), Rem is Pv ∗ I + Rem1.
% cntclass( +Class, +Exs, −Cnt) − poˇcet pˇr´ıklad˚u tˇr´ıdy Class cntclass( Class, Exs, Cnt) :-
findall(1, member(example(Class, ),Exs), L), length(L, Cnt).
% cntclass( +Att, +Val, +Class, +Exs, −Cnt)
% poˇcet pˇr´ıklad˚u tˇr´ıdy Class pro hodnotu Val atributu Att cntclassattv( Att, Val, Class, Exs, Cnt) :-
findall(1, (member(example(Class,AVs),Exs), member(Att = Val, AVs)), L), length(L, Cnt).
log2(X, Y) :-Y is log(X) / log(2).
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Algoritmus IDT – pˇr´ıklad
attribute( hlad, [ano, ne]).
attribute( stam, [nikdo, cast, plno]).
attribute( cen, [’$’, ’$$’, ’$$$’]).
. . .
example(pockat, [alt=ano, bar=ne, paso=ne, hlad=ano, stam=cast, cen=’$$$’, dest=ne, rez=ano, typ=mexicka ]).
example(necekat, [alt=ano, bar=ne, paso=ne, hlad=ano, stam=plno, cen=’$’, dest=ne, rez=ne, typ=asijska ]).
. . .
Uvod do umˇ´ el´e inteligence 11/12 21 / 42
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
Algoritmus IDT – pˇr´ıklad
attribute( hlad, [ano, ne]).
attribute( stam, [nikdo, cast, plno]).
attribute( cen, [’$’, ’$$’, ’$$$’]).
. . .
example(pockat, [alt=ano, bar=ne, paso=ne, hlad=ano, stam=cast, cen=’$$$’, dest=ne, rez=ano, typ=mexicka ]).
example(necekat, [alt=ano, bar=ne, paso=ne, hlad=ano, stam=plno, cen=’$’, dest=ne, rez=ne, typ=asijska ]).
. . .
:-induce tree(T),show(T).
stam?
= nikdo necekat
= cast pockat
= plno hlad?
= ano cen?
= $ paso?
= ano pockat
= ne necekat
= $$$
necekat
= ne necekat
Rozhodovac´ı stromy Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
IDT – v´ysledn´y rozhodovac´ı strom
rozhodovac´ı stromnauˇcen´yz 12-ti pˇr´ıklad˚u:
F T
F F
F T
F T
Ne Ano
P´a/So?
nikdo ˇc´ast. plno
ˇStamgast˚u?
Ne Ano
D´eˇst’?
Typ?
mexick´a pizzerie asijsk´a bufet
podstatnˇe jednoduˇsˇs´ı neˇz strom “z tabulky pˇr´ıklad˚u”
Uvod do umˇ´ el´e inteligence 11/12 22 / 42
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
Obsah
1 Uˇcen´ı
Uˇc´ıc´ı se agent Komponenta uˇcen´ı Induktivn´ı uˇcen´ı
Atributov´a reprezentace pˇr´ıklad˚u
2 Rozhodovac´ı stromy
Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚u Prostor hypot´ez
Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
3 Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu Induktivn´ı uˇcen´ı – shrnut´ı
4 Neuronov´e s´ıtˇe Neuron
Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe Aktivaˇcn´ı funkce
Logick´e funkce pomoc´ı neuronov´e jednotky Struktury neuronov´ych s´ıt´ı
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
jak m˚uˇzeme zjistit, zda h≈ f?
Uvod do umˇ´ el´e inteligence 11/12 24 / 42
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
jak m˚uˇzeme zjistit, zda h≈ f?
* dopˇredu − pouˇz´ıt vˇety Teorie kom- putaˇcn´ıho uˇcen´ı
po nauˇcen´ı − kontrolou najin´e tr´enovac´ı sadˇe
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
jak m˚uˇzeme zjistit, zda h≈ f?
* dopˇredu − pouˇz´ıt vˇety Teorie kom- putaˇcn´ıho uˇcen´ı
po nauˇcen´ı − kontrolou najin´e tr´enovac´ı sadˇe
pouˇz´ıvan´ametodologie(cross validation):
1. vezmeme velkou mnoˇzinu pˇr´ıklad˚u 2. rozdˇel´ıme ji na 2 mnoˇziny –
tr´enovac´ıatestovac´ı
3. aplikujeme uˇc´ıc´ı algoritmus na tr´enovac´ısadu, z´ısk´ame hypot´ezuh 4. zmˇeˇr´ımeprocento pˇr´ıklad˚u v
testovac´ısadˇe, kter´e jsou spr´avnˇe klasifikovan´e hypot´ezouh 5. opakujeme kroky 2–4 pro r˚uzn´e
velikosti tr´enovac´ıch sad a pro n´ahodnˇe vybran´e tr´enovac´ı sady
kˇrivka uˇcen´ı – z´avislost ve- likosti tr´enovac´ı sady na
´
uspˇeˇsnosti
0.4 0.5 0.6 0.7 0.8 0.9 1
0 20 40 60 80 100
% správnosti u testovací sady
velikost trénovací sady
Uvod do umˇ´ el´e inteligence 11/12 24 / 42
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu – pokraˇc.
tvar kˇrivky uˇcen´ız´avis´ı na je hledan´a funkcerealizovateln´a× nerealizovateln´a
funkce m˚uˇze b´yt nerealizovateln´a kv˚uli
• chybˇej´ıc´ım atribut˚um
• omezen´emu prostoru hypot´ez naopaknadbyteˇcn´e expresivitˇe
napˇr. mnoˇzstv´ı nerelevantn´ıch atribut˚u
1
% spr´avnosti
# pˇr´ıklad˚u nerealizovateln´a nadbyteˇcn´a realizovateln´a
Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu Induktivn´ı uˇcen´ı – shrnut´ı
Induktivn´ı uˇcen´ı – shrnut´ı
uˇcen´ıje potˇrebn´e pro nezn´am´e prostˇred´ı(a l´ın´e analytiky ,) uˇc´ıc´ı se agent –v´ykonnostn´ı komponentaa komponenta uˇcen´ı metoda uˇcen´ı z´avis´ı natypu v´ykonnostn´ı komponenty, dostupn´e zpˇetn´e vazbˇe,typu areprezentaciˇc´asti, kter´a se m´a uˇcen´ım zlepˇsit u uˇcen´ı s dohledem– c´ıl je naj´ıt nejjednoduˇsˇs´ı hypot´ezu pˇribliˇznˇe konzistentn´ı s tr´enovac´ımi pˇr´ıklady
uˇcen´ı formourozhodovac´ıch strom˚u pouˇz´ıv´am´ıru informace kvalita uˇcen´ı– pˇresnost odhadu zmˇeˇren´a na testovac´ı sadˇe
Uvod do umˇ´ el´e inteligence 11/12 26 / 42
Neuronov´e s´ıtˇe Neuron
Obsah
1 Uˇcen´ı
Uˇc´ıc´ı se agent Komponenta uˇcen´ı Induktivn´ı uˇcen´ı
Atributov´a reprezentace pˇr´ıklad˚u
2 Rozhodovac´ı stromy
Vyjadˇrovac´ı s´ıla rozhodovac´ıch strom˚u Prostor hypot´ez
Uˇcen´ı ve formˇe rozhodovac´ıch strom˚u
3 Hodnocen´ı ´uspˇeˇsnosti uˇc´ıc´ıho algoritmu Induktivn´ı uˇcen´ı – shrnut´ı
4 Neuronov´e s´ıtˇe Neuron
Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe Aktivaˇcn´ı funkce
Logick´e funkce pomoc´ı neuronov´e jednotky Struktury neuronov´ych s´ıt´ı
Neuronov´e s´ıtˇe Neuron
Neuron
mozek– 1011 neuron˚u > 20typ˚u,1014synaps´ı, 1ms–10ms cyklus
nosiˇce informace –sign´aly = “v´ykyvy” elektrick´ych potenci´al˚u (se ˇsumem) neuron – mozkov´a buˇnka, kter´a
m´a za ´ukol sbˇer,zpracov´an´ıa ˇs´ıˇren´ı sign´al˚u
Axon, nervov´y v´ybˇeˇzek
Tˇelo buˇnky, soma J´adro Dendrit
Synapse Nervov´a vl´akna
Axon z jin´e buˇnky Synapse
Uvod do umˇ´ el´e inteligence 11/12 28 / 42
Neuronov´e s´ıtˇe Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe
Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe
1943 – McCulloch & Pitts – matematick´y modelneuronu
spojen´e do neuronov´e s´ıtˇe– schopnost tolerovat ˇsumve vstupu auˇcit se jednotky
(units)
v neuronov´e s´ıti– jsou propojenyvazbami (links)
– vazba z jednotkyj doi propaguje aktivaciaj jednotkyj
– kaˇzd´a vazba m´a ˇc´ıselnouv´ahu Wj,i (s´ıla+znam´enko)
Σ
vstupn´ı
vazby aktivaˇcn´ıfunkce v´ystupn´ı
vazby
Wj,i aj
Neuronov´e s´ıtˇe Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe
Poˇc´ıtaˇcov´y model – neuronov´e s´ıtˇe
1943 – McCulloch & Pitts – matematick´y modelneuronu
spojen´e do neuronov´e s´ıtˇe– schopnost tolerovat ˇsumve vstupu auˇcit se jednotky
(units)
v neuronov´e s´ıti– jsou propojenyvazbami (links)
– vazba z jednotkyj doi propaguje aktivaciaj jednotkyj
– kaˇzd´a vazba m´a ˇc´ıselnouv´ahu Wj,i (s´ıla+znam´enko)
funkce jednotkyi:
1. spoˇc´ıt´a v´aˇzenouP
vstup˚u=ini 2. aplikujeaktivaˇcn´ı funkcig 3. t´ım z´ısk´av´ystupai
ai= g (ini) = g (X
j
Wj,iaj)
Σ
v´ystup vstupn´ı
vazby aktivaˇcn´ı
funkce funkce
vstupn´ı v´ystupn´ı
vazby a0= −1 ai= g (ini)
ai
ini g Wj,i
prahov´a v´aha W0,i
aj
Uvod do umˇ´ el´e inteligence 11/12 29 / 42
Neuronov´e s´ıtˇe Aktivaˇcn´ı funkce
Aktivaˇcn´ı funkce
´
uˇcel aktivaˇcn´ı funkce: jednotka m´a b´ytaktivn´ı(≈ +1) pro pozitivn´ı pˇr´ıklady, jinakneaktivn´ı≈ 0
aktivace mus´ı b´ytneline´arn´ı, jinak by cel´a s´ıt’
byla line´arn´ı
Neuronov´e s´ıtˇe Aktivaˇcn´ı funkce
Aktivaˇcn´ı funkce
´
uˇcel aktivaˇcn´ı funkce: jednotka m´a b´ytaktivn´ı(≈ +1) pro pozitivn´ı pˇr´ıklady, jinakneaktivn´ı≈ 0
aktivace mus´ı b´ytneline´arn´ı, jinak by cel´a s´ıt’
byla line´arn´ı napˇr.
a)
+1
ini g(ini)
prahov´a funkce
b)
+1
ini g(ini)
sigmoida 1/(1 + e−x)
je derivovateln´a – d˚uleˇzit´e prouˇcen´ı zmˇenyprahov´e v´ahy W0,i nastavuj´ı nulovou pozic´ı – nastavuj´ıpr´ahaktivace
Uvod do umˇ´ el´e inteligence 11/12 30 / 42
Neuronov´e s´ıtˇe Logick´e funkce pomoc´ı neuronov´e jednotky
Logick´e funkce pomoc´ı neuronov´e jednotky
AND
W0=1.5
W1=1
W2=1
OR
W2=1 W1=1
W0=0.5
NOT
W1= 1 W0= 0.5
jednotka McCulloch & Pitts sama um´ı implementovat z´akladn´ı Booleovsk´e funkce
⇒ kombinacemi jednotek do s´ıtˇe m˚uˇzeme implementovatlibovolnou Booleovskou funkci