• Nie Znaleziono Wyników

PJWSTK2009 RomualdKotowski Drzewadecyzyjne ElementyModelowaniaMatematycznegoWykład5

N/A
N/A
Protected

Academic year: 2021

Share "PJWSTK2009 RomualdKotowski Drzewadecyzyjne ElementyModelowaniaMatematycznegoWykład5"

Copied!
27
0
0

Pełen tekst

(1)

Elementy Modelowania Matematycznego Wykład 5

Drzewa decyzyjne

Romuald Kotowski

Katedra Informatyki Stosowanej

PJWSTK 2009

(2)

1 Drzewa decyzyjne jako hipotezy

2 Zstępujące konstruowanie drzewa

(3)

1 Drzewa decyzyjne jako hipotezy

2 Zstępujące konstruowanie drzewa

(4)

Wstęp

Koncepcja drzew decyzyjnych polega na reprezentowaniu sekwencji warunków wpływających na ostateczną decyzję przez ścieżki łączące korzeń drzewa z jego liśćmi wzdłuż kolejnych węzłów,

odpowiadających sprawdzanym warunkom, i gałęzi,

odpowiadających wynikom uzyskanym z ich sprawdzenia. Ma ona zastosowanie w różnych dziedzinach, jest stosowana w sposób naturalny i bez obaw o jej intuicyjną oczywistość dla człowieka, który stara się wiedzą reprezentowaną w ten sposób posługiwać.

(5)

Struktura drzewa

Drzewa decyzyjne to struktura:

węzły, z których wychodzą gałęzie prowadzące do innych węzłów lub liści

liście, z których nie wychodzą żadne gałęzie

Definicja formalna:drzewo to dowolny spójny skierowany graf acykliczny, przy czym krawędzie takiego grafu są nazywane gałęziami, wierzchołki, z których wychodzi co najmniej jedna krawędź, są nazywane węzłami, a pozostałe wierzchołki - liśćmi.

(6)

Struktura drzewa

Drzewo decyzyjne ma jeszcze dodatkową interpretację:

węzły – testy przeprowadzane na wartościach atrybutów przykładów

gałęzie – możliwe wyniki tych testów liście – etykiety kategorii

korzeń – nie ma żadnych węzłów macierzystych

(7)

Definicja rekurencyjna

X – dziedzina, na której są określone atrybuty a1, a2, . . . , an, C – klasa pojęć o zbiorze kategorii C

1 liść zawierający dowolną etykietę kategorii d ∈ C jest drzewem decyzyjnym

2 jeśli t : X 7→ Rt jest testem przeprowadzonym na wartościach atrybutów przykładów o zbiorze możliwych wyników

Rt= {r1, r2, . . . , rm) oraz T1, T2, . . . , Tm są drzewami

decyzyjnymi, to węzeł zawierający test t z którego wychodzi m gałęzi, przy czym dla i = 1, 2, . . . , m gałąź i −ta odpowiada wynikowi ri, i prowadzi do drzew Ti, jest drzewem decyzyjnym.

(8)

Notacja dla drzew decyzyjnych

NT – zbiór węzłów drzewa decyzyjnego T LT – zbiór liści drzewa decyzyjnego T

1 Przykład x ∈ X odpowiada liściowi (jest związany z liściem) l ∈ LT drzewa decyzyjnego T, jeśli w procesie klasyfikacji przykładu x za pomocą drzewa T osiągany jest ten liść.

2 Przykład x ∈ X odpowiada węzłowi (jest związany z węzłem) n ∈ NT drzewa decyzyjnego T, jeśli węzeł ten znajduje się na ścieżce łączącej korzeń drzewa z liściem odpowiadającym przykładowi x.

(9)

Przykład

Możliwe stany pogody opisane są przez atrybuty:

aura: słoneczna, pochmurna, deszczowa (atrybut nominalny) temperatura: zimna, umiarkowana, ciepła (atrybut

porządkowy)

wilgotność: normalna, duża (atrybut porządkowy)

(10)

Przykład

Rys. 1:Zbiór trenujący dla stanów pogody; c(x ) = 1 - pozytywne; c(x ) = 0 - negatywne

(11)

Przykład

Rys. 2:Drzewo decyzyjne dla stanów pogody

(12)

Przykład

Można to również zapisać w postaci tekstowej:

aura = słoneczna:

wilgotność = normalna: 1 wilgotność = duża: 0 aura = pochmurna: 1 aura = deszczowa:

wiatr = słaby : 1 wiatr = silny : 0

(13)

Drzewo jako reprezentacja zbioru reguł Reguła:

Jeśli warunki To kategoria lub krócej

warunki → kategoria

(14)

Przykład dla drzewa klasyfikującego

aura(x) = słoneczna ∧ wilgotność = duża → 0 aura(x) = słoneczna ∧ wilgotność = normalna → 1 aura(x) = pochmurna → 1

aura(x) = deszczowa ∧ wiatr = silny → 0 aura(x) = deszczowa ∧ wiatr = słaby → 1

(15)

Rys. 3:Schemat zstępującego konstruowania drzewa decyzyjnego (TDIDT – Top-Down Induction of Decision Trees)

(16)

Rodzaje testów

Operacja wyboru testu jest rdzeniem wszystkich algorytmów indukcji drzew decyzyjnych opartych na schemacie zstępującej konstrukcji drzewa i to ona przede wszystkim decyduje o ich właściwościach. Jej zadaniem jest wybranie dla zbioru dostępnych przykładów testu, który jest najbardziej użyteczny do ich dokładnej klasyfikacji.

Testy dla atrybutów nominalnych Testy równościowe

t(x) =

(1 jeśli a(x) = v 0 jeśli a(x) 6= v

(17)

Testy dla atrybutów nominalnych Testy przynależnościowe

t(x) =

(1 jeśli a(x) ∈ V 0 jeśli a(x) /∈ V

V ⊂ A – właściwy podzbiór przeciwdziedziny atrybutu a

(18)

Testy dla atrybutów porządkowych i ciągłych Testy nierównościowe

t(x) =

(1 jeśli a(x) ≤ θ 0 jeśli a(x) > θ

θ ∈ A – pewna wartość progowa przeciwdziedziny atrybutu a

(19)

Kryterium wyboru testu

Test ma być użyteczny, a drzewo w miarę możliwości proste.

(20)

Przyrost informacji

Informacjazawarta w zbiorze etykietowanych przykładów P I (P) = X

d ∈C

−|Pd|

|P| log2|Pd|

|P|

log2(·) – gdy chcemy wynik w bitach, może być dowolny byle konekwentny

Entropiazbioru przykładów P ze względu na wynik r testu t Etr(P) = X

d ∈C

−|Ptrd|

|Ptr|log2|Ptrd|

|Ptr|

jest duża, jeśli wśród przykładów ze zbioru P, dla których test t daje wynik r , rozkład na kategorie jest równomierny.

(21)

Przyrost informacji

Entropia zbioru przykładówP ze względu na test t to średnia ważona entropii dla poszczególnych wyników tego testu

Et(P) = X

r ∈Rt

|Ptr|

|P| Etr(P)

(22)

Przyrost informacji

W interpretacji entropii pomaga wykres funkcji

E (p) = −p log2p − (1 − p) log2(1 − p). Dla dwuelementowego zbioru kategorii C = {0, 1} przyjmując

p = |Ptr0|/|Ptr| otrzymujemy I (P) = E (P) p = |P0|/|P| otrzymujemy Etr(P) = E (P)

Maximum zachodzi dla p = 12 – czyli maksymalna entropia jest zawarta w zbiorze przykładów o równomiernym rozkładzie kategorii.

Najmniejsze wartości funkcja E przyjmuje dla p bliskich 0 lub 1, co świadczy o tym, że informacja/entropia jest najmniejsza przy wyraźnej przewadze jednej kategorii nad drugą.

(23)

Przyrost informacji

Rys. 4:Wykres entropii E (p) = −p log2p − (1 − p) log2(1 − p)

(24)

Przyrost informacji

Przyrost informacji wynikający z zastosowania testu t do zbioru przykładów etykietowanych P jest określony jako różnica

gt(P) = I (P) − Et(P) Wybieramy test maksymalizujący przyrost informacji

maxt gt(P)

Ponieważ informacja I (P) ma wartość niezależną od ocenianego testu i właściwą dla zbioru przykładów P, to powyższe kryterium jest równoważne z minimalizacją entropii Et(P)

(25)

Przyrost informacji

Rys. 5:Liczności zbiorów potrzebne do wyznaczenia wartości przyrostu informacji dla testu tożsamościowego na wartościach atrybutu aura

(26)

Przyrost informacji

Rys. 6:Entropia liczona ze wzoru Etr(P) = P

d ∈C

|P|Pdtr|

tr|log2|P

trd|

|Ptr|

(27)

Przyrost informacji

Możemy teraz obliczyć entropię ważoną Eaura = 5

14· 0.971 + 4

14 · 0 + 5

14 · 0.971 = 0.694 Przyrost informacji dla atrybutu aura

I (T ) = − 9

14log2 9 14 − 5

14log2 5

14 = 0.940 Wobec tego

gaura(T ) = 0.940 − 0.694 = 0.246

Cytaty

Powiązane dokumenty

Jeśli natomiast wynik 4 otrzymamy dodając cztery jedynki stojące w pewnej kolumnie, to sumę 0 możemy uzyskać jedynie dodając cztery zera w innej kolumnie.. Wobec tego drugą sumę

Czyli z wniosku wynika, iż nasz graf jest 3-spójny krawędziowo, ponieważ posiada 3 drogi krawędziowo rozłączne, ale jest również 2-spójny i 1-spójny, bo jak podaje

Lekoman to osoba, która uzależnia swój stan zdrowia czy nastrój od tego, czy zażył odpowiednie tabletki ( często dużą ich ilość ).. 3 najczęstsze przyczyny

Digraf jest dagiem wtedy i tylko wtedy, gdy – podczas badania za pomocą DFS każdej krawędzi – nie napotkamy krawędzi powrotnych...

Jeśli będziemy teraz w odpowiedniej kolejności usuwać kolejne d − 1-wymiarowe ściany (za każdym razem usuwając niżej wymiarowe ściany, które nie są już zawarte w

Definicja 7: Drzewo swobodne czyli drzewo bez korzenia to graf, który zawiera n-1 krawędzi i nie ma cykli, jest spójny, każde dwa wierzchołki łączy dokładnie

Drzewo rozpinające grafu G jest to spójny podgraf, który zawiera wszystkie wierzchołki należące do G i jest drzewem.. Minimalne drzewo rozpinające grafu posiada

Wszystko to powoduje, że poszukiwanie rozwiązania konkretnych zadań programowania nieliniowego zależy od szczególnej postaci tego zadania.. Romuald Kotowski