Reguly
Warunek
Koniunk ja selektorów, ka»dy selektor reprezentuje test warto± i
pojedyn zego atrybutu, warunek odpowiada obiektom speªniaj¡ ym
wszystkie selektory
De yzja
Ka»da reguªa zwi¡zana jest z jedn¡ de yzj¡,
przypisy wa n ¡ obiektom speªniaj¡ ym warunek reguªy
Przykªad
Reguly: selektory
Atrybuty symboli zne:♦
Selektor równo± iowyX
= v
♦
Selektor wyklu zaj¡ yX
6= v
♦
Selektor ogólnyX
∈ {v
1
, . . . , v
k
}
Atrybuty numery zne:♦
Selektor przedzia ªowyX
∈ (a, b)
Przedziaª mo»e by¢ jednostronnie nieograni zony,
Reguly spojne
Reguªa
α
⇒ dec = d
jest spójna ze zbiorem treningowymU
trn
je±li ka»dy przykªadx
∈ U
trn
speªniaj¡ y warunekα
ma de yzjdec
(x) = d
x
o
x
x
x
x
x
x
x
x
x
o
o
o
o
o
o
o
o
x
x
x
x
x
x
x
x
a
a
1
2
Reguly spojne: przyklad
Day Outlook Temperature Humidity Wind PlayTennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Over ast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Over ast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Over ast Mild High Strong Yes
D13 Over ast Hot Normal Weak Yes
D14 Rain Mild High Strong No
Reguly spojne: przyklad
Day Outlook Temperature Humidity Wind PlayTennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Over ast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Over ast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Over ast Mild High Strong Yes
D13 Over ast Hot Normal Weak Yes
D14 Rain Mild High Strong No
Outlook
= Overcast ⇒ P layT ennis = Y es
?? spójnaReguly spojne: przyklad
Day Outlook Temperature Humidity Wind PlayTennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Over ast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Over ast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Over ast Mild High Strong Yes
D13 Over ast Hot Normal Weak Yes
D14 Rain Mild High Strong No
Outlook
= Overcast ⇒ P layT ennis = Y es
?? spójnaSystemy regulowe
♦
CN2 (Clark,Nib lett 91)♦
AQ (Mi hal ski 86)♦
Zbiory przybli»one (Skowron, Rauszer 92)Systemy regulowe: uczenie i klasyfikacja
U zenie
Generowanie zbioru reguª na podstawie zbioru przykªadów treningowy h
Klasyka ja
Wyszukiwane s¡ reguªy pasuj¡ e do klasykowanego obiektu
x
, tzn. te, który h warunek jest speªniany przez obiektx
,mo»liwe s¡ dwie strategie podejmowania de yzji:
1. Najl epszy wygrywa:
reguªom przypisan a jest miara wa»no± i
Importance
,de yzja podejmowana jest na podstawie pasuj¡ ej do
x
reguªyr
o najwy»szej warto± iImportance(r)
2. Gªosowanie:
reguªy maj¡ przypisan e wagi
W eight
, obiektx
klasykowany jest de yzj¡ o najwy»szej sumie wag reguª pasuj¡ y hmax arg
d
j
Σ
α
⇒ d
j
:
x
spelniaα
Generowanie regul
♦
Bezpo±rednio ze zbioru przykªadów zupeªnesekwen yjne pokrywanie (CN2, AQ)
♦
Przy u»y iu struktur po±redni hz reduktu (teoria zbiorów przybli»ony h)
Generowanie regul zupelne
Fakt
Dla dowolnej reguªy
s
1
∧ . . . ∧ s
m
⇒ d
wszystkie obiekty rozpoznawane przez ni¡ rozpoznawane s¡ tak»e przez ka»d¡ reguª zbudowan¡ z podzbiorujej selektorów
s
i1
∧ . . . ∧ s
i
k
⇒ d
a
a
1
2
a in [1;3]
a in [1;3]
&
a in [1,3]
1
1
2
Generowanie regul zupelne
Wniosek: Obszar przestrzeni obiektów pokrywany przez wszystkie maksymal-nie ogólne reguªy spójne (
G
1
, . . . , G
m
) jest taki sam jak obszar pokrywany przez wszystkie reguªy spójnethis region all inconsistent
This region all inconsistent
More general
More specific
S
1
G
1
S
2
G
2
G
3
. . .
G
m
. . .
S
n
⇒
Wystar zy wyszuka¢ wszystkie reguªy spójne o minimalnym zbiorze se-lektorów, tzn. takim, »e usuni ie dowolnego selektora daje reguª niespójn¡.Generowanie regul zupelne
Jak to robi¢??
Mo»na przeszukiwa¢ przestrze« wszystki h reguª za zynaj¡ od reguª
najbar-dziej ogólny h. Dopóki reguªy nie s¡ spójne ze zbiorem treningowym, s¡
rozszerzane o selektory wyklu zaj¡ e przykªady powoduj¡ e i h niespójno±¢.
{ }
G
G
G
...
0
1
m
most general rule
Generowanie regul zupelne: algorytm
fun tion Exhaustive-Rules(examples,de isions,s ele tors) returns a rule set
rules
←
{}for ea h de ision d
∈
de isions doandidates
←
{}⇒
drepeat
newCandidates
←
{}for ea h andidate rule
α
⇒
d∈
andidates doe
neg
←
a random example mat hingα
but with a de ision6=
dfor ea h sele tor s
∈
sele tors ex luding eneg
dor
new
← α∧
s⇒
dif r
new
overs one or more obje ts with de ision d in examplesand is not subsumed by another rule from rules
∪
newCandidatesif r
new
is onsistent with examples then rules←
rules∪
rnew
else newCandidates←
newCandidates∪
rnew
andidates
←
newCandidatesuntil andidates is empty
Generowanie regul zupelne: przyklad
Reguªy z de yzj¡
P layT ennis
= Y es
andidates:
Outlook
= Overcast ⇒ P layT ennis = Y es
Kontrprzykªad: <Over ast,Cool,N ormal,Weak,
P layT ennis
= N o
><Overcast, ?, ?, ?>
Generowanie regul: sekwencyjne pokrywanie
Generowanie reguª zupeªne przegl¡da zazwy zaj wykªadni zo du»¡ podp
rze-strze« reguª, w prakty e niewykonalne
Pomysª (heurysty zny): Reguªy mo»na generowa¢ pojedyn zo do momentu
pokry ia przez nie wszystki h obiektów treningowy h
fun tion Sequential-Covering(examples ) returns a rule set
rules
←
{}un overed
←
examplesrepeat
r
←
Learn-One-Rule(examples,un overed) rules←
rules∪
rremove all examples overed by r from un overed
until un overed is empty
return rules
Funk ja Learn-One-Rule wyszukuje heurysty znie jak najlepsz¡ reguª
CN2
Clark, Niblett, 1991
♦
U»ywa atrybutów symboli zny hTraktuje wszystkie atrybuty jako symboli ze, atrybuty numery zne zamienia n e
s¡ na symboli zne w ten sposób, »e zakres warto± i ka»dego atrybytu dzielony
jest na równe przedzia ªy, warto± i z jednego przedziaªu zamienia ne s¡ na tak¡
sam¡ warto±¢ symboli zn¡
♦
U»ywa metody sekwen yjnego pokrywaniaSzukanie kolejnej reguªy (pro edura Learn-One-Rule ) podobnie jak
gene-rowanie reguª zupeªne rozpo zyna od najbardziej ogólny h reguª (warunków)
i usz zegóªawia je dodaj¡ kolejne selektory, ale:
zbiór reguª-kandydatów ograni zony jest do rozmiaru k okre±lanego przez
u»ytkownika, do rozszerzania brane s¡ najlepsze kandyduj¡ e reguªy,
jako wynik zwra ana jest najlepsza reguªa spo±ród wygenerowany h
CN2: szukanie najlepszej reguly
fun tion Learn-One-Rule-CN2(un ov,k ) returns a rule
inputs : un ov , the examples not overed by the previous rules
k , the width of sear hing
best
←
the most general empty onditionandidates
← {
best}
repeatnewCandidates
←
{}for ea h andidate
α
∈
andidates dofor ea h sele tor s of the form a
=
v or a6=
v onsistent withα
doif
α∧
s6∈
andidates∪
newCandidates thennewCandidates
←
newCandidates∪ {α∧
s}
if Performan e(
α∧
s,un ov )>Perform an e(best,un ov )then best
← α∧
sretain only k best andidates in newCandidates a ording to Performan e
andidates
←
newCandidatesuntil andidates is empty
CN2: szukanie najlepszej reguly, przyklad
Rozmiar zbioru kandydatów = 1
⇒
przeszukiwanie za hªanne...
...
IF Wind=weak
THEN PlayTennis=yes
IF Wind=strong
THEN PlayTennis=no
IF
THEN PlayTennis=yes
THEN
IF Humidity=normal
Wind=weak
PlayTennis=yes
IF Humidity=normal
THEN PlayTennis=yes
THEN
IF Humidity=normal
Outlook=sunny
PlayTennis=yes
THEN
IF Humidity=normal
Wind=strong
PlayTennis=yes
THEN
IF Humidity=normal
Outlook=rain
PlayTennis=yes
IF Humidity=high
THEN PlayTennis=no
CN2: miara jakosci reguly
Funk ja Performan e(
α
, un o v) sza uje jako±¢ warunkuα
na podstawie doty h zas niepokryty h przykªadów un ovn
li zba przykªadów z un ov pasuj¡ y h doα
n
d
li zba przykªadów z un ov pasuj¡ y h doα
z naj zstsz¡ de yzj¡d
m
-estymata prawdopodobie«stwan
d
+ mp
d
n
+ m
< p
d1
, . . . , p
d
D
>
pierwotny rozkªad prawdopodobie«stwa w dany hm parametr estyma ji
CN2 u»ywa sz zególnego przypadku, estymaty Lapla e'a: równomierny rozkªad pierwotny
<
1
D
, . . . ,
1
D
>
im
= D
(D
li zba de yzji)n
d
+ D
D
1
n
+ D
=
n
d
+ 1
n
+ D
Inne miary jakosci reguly
Funk ja Performan e(
α
, un o v) sza uje jako±¢ warunkuα
na podstawie doty h zas niepokryty h przykªadów un ovn
li zba przykªadów z un ov pasuj¡ y h doα
n
d
li zba przykªadów z un ov pasuj¡ y h doα
z naj zstsz¡ de yzj¡d
Czsto±¢ wzgldna
n
d
n
Nega ja entropiiΣ
d
i
n
d
i
n
log
2
n
d
i
n
Miary jakosci reguly: przyklad
α
1
pokrywa 1000 przykªadów z de yzj¡d
1
i 1 przykªad z de yzj¡d
2
α
2
pokrywa 5 przykªadów z de yzj¡d
1
i 0 przykªadów z de yzj¡d
2
α
3
pokrywa 1 przykªad z de yzj¡d
1
i 0 przykªadów z de yzj¡d
2
α
1
⇒ d
1
α
2
⇒ d
1
α
3
⇒ d
1
Czsto±¢ wzgldna 99.9% 100% 100%Nega ja entropii <0 0 0
Czsto±¢ wzgldna i nega ja entropii faworyzuj¡ reguªy
α
2
⇒ d
1
iα
3
⇒ d
1
Warto± i estymaty Lapla e'a (D
= 2
):99.8% dla
α
1
⇒ d
1
85.7% dlaα
2
⇒ d
1
66.6% dlaα
3
⇒ d
1
CN2: klasyfikacja pierwszy wygrywa
Lista de yzyjna to lista reguª utworzona przez algorytm sekwen yjnego pokry-wania uporz¡dkowana w kolejno± i takiej, w jakiej reguªy byªy generowane, z
dodatkow¡ reguª¡ domy±ln¡ na ko« u
→ R
0
→ R
1
→ R
2
→ . . . → R
m
→ Def ault
W CN2:R
0
reguªa wygenerowana ze wszystki h przykªadówR
1
reguªa wygenerowana z przykªadów niepokrywany h przezR
0
R
2
reguªa wygenerowana z przykªadów niepokrywany h przezR
0
,R
1
, itd.Def ault
reguªa bezwarunkowa zwra aj¡ a naj zstsz¡ de yzj w zbiorzetreningowym
Obiektowi przypisy wan a jest de yzja
d
z pierwszej reguªyα
⇒ d
na li± ie de yzyjnej, której warunekα
pasuje do obiektu.CN2: klasyfikacja przez glosowanie regul
rules
zbiór warunków wygenerowany przez algorytmsekwen yjnego pokrywania (bez ustalony h de yzji)
Rozkªad de yzyjny warunku
α
∈ rules
:< n
1
(α), . . . , n
|D|
(α) >
n
i
li zba przykªadów z de yzj¡d
i
speªniaj¡ y hα
w zbiorze un ov,tzn. tylko ty h przykªadów, które nie spelniaj¡
»adnego z w ze±niej wygenerowany h warunków
Wybór de yzji dla obiektu
x
przez sumowanie rozkªadów:AQ
AQ15, Mi hal ski, 1986
♦
U»ywa atrybutów symboli zny h i numery zny hDo atrybutów symboli zny h stosuje selektory równo± iowe i wyklu zaj¡ e, do
atrybutów numery zny h stosuje selektory ograni zaj¡ e (
<,
≤, >, ≥
).♦
U»ywa metody sekwen yjnego pokrywania, ale oddzielnie dla ka»dej de yzji Szukanie kolejnej reguªy (pro edura Learn-One-Rule ) podobnie jak wCN2 przebiega od najbardziej ogólny h do bardziej spe y zny h reguª, ale:
przeszukiwanie sterowane jest wybranym przykªadem
reguªy-kandydatki poprawiane s¡ tak dªugo, dopóki nie osi¡gn¡ warunku
spójno± i ze zbiorem treningowym, reguªa najlepsza wybierana jest
AQ: szukanie najlepszej reguly
fun tion Learn-One-Rule-AQ(examples,un ov,d,k ) returns a rule
inputs : examples , all training examples
un ov , the examples not overed by the previous rules
d, de ision of a return rule
k , the width of sear hing
e
pos
←
a random example from un ov with de ision dandidates
← {
the most general empty ondition}
repeat
e
neg
←
example with de ision6=
d overed by one or more onditions in andidateswith the maximum number of values = the orrespondin g values of e
pos
sele tors
←
all sele tors onsistent with epos
ex luding eneg
andidates
← {
x∧
s: x∈
andidates, y∈
sele tors}
andidates
← {
x∈
andidates:¬∃
y∈
andidates more general than x}
retain only k best andidates in andidates a ording to Performan euntil andidates over no examples with de ision
6=
dbest
←
the best ondition in andidates a ording to Performan eAQ: miara jakosci reguly
Performan e(
α
⇒ d
, examples) =pos
included
+neg
excluded
pos
included
li zba przykªadów w examples z de yzj¡d
pasuj¡ y h dowa-runku
α
tzw. wspar ie reguªy
neg
excluded
li zba przykªadów w examples z de yzj¡6= d
wyklu zany h przez warunekα
Uwaga
Je±li reguªa jest spójna ze zbiorem treningowym,
tzn. warunek reguªy wyklu za wszystkie przykªady z de yzj¡
6= d
, to miary jako± i reguªy jest równa wspar iu reguªyAQ: klasyfikacja
Klasyka ja przez gªosowanie reguª
Waga pojedyn zej reguªy:
W eight
(α ⇒ d) =
|pos
included
(α ⇒ d)|
|examples|
Wybór de yzji dla obiektu
x
:max arg
d
Σ
α
⇒ d: x
spelniaα
|pos
included
(α ⇒ d)|
Generowanie regul: CN2 vs AQ
Ce hy wspólne
♦
metoda sekwen yjnego pokrywania♦
szukanie pojedyn zej reguªy:metoda pierwszy najlepszy ustalonej szeroko± i
od najbardziej ogólny h w kierunku bardziej spe y zny h
Ró»ni e
Przeszukiwanie sterowane Wymaganie spójno± i Miara jako± i reguª
CN2 aªym zbiorem NIE estymata Lapla e'a
Teoria zbiorow przyblizonych
♦
Zbiory przybli»one (Pawlak, 1981)♦
Redukty i reguªy generowane z reduktów (Skowron, Rauszer, 1992)A
= {a
1
, . . . , a
n
}
zbiór e h (atrybutów) opisuj¡ y h przykªadyU
trn
zbiór przykªadów opisany h wektorami warto± i e h< x
1
, . . . , x
n
>
Deni ja
Zbiór atrybutów
R
⊆ A
jest reduktem dla zbioru przykªadówU
trn
, je±li dla ka»dej pary przykªadówx, y
∈ U
trn
o ró»ny h de yzja h
dec
(x) 6= dec(y)
istnieje
a
i
∈ R
rozró»niaj ¡ y t¡ par przykªadów:x
i
6= y
i
R
jest minimalnym zbiorem maj¡ ym powy»sz¡ wªasno±¢,tzn. dla dowolnego
R
′
⊂ R
istnieje para przykªadów w
U
trn
o ró»ny h de yzja h i taki h samy h warto± ia hna wszystki h atrybuta h
a
i
∈ R
′
Redukty
Deni ja
Redukt
R
jest minimalny, je±li zawiera najmniejsz¡ mo»liw¡ li zb atrybutów, tzn. dla ka»dego reduktuR
′
:
|R| ≤ |R
′
|
Redukty
Deni ja
Redukt
R
jest minimalny, je±li zawiera najmniejsz¡ mo»liw¡ li zb atrybutów, tzn. dla ka»dego reduktuR
′
:
|R| ≤ |R
′
|
Fakt: Problem znalezienia minimalnego reduktu jest NP-trudny
Przykªad: a b d de
x
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2 Redukty??Redukty
Deni ja
Redukt
R
jest minimalny, je±li zawiera najmniejsz¡ mo»liw¡ li zb atrybutów, tzn. dla ka»dego reduktuR
′
:
|R| ≤ |R
′
|
Fakt: Problem znalezienia minimalnego reduktu jest NP-trudny
Przykªad: a b d de
x
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2 Redukty??{a, d}
,{b, c, d}
Redukty minimalne??Redukty
Deni ja
Redukt
R
jest minimalny, je±li zawiera najmniejsz¡ mo»liw¡ li zb atrybutów, tzn. dla ka»dego reduktuR
′
:
|R| ≤ |R
′
|
Fakt: Problem znalezienia minimalnego reduktu jest NP-trudny
Przykªad: a b d de
x
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2 Redukty??{a, d}
,{b, c, d}
Redukty minimalne??{a, d}
Generowanie regul z reduktu
Rules
(R) := {
^
Generowanie regul z reduktu
Rules
(R) := {
^
a
i
∈R
a
i
= x
i
⇒ dec = dec(x) : x ∈ U
trn
}
Przykªad: a b d dex
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2R
= {b, c, d}
Reguªy ??Generowanie regul z reduktu
Rules
(R) := {
^
a
i
∈R
a
i
= x
i
⇒ dec = dec(x) : x ∈ U
trn
}
Przykªad: a b d dex
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2R
= {b, c, d}
Reguªy ??b
= 2 ∧ c = 1 ∧ d = 0 ⇒ dec = 0
b
= 2 ∧ c = 2 ∧ d = 1 ⇒ dec = 0
b
= 0 ∧ c = 2 ∧ d = 1 ⇒ dec = 1
b
= 2 ∧ c = 1 ∧ d = 1 ⇒ dec = 2
Skracanie regul z reduktu
Skra anie reguªy polega na odrzu eniu niektóry h selektorów z warunku reguªy
Metoda
Reguªa
α
∧ s ⇒ dec = d
mo»e zosta¢ zast¡piona przezα
⇒ dec = d
, je±liα
⇒ dec = d
pozostaje spójna ze zbiorem treningowymFakt
Mo»e si zdarzy¢, »e ró»ne reguªy z t¡ sam¡ de yzj¡ zostan¡ skró óne do tej
samej posta i
Skracanie regul z reduktu: przyklad
a b d dex
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2b
= 2 ∧ c = 1 ∧ d = 0 ⇒ dec = 0
b
= 2 ∧ c = 2 ∧ d = 1 ⇒ dec = 0
b
= 0 ∧ c = 2 ∧ d = 1 ⇒ dec = 1
b
= 2 ∧ c = 1 ∧ d = 1 ⇒ dec = 2
Skracanie regul z reduktu: przyklad
a b d dex
1
0 2 1 0 0x
2
1 2 2 1 0x
3
2 0 2 1 1x
4
0 2 1 1 2b
= 2 ∧ c = 1 ∧ d = 0 ⇒ dec = 0
b
= 2 ∧ c = 2 ∧ d = 1 ⇒ dec = 0
b
= 0 ∧ c = 2 ∧ d = 1 ⇒ dec = 1
b
= 2 ∧ c = 1 ∧ d = 1 ⇒ dec = 2
Po skró eniu:b
= 2 ∧ d = 0 ⇒ dec = 0
lubc
= 1 ∧ d = 0 ⇒ dec = 0
b
= 2 ∧ c = 2 ⇒ dec = 0
b
= 0 ⇒ dec = 1
Klasyfikacja oparta na wsparciu
rules
zbiór reguª z jednozna zn¡ de yzj¡U
trn
zbiór przykªadów treningowy hx
- obiekt do klasyka jiKlasyka ja przez maksymaliza j wspar ia:
rules
(x) = {α ⇒ d ∈ rules : x
spelniaα
}
Redukty lokalne
Zbiór atrybutów
R
⊆ A
jest reduktem lokalnym dla przykªadux
∈ U
trn
w zbiorze przykªadówU
trn
, je±lidla ka»dego przykªadu
y
∈ U
trn
z inn¡ de yzj¡dec
(y) 6= dec(x)
istnieje
a
i
∈ R
rozró»niaj ¡ yx
ody
:x
i
6= y
i
R
jest minimalnym zbiorem maj¡ ym powy»sz¡ wªasno±¢, tzn. dla dowolnegoR
′
⊂ R
istnieje przykªad w
U
trn
z inn¡ de yzj¡ i warto± iami taki samymi jakx
na wszystki h atrybuta h
a
i
∈ R
′
Fakt 1:
Li zba reduktów lokalny h dla jednego przykªadu mo»e by¢ wykªadni za
wzgl-dem li zby atrybutów i li zby przykªadów treningowy h
Fakt 2:
Problem znalezienia minimalnego reduktu lokalnego dla danego przykªadu jest
Generowanie regul z reduktow lokalnych
Reguªa generowana z reduktu lokalnego
R
dla przykªadux
:^
a
i∈R
a
i
= x
i
⇒ dec = dec(x)
Fakt 1: Reguªa generowana z reduktu lokalnego jest reguª¡ spójn¡ minimaln¡
(tzn. usuni ie któregokolwiek selektora powoduje utrat spójno± i)
Fakt 2: Zbiór reguª wygenerowany h ze wszystki h reduktów lokalny h =
zbiór wszystki h minimalny h reguª spójny h = zbiór wszystki h reguª
gene-rowany h przez algorytm zupeªny (z selektorami równo± iowymi)
Przypomnienie: Li zba wszystki h minimalny h reguª spójny h mo»e by¢
wy-kªadni za wzgldem li zby atrybutów i przykªadów treningowy h
Fakt 3 (Bazan, 1998): Nie h
rules
all
zbiór wszystki h minimalny h reguª spójny h. Istnieje algorytm symuluj¡ y klasyka j z maksymaliza j¡ wspar iaw zbiorze reguª
rules
all
(bez jawnego li zenia reguª) wykonuj¡ y klasyka j pojedyn zego obiektu w zasieO
(|U
trn
|
2
C4.5rules: generowanie regul
Outlook
Overcast
Humidity
Normal
High
No
Yes
Wind
Strong
Weak
No
Yes
Yes
Rain
Sunny
Pomysª: maj¡ dane drzewo de yzyjne mo»na generowa¢ reguªy na podstawie
C4.5rules: generowanie regul
Outlook
Overcast
Humidity
Normal
High
No
Yes
Wind
Strong
Weak
No
Yes
Yes
Rain
Sunny
Pomysª: maj¡ dane drzewo de yzyjne mo»na generowa¢ reguªy na podstawie
jego struktury
⇒
Drzewo jest generowane algorytmem C4.5 opisanym na wykªadzie o drzewa h de yzyjny hC4.5rules: przyklad
Outlook
Overcast
Humidity
Normal
High
No
Yes
Wind
Strong
Weak
No
Yes
Yes
Rain
Sunny
Outlook
= Sunny ∧ Humidity = High ⇒ P layT ennis = N o
Outlook
= Sunny ∧ Humidity = N ormal ⇒ P layT ennis = Y es
Outlook
= Overcast ⇒ P layT ennis = Y es
Outlook
= Rain ∧ W ind = Strong ⇒ P layT ennis = N o
Outlook
= Rain ∧ W ind = W eak ⇒ P layT ennis = Y es
C4.5rules: skracanie regul
α
∧ s ⇒ d
reguªa przed skró eniemα
⇒ d
reguªa po skró eniuC4.5rules wyli za statysty zne górne osza owanie bªdów obu reguª na po
d-stawie przykªadów ze zbioru treningowego pokrywany h przez te reguªy, i
za-stpuje reguª
α
∧ s ⇒ d
reguª¡ skró on¡α
⇒ d
, je±li górne osza owanie bªdu dla reguªy skró onej jest nie wiksze ni» dla reguªy oryginaln ejReguªa mo»e by¢ skró ona wielokrotnie, je±li usuwanie kolejny h selektorów
C4.5rules: klasyfikacja
Fakt
Warunki reguª przed skró eniem wyklu zaªy si wzajemnie,
po skró eniu ju» nie musz¡ si wyklu za¢
Wniosek
Klasyka ja wymaga zastosowania wyboru najlepszej reguªy
lub gªosowania reguª
⇒
C4.5rules stosuje zaawansowane metody do usuni ia niektóry h reguª skró ony hi uporz¡dkowania pozostaªy h wedªug wa»no± i