• Nie Znaleziono Wyników

9. Praktyczna ocena jako´sci klasyfikacji

N/A
N/A
Protected

Academic year: 2021

Share "9. Praktyczna ocena jako´sci klasyfikacji"

Copied!
14
0
0

Pełen tekst

(1)

Algorytmy rozpoznawania obrazów

9. Praktyczna ocena jako´sci klasyfikacji

dr in˙z. Urszula Libal Politechnika Wrocławska

2015

(2)

1. Zbiór ucz ˛acy i zbiór testowy

1. Zbiór ucz ˛acy

— słu˙zy do konstrukcji (treningu) klasyfikatora w procesie uczenia 2. Zbiór testowy

— słu˙zy do weryfikacji jako´sci klasyfikatora

Podział zbioru danych na zbiór ucz ˛acy i testowy zale˙zy od liczno´sci tego zbioru.

Zbiory ucz ˛acy i testowy s ˛a rozł ˛aczne (zawieraj ˛a inne obrazy).

Cz˛esty podział dla du˙zych zbiorów danych to:

— 2/3 (zbiór ucz ˛acy),

— 1/3 (zbiór testowy).

(3)

2. Metody oceny jako´sci klasyfikatora

Ocena klasyfikacji na podstawie zbioru testowego:

1. Macierz pomyłek (confusion matrix) 2. Miary oceny jako´sci klasyfikacji:

— ryzyko,

— bł ˛ad klasyfikacji,

— trafno´s´c klasyfikacji,

— współczynniki TP, TN, FP, FN, ...

3. Krzywa ROC

4. Kroswalidacja (cross-validation)

(4)

3. Macierz pomyłek

Przypadek klasyfikacji do wielu klasM = {1, 2, ,..., m}:

klasa wskazana przez klasyfikator klasa pochodzenia obrazu C1 C2 · · · Cm

C1 r11 r12 · · · r1m

C2 r21 r22 · · · r2m

... ... ... . .. ...

Cm rm1 rm2 · · · rmm

ri j- liczba obrazów testowych z klasy Ci, przypisana do klasy Cj, Ni- liczno´s´c obrazów z klasy Ci(zbiór testowy)

(5)

Liczno´s´c zbioru testowego:

#test =

m i=1

Ni

Ł ˛aczna liczba poprawnie zaklasyfikowanych obrazów testowych:

#correct =

m

i=1

rii

Ł ˛aczna liczba bł˛ednie zaklasyfikowanych obrazów testowych:

#error = #test − #correct

(6)

Przypadek klasyfikatora binarnego:

klasa wskazana przez klasyfikator klasa pochodzenia obrazu C1(+) C2(-)

C1(+) r11(TP) r12(FN) C2(-) r21(FP) r22(TN)

TP (true positive) - liczba poprawnie zaklasyfikowanych obrazów z klasyC1

FP (false positive) - liczba bł˛ednie zaklasyfikowanych obrazów z klasyC2do klasyC1 FN (false negative) - liczba bł˛ednie zaklasyfikowanych obrazów z klasyC1do klasyC2 TN (true negative) - liczba poprawnie zaklasyfikowanych obrazów z klasyC2

(7)

Rysunek 1. Współczynniki TP, FP, FN i TN dla klasyfikacji binarnej.

Zródło: [4]´

(8)

4. Miary oceny jako´sci klasyfikacji

Miary uniwersalne (dla dowolnej liczby klas):

— trafno´s´c (accuracy)

#correct

#test

— bł ˛ad klasyfikacji (error rate)

#error

#test = 1 −#correct

#test

(9)

Miary w przypadku klasyfikacji binarnej:

— trafno´s´c

T P+ T N

N1+ N2 = T P+ T N T P+ FN + FP + T N

— bł ˛ad klasyfikacji

FP+ FN

N1+ N2 = FP+ FN T P+ FN + FP + T N

— Ryzyko klasyfikatora szacujemy za pomoc ˛a bł˛edu klasyfikacji (patrz rys. 1)

(10)

— współczynnik TP (TP rate, czuło´s´c)

T PR=T P N1

= T P

T P+ FN

— współczynnik TN (TN rate, specyficzno´s´c)

T NR=T N

N2 = T N FP+ T N

— współczynnik FP (FP rate)

FPR=FP

N2 = FP FP+ T N

(11)

5. Krzywa ROC

Rysunek 2. Krzywa ROC.

(12)

6. K-krotna kroswalidacja

Dzielimy dane na k mo˙zliwie równych, wzajemnie rozł ˛acznych, cz˛e´sci. Do uczenia wyko- rzystujemy k − 1 cz˛e´sci, do testowania pozostał ˛a jedn ˛a cz˛e´s´c. Procedur˛e powtarzamy k razy, za ka˙zdym razem zmieniaj ˛ac zbiór testowy na kolejn ˛a niewykorzystan ˛a dotychczas cz˛e´s´c.

Rysunek 3. K-krotna kroswalidacja: U-uczenie, T-testowanie.

Zródło: opracowanie własne´

(13)

Sumaryczna liczba poprawnych klasyfikacji podzielona przez liczno´s´c zbioru danych N stanowi oszacowanie trafno´sci klasyfikacji.

— Szczególny przypadek:

N-krotna kroswalidacja (leave-one-out cross-validation),

gdzie N to liczno´s´c zbioru danych przed podziałem na zbiór ucz ˛acy i testowy.

(14)

Literatura

[1] T. Morzy, Eksploracja danych. Metody i algorytmy, Wydawnictwo Naukowe PWN, Warszawa (2013)

[2] M. Krzy´sko, W. Woły´nski, T. Górecki, M. Skorzybut, Systemy ucz ˛ace si˛e.

Rozpoznawanie wzorców, analiza skupie´n i redukcja wymiarowo´sci. WNT, Warszawa (2008)

[3] R.O. Duda, P.E. Hart, D.G. Stork, Pattern Classification, 2nd ed., Wiley, (2000) [4] http://en.wikipedia.org/wiki/Receiver_operating_characteristic

Cytaty

Powiązane dokumenty

wewn˛ etrzne, ii. +) oraz element przeci-

Preliminaria matema- tyczne do tych wykładów podano w wykładach: Wst˛ep do Matematyki oraz Funkcje Rekurencyjne, preliminaria logiczne w wykładach

Znale´z´c si l¸e wywieran¸a przez tak¸a mas¸e na mas¸e punktow¸a znajduj¸ac¸a si¸e w odleg lo´sci x od ´srodka kuli.. Znajd´z energi¸e potencjaln¸a tego

Cecha przyjmuj ˛ aca pewne warto´sci liczbowe i nie przyjmuj ˛ aca warto´sci po´sred- nich (np. liczba bakterii, liczba pracowników, liczba pasa˙zerów). Cecha ci

W wylosowanej grupie stwierdzono, ˙ze 385 absolwentów liceów oraz 501 absolwentów techników rozwi ˛ azało test wst˛epny... Jednej grupie podawano nowy lek, za´s dru- giej

Proporcjonalny regulator od stanu dla systemu adaptacyjnego tempomatu.. Uproszczony model systemu

Projektowanie układów elektroniki odczytu pracuj ˛ acych w trybie zliczania pojedynczych fotonów.. Tryby pracy układów do odczytu

[r]