Macierz wag do rozró»niania wewn¦trznego zró»nicowania klas

W dokumencie Metody stosowania wiedzy dziedzinowej do poprawiania jakości klasyfikatorów (Stron 82-87)

Metoda II: Modykacja oceny jako±ci podziaªu w drzewie na

5.1 Macierz wag do rozró»niania wewn¦trznego zró»nicowania klas

Proponowane podej±cie polega na przypisywaniu wag ci¦ciom, które rozró»niaj¡

obiekty z ró»nych klas decyzyjnych wykorzystuj¡c przy tym informacje na temat wewn¦trznego zró»nicowania klas, np. dla problemu CNS na temat liczby zmie-nionych naczy«. Ci¦cie, które rozró»nia najmniej odlegªe stany, tj. pacjentów bez

C NIE TAK l.stenoz 0 1 2 3

NIE 0 0 3 2 1

TAK 1 3 0 1 1

2 2 1 0 1

3 1 1 1 0

Tablica 5.1: Wagi ci¦¢ uwzgl¦dniaj¡ce liczb¦ zw¦»onych naczy« w CNS (reprezen-tacja tablicowa).

zmienionych naczy« od tych, którzy maj¡ tylko jedno zw¦»enie, otrzymuje wag¦

o najwy»szej warto±ci, poniewa» ró»nice mi¦dzy tymi grupami s¡ najsubtelniej-sze. Rozró»nienie przez ci¦cie pacjentów bez zmienionych naczy« od pacjentów z najwi¦ksz¡ liczb¡ zw¦»e«, powoduje przypisanie takiemu ci¦ciu najni»szej wagi.

Zakªada si¦, »e wagi s¡ okre±lane przez eksperta w danej dziedzinie na podstawie odlegªo±ci semantycznej poj¦¢. Jest to sposób na wyeksponowanie granicy pomi¦-dzy obszarem negatywnym i pozytywnym zªo»onego poj¦cia. Poniewa» jeste±my zainteresowani rozró»nieniem przykªadów negatywnych poj¦cia od pozytywnych, dlatego najwi¦ksze warto±ci wag przydzielane s¡ ci¦ciom rozró»niaj¡cym pacjentów bez istotnych zw¦»e« t¦tnic, od tych, u których zw¦»enia wyst¦puj¡.

Wykrycie subtelnych ró»nic mi¦dzy grup¡ pacjentów ze zmienionym jednym i dwoma naczyniami oraz dwoma i trzema nie wnosi u»ytecznej informacji do aproksymacji badanego poj¦cia, wi¦c wagi w tych przypadkach s¡ najni»sze. Dla-tego zaproponowano wagi takie, jak w Tabeli 5.1, gdzie pierwszy wiersz i pierwsza kolumna oznaczaj¡ klasy decyzyjne, natomiast drugi wiersz i druga kolumna doty-cz¡ liczby zw¦»onych t¦tnic wie«cowych. Graczn¡ prezentacj¦ wag poszczególnych ci¦¢ przedstawia tak»e Rys. 5.1.

Wagi proponowane przez eksperta, s¡ wykorzystywane do oceny jako±ci ci¦cia podczas rekurencyjnych podziaªów zbiorów w w¦zªach drzewa lokalnej dyskrety-zacji. Klasykator skonstruowany z wykorzystaniem wag oznaczany b¦dzie jako klasykator CTree-DiscW . Šatwo zauwa»y¢, »e metoda wyznaczania miar jako±ci ci¦¢ w klasykatorze CTree-Disc (Metoda I) stanowi szczególny przypadek me-tody CTree-DiscW, w którym tablica wag 5.1 zawiera tylko dwie warto±ci: 0 lub 1.

W klasykatorze CTree-Disc jako±¢ ci¦cia jest liczb¡ par obiektów nale»¡cych do przeciwnych klas decyzyjnych, wyznaczan¡ ze wzoru (3.1). Natomiast w metodzie CTree-DiscW miara ta wyznaczana jest jako suma wag wszystkich par obiektów nale»¡cych do ró»nych klas z uwzgl¦dnieniem liczby zw¦»onych naczy«. Na przy-kªad, je»eli dane ci¦cie c dzieli zbiór obiektów na dwa podzbiory o liczebno±ci M

3

2

1 1

1

1

S=0 S=1 S=2 S=3

Rysunek 5.1: Wagi ci¦¢ (reprezentacja graczna). S - liczba stenoz

i N, a liczba obiektów bez zw¦»onych istotnie naczy« (klasa NIE) oraz ze stenoz¡

1, 2 lub 3 t¦tnic (klasa T AK) wynosi odpowiednio M0, M1, M2, M3 w jednej gru-pie oraz N0, N1, N2, N3 w drugiej, wówczas miara jako±ci ci¦cia jest wyznaczana nast¦puj¡co:

QDiscW =

3 i,j=0

wijMiNj (5.1)

gdzie wi,j oznacza wag¦ ci¦cia rozró»niaj¡cego par¦ obiektów nale»¡cych do ró»nych klas: bez stenozy oraz ze stenoz¡ (1, 2 lub 3 istotnie zw¦»one naczynia).

Rysunek 5.2 przedstawia drzewo decyzyjne utworzone dla problemu przewidy-wania obecno±ci zw¦»e« t¦tnic wie«cowych w medycznym zbiorze danych z wy-korzystaniem klasykatora CTree-DiscW. W ka»dym w¦¹le drzewa podano liczb¦

obiektów z poszczególnych klas decyzyjnych z uwzgl¦dnieniem informacji na te-mat wewn¦trznego zró»nicowania klasy T AK, gdzie S0 oznacza liczb¦ obiektów bez zmienionych naczy« (liczba stenoz S równa 0), S1 liczb¦ obiektów z jedn¡

stenoz¡, S2 z dwoma zw¦»eniami, a S3 liczb¦ obiektów w¦zªa z trzema stenozami.

Przedstawione drzewo mo»e by¢ zastosowane do klasykacji obiektów ±wiata rzeczywistego. Na przykªad w przypadku pacjenta p, którego pierwszy w oknie czasowym ±redni czas trwania odst¦pu QT c w pierwszym odprowadzeniu EKG (F IRST _QT C1_AV G) wynosiª 299 ms, odchylenie standardowe czasu trwa-nia odst¦pu QT w pierwszym punkcie okna czasowego dla pierwszego odpro-wadzenia EKG (F IRST _QT 1_ST D) wynosiªo 6.9, a poziom cholesterolu LDL 4.1 mmol/l, przemieszczamy si¦ od korzenia, w dóª do prawego poddrzewa, po-niewa» pacjent pasuje do wzorca F IRST _QT C1_AV G < 451. W nast¦pnym kroku przechodzimy do lewego poddrzewa ze wzgl¦du na dopasowanie do wzorca

Decyzja: TAK Decyzja: NIE

Rysunek 5.2: Drzewo decyzyjne otrzymane metod¡ II do predykcji stenoz w CNS.

F IRST_QT 1_ST D ≥ 6.7. Po odnalezieniu kolejnego ci¦cia, obiekt (pacjent) przemieszczany jest do prawego poddrzewa, który jest li±ciem. W li±ciu do obiektu p przypisywana jest ta klasa decyzyjna, do której przynale»¡ wszystkie obiekty w¦zªa. ‘cie»ka pasuj¡ca do nowego obiektu wskazuje, »e w t¦tnicach tego pacjenta nie wyst¦puj¡ istotne zw¦»enia wymagaj¡ce udra»niania.

Wzorce wyst¦puj¡ce w przedstawionym drzewie maj¡ znaczenie kliniczne. Wy-generowane ci¦cia dotycz¡ gªównie czasu trwania odst¦pu QT , który odzwierciedla czas trwania repolaryzacji komór mi¦±nia sercowego. Powszechnie stosuje si¦ ko-rekcj¦ odst¦pu QT wzgl¦dem cz¦stotliwo±ci akcji serca celem zmniejszenia wpªywu rytmu serca, wykonywan¡ za pomoc¡ ró»nych wzorów (najcz¦±ciej u»ywa si¦ w tym celu wzoru Bazetta). Taki skorygowany odst¦p QT nazywany jest odst¦pem QT c.

Ocena odst¦pu QT i QT c pozwala rozpozna¢ gro¹n¡ dla »ycia pacjenta patologi¦.

Wydªu»enie czy sporadycznie wyst¦puj¡ce skrócenie (poni»ej 350 ms) odst¦pu QT mo»e odpowiada¢ za zasªabni¦cia, omdlenia lub nagªy zgon sercowy NGS w wyniku cz¦stoskurczu komorowego, migotania komór lub przedsionków [130]. Czas trwania QT c nie powinien przekracza¢ 450 ms u kobiet i 430 ms u m¦»czyzn [148]. Jedno

z ci¦¢ drzewa CTree-DiscW wynosi wªa±nie 451ms dla odst¦pu QT c, co wskazuje na zgodno±¢ uzyskanego wzorca z wiedz¡ dziedzinow¡.

Jednym z ogranicze« zaproponowanej metody jest konieczno±¢ posiadania do-datkowej informacji dotycz¡cej wewn¦trznego zró»nicowania (rozwarstwienia) klas decyzyjnych. W zale»no±ci od wewn¦trznej struktury tych klas, macierz wag mo»e przyjmowa¢ ró»ne rozmiary, co jest ªatwo rozwi¡zywalne podczas implementacji al-gorytmu. Ostateczna jako±¢ podziaªu obiektów na klasy decyzyjne w w¦¹le drzewa jest wyznaczana na podstawie ich przynale»no±ci do wewn¦trznych podklas. Nie ma jednak ograniczenia w stosowaniu tej metody tylko do atrybutów numerycznych, poniewa» modykacja jako±ci ci¦¢ mo»e by¢ zastosowana tak»e do cech symbolicz-nych, w tym wyra»onych jako przedziaªy warto±ci.

Rozdziaª 6

Metoda III: Ci¦cia werykuj¡ce jako

W dokumencie Metody stosowania wiedzy dziedzinowej do poprawiania jakości klasyfikatorów (Stron 82-87)