• Nie Znaleziono Wyników

Systemy uczace sie lab3

N/A
N/A
Protected

Academic year: 2021

Share "Systemy uczace sie lab3"

Copied!
10
0
0

Pełen tekst

(1)

1

Wprowadzenie do programu RapidMiner, część 4 Michał Bereta

www.michalbereta.pl 1. Wybór atrybutów (ang. attribute selection, feature selection).

Jedną z podstawowych metod analizy współoddziaływania / zależności atrybutów jest analiza korelacji. Możemy sprawdzid czy atrybuty nie niosą w pewnym sensie podobnej informacji.

Współczynnik korelacji między atrybutem x oraz y można wyliczyd ze wzoru

gdzie sx oraz sy to odchylenia standardowe, n to liczba przykładów.

Powyższy współczynnik to współczynnik Pearsona i przyjmuje wartości z przedziału *-1, 1+. Duże bezwzględne wartości tego współczynnika wskazują na dużą korelację (dodatnią lub ujemną) x i y. Takie atrybuty często są nadmiarowe.

Wykorzystaj operator „Correlation Matrix” i bazę danych Indian Pima.

W wyniku otrzymamy macierz korelacji, gdzie możemy sprawdzid korelację pomiędzy dowolną parą atrybutów.

(2)

2

Wartości te mogą służyd do określenia wartości wag atrybutów (większa wartośd wagi oznacza większe znaczenie atrybutu).

Sprawdź, że jeśli w opcjach operatora „CorrelationMatrix” nie jest zaznaczone „normalize weights” to wagi te nie są tak wyraźnie oceniające atrybuty.

Wagi atrybutów mogą posłużyd do decyzji, które z nich odrzucid, np. wykorzystując operator „Select by Weights” by wybrad tylko te atrybuty, które mają wagę większą niż np. 0.5.

(3)

3 Wynik: z oryginalnego zestawu ośmiu atrybutów

(4)

4 Zadanie:

Jak sprawdzid korelację każdego z atrybutów z etykietą klasy?

a.) W przypadku dwóch klas należy zakodowad etykiety klas numerycznie, np. jako 0 i 1 b.) W przypadku liczby klas większej niż dwa, procedura ta nie jest wskazana (dlaczego?).

c.) Czy atrybuty, które są w tym przykładzie najbardziej skorelowane z etykietą klasy (att9) są tymi samymi, które zostały najlepiej ocenione (otrzymały najwyższe wagi) w poprzednim przykładzie? (Dlaczego?)

Wynik (pamiętaj, że istotna jest bezwzględna wartośd):

Uwaga: operator „Weight by Correlation” umożliwia oszacowanie wag dla atrybutów na podstawie ich korelacji z etykietą klasy. Wypróbuj go i porównaj z wynikami z powyższej tabli.

Z dokumentacji:

This operator calculates the relevance of the attributes by computing the value of correlation for each attribute of the input ExampleSet with respect to the label attribute. This weighting scheme is based upon correlation and it returns the absolute or squared value of correlation as attribute weight.

(5)

5 Zadanie:

Porównaj działanie „Select by Weights” z „Correlation Matrix” z poprzedniego przykładu z operatorem „Remove Correlated Attributes”:

(6)

6 Przykładowy wynik:

“Select by Weights” z „Correlation Matrix”:

„Remove Correlated Attributes”:

(7)

7 Zadanie:

Zbadaj korzyści płynące z wykorzystania powyższych metod analizy istotności atrybutów a problemie klasyfikacji szkła. Dodatkowo zastosuj operator „Weight by Relief” oraz jeden dodatkowy z zestawu dostępnego w RM. Zwród uwagę, że nie wszystkie nadają się do problemów klasyfikacji z wieloma klasami.

(8)

8

2. Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora.

Przy ocenie wartości atrybutu kierowad można się empiryczną oceną jakości działania konkretnego klasyfikatora, który wykorzystuje dany atrybut, a raczej cały zestaw atrybutów.

Istnieją dwa główne podejścia:

a.) Forward selection - dodawaj kolejne atrybuty jeśli ich dodanie poprawia działanie klasyfikatora danego typu

b.) Backward elimination - usuwaj po kolei kolejne atrybuty, i akceptuj usunięcie, jeśli wytrenowany na pozostających atrybutach klasyfikator danego typu poprawia się / nie pogarsza swojego działania

Porównaj działanie tych dwóch operatorów – czy jest duża różnica w ostatecznym wyborze? :

(9)

9 Dla „Backward Elimination”:

Przykładowe wybrane atrybuty: Dla „ForwardSelection”:

(10)

10 Dla „Backward Elimination”:

Cytaty

Powiązane dokumenty

rz¹d holender- ski przed³o¿y³ w parlamencie projekt ustawy, która w zamiarze jej auto- rów mia³a w sposób kompleksowy uregulowaæ nie tylko zagadnienia pro- ceduralne

Wœród uprawnieñ przys³uguj¹cych wierzycielowi w przy- padku naruszenia zobowi¹zania zaproponowano wprowadzenie – w ra- mach ogólnego re¿imu odpowiedzialnoœci – prawa

7 Tersytes pojawia się w sztuce Troilus i Kresyda, gdzie jest postacią jeszcze bardziej antypa- tyczną, a także dużo bardziej prymitywną, również pod względem wysławiania

przyjąć, że akty te nie były leges w ścisłym tego słowa znaczeniu, a jedynie by- ły wzorowane na leges nie tylko z tego względu, że rogatio nie była stawiana przez

worzyła drogę dla małżeństw mieszanych. Punktem zapalnym tego konfliktu był problem przeprowadzania auspicjów. Od czasów Romulusa ius auspicandi było przywilejem

31 Wskazuje na to nie tylko powoływany fragment mowy Cycerona, lecz także dalej analizowa- na jego uwaga w Cic. Na ich temat zob.: W. Litewski, Rzymski proces karny, Kraków 2003,

W niniejszej publikacji dokonana zostanie analiza trzech czynników prawo- twórczych funkcjonujących w prawie rzymskim, tj.: działalności pretora – two- rzącego prawo

Realna szansa na wprowadzenie modyfikacji pojawiła się jednak dopiero wraz z utworzeniem Królestwa Polskiego oraz nadaniem przez Aleksandra I Konstytucji w dniu 27 listopada 1815