WykĹad 8

(1)

Wprowadzenie do “data science”

Wykład 8 - przegl ˛

ad metod uczenia maszynowego

dr in˙z. Julian Sienkiewicz

(2)

Zadania

(3)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

Opis + wizualizacja histogramy wykresy PCA, MDS FA, CCA ANOVA Estymacja + predykcja estymacja g ˛esto´sci najbli˙zsi s ˛asiedzi regresja Klasyfikacja + reguły klasyfikatory asocjacje sieci bay-esowskie i Markowa Klastrowanie metoda k-means klastrowanie hierarchiczne

(4)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(5)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(6)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(7)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(8)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(9)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(10)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(11)

Zadania

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

1

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

2

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

3

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

4

_{grupowanie (klastrowanie).}

(12)

Opis

LDA - liniowa analiza dyskryminacji

Rozwa˙zmy k klas i obserwacjex pochodz ˛ace z wielowymiarowego rozkładu Gaussa p(x|k ) ∼ N (mk,S), czyli: p(x|k ) = 1 (2π) p 2|S|12 exph−1₂(x − mk)TS−1(x − mk) i

ka˙zda klasa k jest scharakteryzowana warto´sci ˛a oczekiwan ˛amk

wszystkie klasy maj ˛a tak ˛a sam ˛a macierz kowariancjiS

korzystaj ˛ac z reguły bayesowskiej mo˙zna okre´sli´cfunkcj ˛e dyskryminacyjn ˛a dla dwóch klas δ12(x) = lnp(1|_p(2|x)_x)=lnπ_π1 2 +ln p(x|1) p(x|2)czyli δ12(x) = ln π₁ π2 + 1 2(m1− m2)TS−1(m1+m2) + (m1− m2)TS−1x

Je˙zeli δ12(x) > 0, to obserwacja x zostaje sklasyfikowana jako pochodz ˛aca z klasy 1,

je´sli δ12(x) < 0, to x jest z klasy 2.

QDA - kwadratowa analiza dyskryminacji

W przypadku metody QDA zakładamy ró˙zne macierze kowariancji p(x|k ) ∼ N (mk,Sk).

δkl(x) = lnπ_π1 2+ 1 2ln |Sk| |Sl| +x T_(S−1 l ml− S−1k mk) −12xT(S −1 l − S −1 k )x − 1 2mTlS −1 l ml+ 1 2m T kS −1 k mk =0

(13)

Opis

LDA - liniowa analiza dyskryminacji

Rozwa˙zmy k klas i obserwacjex pochodz ˛ace z wielowymiarowego rozkładu Gaussa p(x|k ) ∼ N (mk,S), czyli: p(x|k ) = 1 (2π) p 2|S|12 exph−1₂(x − mk)TS−1(x − mk) i

ka˙zda klasa k jest scharakteryzowana warto´sci ˛a oczekiwan ˛amk

wszystkie klasy maj ˛a tak ˛a sam ˛a macierz kowariancjiS

korzystaj ˛ac z reguły bayesowskiej mo˙zna okre´sli´cfunkcj ˛e dyskryminacyjn ˛a dla dwóch klas δ12(x) = lnp(1|_p(2|x)_x)=lnπ_π1 2 +ln p(x|1) p(x|2)czyli δ12(x) = ln π₁ π2 + 1 2(m1− m2)TS−1(m1+m2) + (m1− m2)TS−1x

Je˙zeli δ12(x) > 0, to obserwacja x zostaje sklasyfikowana jako pochodz ˛aca z klasy 1,

je´sli δ12(x) < 0, to x jest z klasy 2.

QDA - kwadratowa analiza dyskryminacji

W przypadku metody QDA zakładamy ró˙zne macierze kowariancji p(x|k ) ∼ N (mk,Sk).

δkl(x) = lnπ_π1 2+ 1 2ln |Sk| |Sl| +x T_(S−1 l ml− S−1k mk) −12xT(S −1 l − S −1 k )x − 1 2mTlS −1 l ml+ 1 2m T kS −1 k mk =0

(14)

Przykłady

(15)

Przykłady

(16)

Opis

Maszyny wektorów no´snych (support vector machines - SVM)

zadanie optymalizacji polega na znalezieniu najszerszego mo˙zli-wego marginesu,

po´srodku marginesu umieszcza si ˛e hiperpłaszyzn ˛e dyskrymina-cyjn ˛a,

nazwa SVM ma swoje ´zródło w tym, ˙ze hiperpłaszczyzny margi-nesów musz ˛a przechodzi´c przez konkretne elementy prób ucz ˛ a-cych (inaczej margines mo˙zna byłoby rozszerzy´c) - s ˛a to wła-´snie wektory podpieraj ˛ace.

W efekcie zadanie znalezienia optymalnego poło˙zenia hiperpłaszczyzny H sprowadza si ˛e do maksymalizacji wyra˙zenia d++d−= _||w||2 lub, co jest równowa˙zne, do

(17)

Opis

Maszyny wektorów no´snych (support vector machines - SVM)

(18)

Opis

Maszyny wektorów no´snych (support vector machines - SVM)

(19)

Opis

Maszyny wektorów no´snych (support vector machines - SVM)

(20)

Opis

Maszyny wektorów no´snych (support vector machines - SVM)

(21)

Przykłady

(22)

Struktura drzewa A korze ´n gał ˛a´z B dzieci C D E li ´s ´c Najlepsze rozdzielenie

Ró˙znorodno´s´c otrzymywanych cz ˛e´sci jest

mo˙zliwie najwi ˛eksza

80/20

80/0 0/20

konwencja rysowania drzew rosn ˛

acych od góry w dół [sic!]: korze ´n na

górze, na dole li´scie

od korzenia do

ka˙zdego li´scia prowadzi tylko jedna droga,

w korzeniach jest skupiona cała

próba ucz ˛

aca

, kolejne elementy PU s ˛

a

przesuwane wzdłu˙z gał ˛ezi, z góry w dół,

w ka˙zdym w ˛e´zle jest podejmowana o wyborze gał ˛ezi, wzdłu˙z której b

˛e-dzie trwa´c przesuwanie próby

(23)

Ró˙znorodno´s´c otrzymywanych cz ˛e´sci jest

mo˙zliwie najwi ˛eksza

80/20

80/0 0/20

konwencja rysowania drzew rosn ˛

acych od góry w dół [sic!]: korze ´n na

górze, na dole li´scie

od korzenia do

ka˙zdego li´scia prowadzi tylko jedna droga,

w korzeniach jest skupiona cała

próba ucz ˛

aca

, kolejne elementy PU s ˛

a

przesuwane wzdłu˙z gał ˛ezi, z góry w dół,

w ka˙zdym w ˛e´zle jest podejmowana o wyborze gał ˛ezi, wzdłu˙z której b

˛e-dzie trwa´c przesuwanie próby

(24)

Ró˙znorodno´s´c otrzymywanych cz ˛e´sci jest

mo˙zliwie najwi ˛eksza

80/20

80/0 0/20

konwencja rysowania drzew rosn ˛

acych od góry w dół [sic!]: korze ´n na

górze, na dole li´scie

od korzenia do

ka˙zdego li´scia prowadzi tylko jedna droga,

w korzeniach jest skupiona cała

próba ucz ˛

aca

, kolejne elementy PU s ˛

a

przesuwane wzdłu˙z gał ˛ezi, z góry w dół,

w ka˙zdym w ˛e´zle jest podejmowana o wyborze gał ˛ezi, wzdłu˙z której b

˛e-dzie trwa´c przesuwanie próby

(25)

Przykładowe drzewo klasyfikacyjne

Cel drzewa klasyfikuj ˛acego

Umo˙zliwienie klasyfikacji obserwacji, o których nie wiemy, do jakich klas

na-le˙z ˛

a.

Drzewo jest uczone (trenowane) na podstawie

próby ucz ˛

acej

:

od niej zale˙zy posta´c

warunków podziału

(26)

Przykładowe drzewo klasyfikacyjne

Cel drzewa klasyfikuj ˛acego

Umo˙zliwienie klasyfikacji obserwacji, o których nie wiemy, do jakich klas

na-le˙z ˛

a.

Drzewo jest uczone (trenowane) na podstawie

próby ucz ˛

acej

:

od niej zale˙zy posta´c

warunków podziału

(27)

Opis

Analiza skupie ´n w przestrzeni euklidesowej R

p

mamy n-elementowy zbiór obserwacjixi, i = 1, ..., n o warto´sciach w Rp,

chcemy podzieli´c t ˛e prób ˛e na K skupie ´n, T = 1 2 n X i=1 n X i0₌₁ dii0

suma kwadratów odległo´sci pomi ˛edzy parami punktów próby

dii0=d (xi,xi0)

kwadrat odległo´sci pomi ˛edzy obserwacjamixiixi0

w ten sposób dokonali´smy arbitralnego podziału obserwacji na K rozł ˛acznych podzbiorów k = 1, .., K , gdzie oznaczymy C(i) = k jako przynale˙zno´s´c i-tej obserwacjixido k -tego podzbioru.

Algorytm K -´srednich (K -means)

0 _{inicjalizacja pocz ˛}_{atkowych K ´srodków}_m_K_,

1 _{w pierwszym kroku przypisujemy punkty do najbli˙zszych ´srodków}_m_k 2 obliczamy nowe ´srodki skupie ´n i wracamy do kroku 1

3 _{kontynuujemy iteracje, dopóki ˙zaden punkt nie przeniesie si ˛e z jednego skupienia}

(28)

Opis

Analiza skupie ´n w przestrzeni euklidesowej R

p

dii0=d (xi,xi0)

Algorytm K -´srednich (K -means)

3 _{kontynuujemy iteracje, dopóki ˙zaden punkt nie przeniesie si ˛e z jednego skupienia}

(29)

Opis

Analiza skupie ´n w przestrzeni euklidesowej R

p

dii0=d (xi,xi0)

Algorytm K -´srednich (K -means)

3 kontynuujemy iteracje, dopóki ˙zaden punkt nie przeniesie si ˛e z jednego skupienia do drugiego

WykĹad 8

Wprowadzenie do “data science”

Wykład 8 - przegl ˛

ad metod uczenia maszynowego

dr in˙z. Julian Sienkiewicz

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

uczenie maszynowe (machine learning) ≈ eksploracja danych (data mining)

Zadania uczenia maszynowego

opis, równie˙z EDA, redukcja wymiaru, wizualizacja

szacowanie (estymacja) oraz przewidywanie (predykcja),

klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,

grupowanie (klastrowanie).

Maszyny wektorów no´snych (support vector machines - SVM)

Maszyny wektorów no´snych (support vector machines - SVM)

Maszyny wektorów no´snych (support vector machines - SVM)

Maszyny wektorów no´snych (support vector machines - SVM)

Maszyny wektorów no´snych (support vector machines - SVM)

Ró˙znorodno´s´c otrzymywanych cz ˛e´sci jest

mo˙zliwie najwi ˛eksza

konwencja rysowania drzew rosn ˛

acych od góry w dół [sic!]: korze ´n na

górze, na dole li´scie

od korzenia do

ka˙zdego li´scia prowadzi tylko jedna droga,

w korzeniach jest skupiona cała

próba ucz ˛

aca

, kolejne elementy PU s ˛

a

przesuwane wzdłu˙z gał ˛ezi, z góry w dół,

w ka˙zdym w ˛e´zle jest podejmowana o wyborze gał ˛ezi, wzdłu˙z której b

˛e-dzie trwa´c przesuwanie próby

Ró˙znorodno´s´c otrzymywanych cz ˛e´sci jest

WykĹad 8

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}

_{opis, równie˙z EDA, redukcja wymiaru, wizualizacja}

_{szacowanie (estymacja) oraz przewidywanie (predykcja),}

_{klasyfikacja (uczenie pod nadzorem) + odkrywanie reguł,}

_{grupowanie (klastrowanie).}