• Nie Znaleziono Wyników

Wykład 02 – Zadania, modele, dane

N/A
N/A
Protected

Academic year: 2021

Share "Wykład 02 – Zadania, modele, dane"

Copied!
135
0
0

Pełen tekst

(1)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Podstawy uczenia maszynowego

Wykład 02 – Zadania, modele i dane

Jarosław Miszczak

10/03/2021

(2)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

1 Warianty uczenia maszynowego

2 Ograniczenia uczenia maszynowego 3 Modele

(3)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele Co to jest maszyna? ?... ?... ?... 3 / 57

(4)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

(5)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Przykład automatyzacji uczenia

(6)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Przykład automatyzacji uczenia

przykład

(7)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Przykład automatyzacji uczenia

przykład

(8)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Przykład automatyzacji uczenia

przykład

etykieta

(9)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Przykład automatyzacji uczenia

Zbiór treningowy

przykład

etykieta

(10)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Wejściem jest zbiór uczący lub zbiór treningowy czyli zbiór opisanych przykładów

D = {(x(i ), y(i ))}Ni =1.

Celem jest określenie funkcji opisującej zależności między obiektami a etykietami

x(i ) 7→ y(i ).

(11)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Wejściem jest zbiór uczący lub zbiór treningowy czyli zbiór opisanych przykładów

D = {(x(i ), y(i ))}Ni =1.

Celem jest określenie funkcji opisującej zależności między obiektami a etykietami

x(i ) 7→ y(i ).

(12)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane Zbiór testowy ? ? ? ? ? ? 7 / 57

(13)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Elementy składowe xi to cechy (ang. features).

Cechy to atrybuty (ang. attributes) wraz z wartościami.

W najprostszym przypadku xi to d -wymiarowe wektory.

Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.

(14)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Elementy składowe xi to cechy (ang. features).

Cechy to atrybuty (ang. attributes) wraz z wartościami.

W najprostszym przypadku xi to d -wymiarowe wektory.

Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.

(15)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Elementy składowe xi to cechy (ang. features).

Cechy to atrybuty (ang. attributes) wraz z wartościami.

W najprostszym przypadku xi to d -wymiarowe wektory.

Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.

(16)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Elementy składowe xi to cechy (ang. features).

Cechy to atrybuty (ang. attributes) wraz z wartościami.

W najprostszym przypadku xi to d -wymiarowe wektory.

Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.

(17)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

W zależności o przeciwdziedziny funkcji nasze zadanie to

klasyfikacja bądź regresja.

W przypadku klasyfikacji zakładamy, że yi należy do zbioru

skończonego (dyskretnego).

Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.

Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy

regresją.

(18)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

W zależności o przeciwdziedziny funkcji nasze zadanie to

klasyfikacja bądź regresja.

W przypadku klasyfikacji zakładamy, że yi należy do zbioru

skończonego (dyskretnego).

Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.

Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy

regresją.

(19)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

W zależności o przeciwdziedziny funkcji nasze zadanie to

klasyfikacja bądź regresja.

W przypadku klasyfikacji zakładamy, że yi należy do zbioru

skończonego (dyskretnego).

Tego typu zmienną nazywamy kategoryczną.

Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.

Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy

regresją.

(20)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

W zależności o przeciwdziedziny funkcji nasze zadanie to

klasyfikacja bądź regresja.

W przypadku klasyfikacji zakładamy, że yi należy do zbioru

skończonego (dyskretnego).

Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.

Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy

regresją.

(21)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

W zależności o przeciwdziedziny funkcji nasze zadanie to

klasyfikacja bądź regresja.

W przypadku klasyfikacji zakładamy, że yi należy do zbioru

skończonego (dyskretnego).

Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.

Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy

regresją.

(22)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Nasz algorytm może dawać różne wyniki określające

prawdopodobieństwo przynależności do klasy.

Odpowiedź systemu to ta klasa, dla której prawdopodobieństwo jest największe

arg maxc∈Cp(y = c|x , D)

(23)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia

Uczenie nadzorowane

Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nadzorowane

Nasz algorytm może dawać różne wyniki określające

prawdopodobieństwo przynależności do klasy.

Odpowiedź systemu to ta klasa, dla której prawdopodobieństwo jest największe

arg maxc∈Cp(y = c|x , D)

(24)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

W uczeniu nienadzorowanym nie mamy do dyspozycji informacji o etykietach.

Do dyspozycji mamy jedynie dane wejściowe {xi}.

Jest to scenariusz podobny do tego z jakim spotykamy się przy uczeniu się człowieka.

(25)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

W uczeniu nienadzorowanym nie mamy do dyspozycji informacji o etykietach.

Do dyspozycji mamy jedynie dane wejściowe {xi}.

Jest to scenariusz podobny do tego z jakim spotykamy się przy uczeniu się człowieka.

(26)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

W uczeniu nienadzorowanym nie mamy do dyspozycji informacji o etykietach.

Do dyspozycji mamy jedynie dane wejściowe {xi}.

Jest to scenariusz podobny do tego z jakim spotykamy się przy uczeniu się człowieka.

(27)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

Podstawowym zadaniem uczenia nienadzorowanego jest

klasteryzacja, czyli odkrycie struktury danych wejściowych.

Kolejnym zadaniem jest asocjacja, gdzie chcemy określić

reguły opisujące nasze dane.

Uczeniem bez nadzoru jest również detekcja anomalii. Do tej grupy zalicza się również metody związane z redukcją

wymiarowości

(28)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

Podstawowym zadaniem uczenia nienadzorowanego jest

klasteryzacja, czyli odkrycie struktury danych wejściowych.

Kolejnym zadaniem jest asocjacja, gdzie chcemy określić

reguły opisujące nasze dane.

Uczeniem bez nadzoru jest również detekcja anomalii. Do tej grupy zalicza się również metody związane z redukcją

wymiarowości

(29)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

Podstawowym zadaniem uczenia nienadzorowanego jest

klasteryzacja, czyli odkrycie struktury danych wejściowych.

Kolejnym zadaniem jest asocjacja, gdzie chcemy określić

reguły opisujące nasze dane.

Uczeniem bez nadzoru jest również detekcja anomalii.

Do tej grupy zalicza się również metody związane z redukcją

wymiarowości

(30)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane

Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie nienadzorowanie

Podstawowym zadaniem uczenia nienadzorowanego jest

klasteryzacja, czyli odkrycie struktury danych wejściowych.

Kolejnym zadaniem jest asocjacja, gdzie chcemy określić

reguły opisujące nasze dane.

Uczeniem bez nadzoru jest również detekcja anomalii. Do tej grupy zalicza się również metody związane z redukcją

wymiarowości

(31)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie

Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie częściowo nadzorowanie

Jeżeli część naszych danych jest poetykietowana (czyli trudna do uzyskania), ale znaczna część nie zawiera informacji o etykietach to mówimy o uczeniu częściowo nadzorowanym.

(32)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Osobną grupą metod stanowi uczenie ze wzmocnieniem.

W tym schemacie agent otrzymuje nagrodę na podstawie wykonanych akcji.

Cel

Wypracowanie reguł postępowania które mają doprowadzić do rozwiązania problemu.

(33)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Osobną grupą metod stanowi uczenie ze wzmocnieniem. W tym schemacie agent otrzymuje nagrodę na podstawie wykonanych akcji.

Cel

Wypracowanie reguł postępowania które mają doprowadzić do rozwiązania problemu.

(34)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Osobną grupą metod stanowi uczenie ze wzmocnieniem. W tym schemacie agent otrzymuje nagrodę na podstawie wykonanych akcji.

Cel

Wypracowanie reguł postępowania które mają doprowadzić do rozwiązania problemu.

(35)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent

A

kc

j

e Interpretacja Nagroda Stan

Źródło: Reinforcement learning w Wikipedii

(36)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent

A

kc

j

e Interpretacja Nagroda Stan

Źródło: Reinforcement learning w Wikipedii

(37)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent

A

kc

j

e Interpretacja Nagroda Stan

Źródło: Reinforcement learning w Wikipedii

(38)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent

A

kc

j

e Interpretacja Nagroda Stan

Źródło: Reinforcement learning w Wikipedii

(39)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent

A

kc

j

e Interpretacja Nagroda Stan

Źródło: Reinforcement learning w Wikipedii

(40)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Ogólny schemat modelowania procesu uczenia się na podstawie zdobywanego doświadczenia.

Stosowany z powodzeniem do gier (komputerowych), w tym do Go.

(41)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie

Uczenie ze wzmacnianiem

Warianty uczenia maszynowego

Uczenie ze wzmacnianiem

Ogólny schemat modelowania procesu uczenia się na podstawie zdobywanego doświadczenia.

Stosowany z powodzeniem do gier (komputerowych), w tym do Go.

(42)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

(43)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Przetrenowanie

Przetrenowanie

System nie powinien dopasowywać się idealnie do danych na których jest uczony.

(44)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Przetrenowanie 0 1 2 3 4 5 0 2 4 6 8

Dane wygenerowane jako x + U(−0.25, 0.25). Funkcja postaci x 7→ 10 X i =1 aixi

dopasowuje się idealnie.

(45)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Przetrenowanie 0 1 2 3 4 5 0 2 4 6 8

Dane wygenerowane jako x + U(−0.25, 0.25). Funkcja postaci

x 7→ ax

dopasowuje się do nich z pewnym błędem.

(46)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

W tym przypadku pierwsze dopasowanie jest za dobre. Przewidywanie wartości naszej funkcji za pomocą takiego dopasowanie da niepożądane wyniki.

Pierwsze dopasowanie ma dużą wariancję i dlatego jest podatne na przetrenowanie (ang. overfitting).

(47)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

W tym przypadku pierwsze dopasowanie jest za dobre. Przewidywanie wartości naszej funkcji za pomocą takiego dopasowanie da niepożądane wyniki.

Pierwsze dopasowanie ma dużą wariancję i dlatego jest podatne na przetrenowanie (ang. overfitting).

(48)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Co jest najważniejszym elementem uczenia się? ?...

?... ?...

(49)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego

nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias) nadmierna wrażliwość ≡ wysoka wariancja (ang. variance) Kompromis między obciążeniem a wariancją to jeden z

podstawowych problemów uczenia maszynowego (i statystyki).

(50)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego

nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias)

nadmierna wrażliwość ≡ wysoka wariancja (ang. variance) Kompromis między obciążeniem a wariancją to jeden z

podstawowych problemów uczenia maszynowego (i statystyki).

(51)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego

nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias) nadmierna wrażliwość ≡ wysoka wariancja (ang. variance)

Kompromis między obciążeniem a wariancją to jeden z

podstawowych problemów uczenia maszynowego (i statystyki).

(52)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego

nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias) nadmierna wrażliwość ≡ wysoka wariancja (ang. variance) Kompromis między obciążeniem a wariancją to jeden z

podstawowych problemów uczenia maszynowego (i statystyki).

(53)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Sposoby radzenia sobie z tym dylematem między obciążeniem a wariancją to

regularyzacja – wzbogacanie algorytmu uczenia dodatkowe warunki (7→ regresja)

łączenie klasyfikatorów – zespół słabych klasyfikatorów daje dobry klasyfikator (7→ lasy losowe)

(54)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Sposoby radzenia sobie z tym dylematem między obciążeniem a wariancją to

regularyzacja – wzbogacanie algorytmu uczenia dodatkowe warunki (7→ regresja)

łączenie klasyfikatorów – zespół słabych klasyfikatorów daje dobry klasyfikator (7→ lasy losowe)

(55)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie

Obciążenie vs wariancja

Niedoskonałości danych Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Obciążenie vs wariancja

Sposoby radzenia sobie z tym dylematem między obciążeniem a wariancją to

regularyzacja – wzbogacanie algorytmu uczenia dodatkowe warunki (7→ regresja)

łączenie klasyfikatorów – zespół słabych klasyfikatorów daje dobry klasyfikator (7→ lasy losowe)

(56)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Brak danych

Większość metod uczenia maszynowego potrzebuje dużej ilości danych.

Dla prostych problemów potrzebne są tysiące próbek/przykładów.

Dla wielu problemów dotyczących przetwarzania obrazów bądź mowy potrzebnych są miliony próbek/przykładów.

(57)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Brak danych

Większość metod uczenia maszynowego potrzebuje dużej ilości danych.

Dla prostych problemów potrzebne są tysiące próbek/przykładów.

Dla wielu problemów dotyczących przetwarzania obrazów bądź mowy potrzebnych są miliony próbek/przykładów.

(58)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Brak danych

Większość metod uczenia maszynowego potrzebuje dużej ilości danych.

Dla prostych problemów potrzebne są tysiące próbek/przykładów.

Dla wielu problemów dotyczących przetwarzania obrazów bądź mowy potrzebnych są miliony próbek/przykładów.

(59)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Problemy wynikające z:

błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),

wprowadzenia danych niekompletnych,

wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.

(60)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Problemy wynikające z:

błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),

wprowadzenia danych niekompletnych,

wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.

(61)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Problemy wynikające z:

błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),

wprowadzenia danych niekompletnych,

wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.

(62)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Problemy wynikające z:

błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),

wprowadzenia danych niekompletnych,

wprowadzenia danych (częściowo) sprzecznych,

niezdefiniowania ograniczeń dziedzinowych.

(63)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja

Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Niedoskonałości danych

Problemy wynikające z:

błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),

wprowadzenia danych niekompletnych,

wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.

(64)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Zasada odpłatności za obiady

Twierdzenie (No Free Lunch Theorem)

Nie istnieje metoda uniwersalnie dobra do każdego problemu.

Konieczne są różne modele dla różnych rodzajów danych. Dla każdego modelu możemy wybrać różne metody trenowania.

(65)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Zasada odpłatności za obiady

Twierdzenie (No Free Lunch Theorem)

Nie istnieje metoda uniwersalnie dobra do każdego problemu. Konieczne są różne modele dla różnych rodzajów danych.

Dla każdego modelu możemy wybrać różne metody trenowania.

(66)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych

Zasada odpłatności za obiady

Ograniczenia uczenia maszynowego

Zasada odpłatności za obiady

Twierdzenie (No Free Lunch Theorem)

Nie istnieje metoda uniwersalnie dobra do każdego problemu. Konieczne są różne modele dla różnych rodzajów danych. Dla każdego modelu możemy wybrać różne metody trenowania.

(67)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

(68)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Modele to uproszczona reprezentacja rzeczywistości.

Modele sa tworzone na podstawie obserwacji.

(69)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Modele to uproszczona reprezentacja rzeczywistości. Modele sa tworzone na podstawie obserwacji.

(70)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Uproszczenie

Model to uproszczona reprezentacja rzeczywistości.

Model nie oddaje w pełni rzeczywistości. Model jest tworzony na podstawie obserwacji.

(71)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Uproszczenie

Model to uproszczona reprezentacja rzeczywistości. Model nie oddaje w pełni rzeczywistości.

Model jest tworzony na podstawie obserwacji.

(72)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Uproszczenie

Model to uproszczona reprezentacja rzeczywistości. Model nie oddaje w pełni rzeczywistości. Model jest tworzony na podstawie obserwacji.

(73)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Jaka dziedzina wiedzy zajmuje się modelowaniem rzeczywistości? ?...

?... ?...

rzeczywistości?

(74)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Jaka dziedzina wiedzy zajmuje się modelowaniem rzeczywistości? ?...

?...

?... rzeczywistości?

(75)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λt

Równanie Schor¨odingera

H|v i = i ~dtd|v i

(76)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λt

Równanie Schor¨odingera

H|v i = i ~dtd|v i

(77)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λt

Równanie Schor¨odingera

H|v i = i ~dtd|v i

(78)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λt

Równanie Schor¨odingera

H|v i = i ~dtd|v i

(79)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Obserwacje

Model jest tworzony na podstawie obserwacji.

Model jest jest tak dobry jak dobre są dane które służą do jego stworzenia.

Obowiązuje zasada GIGO – Garbage In, Garbage Out.

(80)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Obserwacje

Model jest tworzony na podstawie obserwacji.

Model jest jest tak dobry jak dobre są dane które służą do jego stworzenia.

Obowiązuje zasada GIGO – Garbage In, Garbage Out.

(81)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Obserwacje

Model jest tworzony na podstawie obserwacji.

Model jest jest tak dobry jak dobre są dane które służą do jego stworzenia.

Obowiązuje zasada GIGO – Garbage In, Garbage Out.

(82)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Model vs. rzeczywistość

Models are to be used, not believed. – Henri Theil, Principles of Econometrics,

(83)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Nadzorowane uczenie maszynowe można podsumować jako

zgadywanie funkcji F , która mapuje zmienne wejściowe X na

wyjściowe Y ,

F (X ) 7→ Y .

Forma funkcji F jest nieznana.

Algorytm UM buduje funkcję ˆF (czyli przybliżenie funkcji F ) na podstawie danych treningowych.

(84)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Nadzorowane uczenie maszynowe można podsumować jako

zgadywanie funkcji F , która mapuje zmienne wejściowe X na

wyjściowe Y ,

F (X ) 7→ Y . Forma funkcji F jest nieznana.

Algorytm UM buduje funkcję ˆF (czyli przybliżenie funkcji F ) na podstawie danych treningowych.

(85)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Nadzorowane uczenie maszynowe można podsumować jako

zgadywanie funkcji F , która mapuje zmienne wejściowe X na

wyjściowe Y ,

F (X ) 7→ Y . Forma funkcji F jest nieznana.

Algorytm UM buduje funkcję ˆF (czyli przybliżenie funkcji F ) na podstawie danych treningowych.

(86)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Zadaniem UM jest ocena różnych algorytmów i sprawdzenie, który z nich jest lepszy w przybliżaniu F .

Różne algorytmy przyjmują różne założenia dotyczące: formy funkcji,

sposobu jej uczenia się.

(87)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Zadaniem UM jest ocena różnych algorytmów i sprawdzenie, który z nich jest lepszy w przybliżaniu F .

Różne algorytmy przyjmują różne założenia dotyczące: formy funkcji,

sposobu jej uczenia się.

(88)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Co to jest model?

Klasyfikacja vs regresja

Jeżeli F ma wartości z zadanego, dyskretnego zbioru wartości, to funkcja dokonuje klasyfikacji.

Jeżeli F ma wartości ze zbioru ciągłego, to funkcja dokonuje regresji.

(89)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne i parametryczne

Podstawowym podziałem modeli w UM jest podział na modele parametryczne,

modele nieparametryczne.

(90)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne i parametryczne

Parametryczne algorytmy uczenia maszynowego upraszczają mapowanie do znanej funkcji.

Algorytmy nieparametryczne mogą nauczyć się dowolnego

mapowania od wejść do wyjść.

(91)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele nieparametryczne

(92)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Zalety modeli nieparametrycznych

Modele nieparametryczne nie przyjmują założeń dotyczących formy funkcji F .

Budują odwzorowanie na podstawie danych treningowych co pozwala im na dostosowanie się do skomplikowanych

zależności.

Są skuteczne jeżeli jest dostępnych dużo danych, ale nie jest dostępna wiedza na temat ich struktury.

(93)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Zalety modeli nieparametrycznych

Modele nieparametryczne nie przyjmują założeń dotyczących formy funkcji F .

Budują odwzorowanie na podstawie danych treningowych co pozwala im na dostosowanie się do skomplikowanych

zależności.

Są skuteczne jeżeli jest dostępnych dużo danych, ale nie jest dostępna wiedza na temat ich struktury.

(94)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Zalety modeli nieparametrycznych

Modele nieparametryczne nie przyjmują założeń dotyczących formy funkcji F .

Budują odwzorowanie na podstawie danych treningowych co pozwala im na dostosowanie się do skomplikowanych

zależności.

Są skuteczne jeżeli jest dostępnych dużo danych, ale nie jest dostępna wiedza na temat ich struktury.

(95)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Wady modeli nieparametrycznych

Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.

Przetwarzanie dużych ilości danych powoduje, że są

wymagające obliczeniowo.

Są podatne na przetrenowanie.

Uzyskane wyniki trudniejsze do zrozumienia.

(96)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Wady modeli nieparametrycznych

Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.

Przetwarzanie dużych ilości danych powoduje, że są

wymagające obliczeniowo.

Są podatne na przetrenowanie.

Uzyskane wyniki trudniejsze do zrozumienia.

(97)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Wady modeli nieparametrycznych

Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.

Przetwarzanie dużych ilości danych powoduje, że są

wymagające obliczeniowo.

Są podatne na przetrenowanie.

Uzyskane wyniki trudniejsze do zrozumienia.

(98)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

Wady modeli nieparametrycznych

Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.

Przetwarzanie dużych ilości danych powoduje, że są

wymagające obliczeniowo.

Są podatne na przetrenowanie.

Uzyskane wyniki trudniejsze do zrozumienia.

(99)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

kNN – k najbliższych sąsiadów

drzewa decyzyjne

SVM – maszyny wektorów wspierających

sieci neuronowe (mają bardzo dużo parametrów)

(100)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

kNN – k najbliższych sąsiadów drzewa decyzyjne

SVM – maszyny wektorów wspierających

sieci neuronowe (mają bardzo dużo parametrów)

(101)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

kNN – k najbliższych sąsiadów drzewa decyzyjne

SVM – maszyny wektorów wspierających

sieci neuronowe (mają bardzo dużo parametrów)

(102)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model?

Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne

Modele

Modele nieparametryczne

kNN – k najbliższych sąsiadów drzewa decyzyjne

SVM – maszyny wektorów wspierających

sieci neuronowe (mają bardzo dużo parametrów)

(103)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Najprostszy przykład modelu nieparametrycznego to algorytm kNN – k Nearest Neighbors.

Zasada: znalezienie określonej liczby próbek bliskich w sensie jakiejś odległości.

Predykcja jest wykonywana na podstawie etykiet tych próbek.

(104)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Jest to uczenie się na podstawie instancji, bez uogólnienia.

kNN nie próbuje on zbudować ogólnego modelu wewnętrznego, ale przechowuje instancje danych treningowych.

Może być wykorzystany do klasyfikacji oraz do regresji.

(105)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Jest to uczenie się na podstawie instancji, bez uogólnienia. kNN nie próbuje on zbudować ogólnego modelu

wewnętrznego, ale przechowuje instancje danych treningowych.

Może być wykorzystany do klasyfikacji oraz do regresji.

(106)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Jest to uczenie się na podstawie instancji, bez uogólnienia. kNN nie próbuje on zbudować ogólnego modelu

wewnętrznego, ale przechowuje instancje danych treningowych.

Może być wykorzystany do klasyfikacji oraz do regresji.

(107)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Naszym wejściem są elementy

(x1, y1), (x2, y2), . . . , (xm, ym)

leżące w Rd× {0, 1}.

Mając normę k · k na R oraz punkt x ∈ Rd, możemy

uporządkować dane

(x(1), y(1)), (x(2), y(2)), . . . , (x(m), y(m))

tak, że

kx(1)− xk ¬ kx(2)− xk ¬ · · · ¬ kx(m)− xk.

(108)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Naszym wejściem są elementy

(x1, y1), (x2, y2), . . . , (xm, ym)

leżące w Rd× {0, 1}.

Mając normę k · k na R oraz punkt x ∈ Rd, możemy

uporządkować dane

(x(1), y(1)), (x(2), y(2)), . . . , (x(m), y(m))

tak, że

kx(1)− xk ¬ kx(2)− xk ¬ · · · ¬ kx(m)− xk.

(109)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Dla danych o wartościach ciągłych wykorzystywana jest typowo

norma Euklidesowa kxk = v u u t d X i =1 x2 i .

Dla danych dyskretnych (np. napisów) wykorzystywana jest

odległość Hamminga ≡ liczba pozycji na których ciągi się różnią.

(110)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Dla danych o wartościach ciągłych wykorzystywana jest typowo

norma Euklidesowa kxk = v u u t d X i =1 x2 i .

Dla danych dyskretnych (np. napisów) wykorzystywana jest

odległość Hamminga ≡ liczba pozycji na których ciągi się różnią.

(111)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Hiperparametry

Algorytm kNN nie wylicza parametrów modelu, ale korzystając z niego musimy określić hiperparametry czyli parametry metody.

Hiperparametr to własność (parametr) metody który jest ustalana przed rozpoczęciem procesu uczenia.

Natomiast parametry modelu są ustalane w trakcie uczenia.

(112)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Hiperparametry

Algorytm kNN nie wylicza parametrów modelu, ale korzystając z niego musimy określić hiperparametry czyli parametry metody.

Hiperparametr to własność (parametr) metody który jest ustalana przed rozpoczęciem procesu uczenia.

Natomiast parametry modelu są ustalane w trakcie uczenia.

(113)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Hiperparametry

Algorytm kNN nie wylicza parametrów modelu, ale korzystając z niego musimy określić hiperparametry czyli parametry metody.

Hiperparametr to własność (parametr) metody który jest ustalana przed rozpoczęciem procesu uczenia.

Natomiast parametry modelu są ustalane w trakcie uczenia.

(114)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Uczenie

Uczenie kNN polega na składowaniu przykładów uczących.

(115)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Predykcja

Predykcja jest dokonywana na podstawie głosowania.

Wybierana jest wartość etykiety, która ma większość spośród k najbliższych sąsiadów.

Możliwe jest zastosowanie wag zależnych od odległości.

(116)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Predykcja

Predykcja jest dokonywana na podstawie głosowania.

Wybierana jest wartość etykiety, która ma większość spośród k najbliższych sąsiadów.

Możliwe jest zastosowanie wag zależnych od odległości.

(117)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Predykcja

Predykcja jest dokonywana na podstawie głosowania.

Wybierana jest wartość etykiety, która ma większość spośród k najbliższych sąsiadów.

Możliwe jest zastosowanie wag zależnych od odległości.

(118)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Klątwa wymiarowości

Wraz ze wzrostem wymiaru danych drastycznie rośnie odległość od najbliższych sąsiadów.

Aby pokryć równomiernie przestrzeń k obserwacjami w każdym

kierunku potrzebujem nk próbek.

(119)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele parametryczne

(120)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Zalety modeli parametrycznych

Budują ogólny model procesu, który chcemy aproksymować.

Szybko się uczą.

Są prostsze i dają wyniki łatwiejsze do zrozumienia. Wymagają znacznie mniej danych niż modele

nieparametryczne.

(121)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Zalety modeli parametrycznych

Budują ogólny model procesu, który chcemy aproksymować.

Szybko się uczą.

Są prostsze i dają wyniki łatwiejsze do zrozumienia. Wymagają znacznie mniej danych niż modele

nieparametryczne.

(122)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Zalety modeli parametrycznych

Budują ogólny model procesu, który chcemy aproksymować.

Szybko się uczą.

Są prostsze i dają wyniki łatwiejsze do zrozumienia.

Wymagają znacznie mniej danych niż modele nieparametryczne.

(123)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Zalety modeli parametrycznych

Budują ogólny model procesu, który chcemy aproksymować.

Szybko się uczą.

Są prostsze i dają wyniki łatwiejsze do zrozumienia. Wymagają znacznie mniej danych niż modele

nieparametryczne.

(124)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Wady modeli parametrycznych

Przyjmują dużo założeń (uproszczeń) dotyczących funkcji F co ogranicza ich elastyczność.

Uczą się odwzorowania na podstawie silnych założeń co do danych i nadają się do prostszych problemów.

W praktyce rzadko udaje się zaprezentować poszukiwaną postać funkcji.

(125)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Wady modeli parametrycznych

Przyjmują dużo założeń (uproszczeń) dotyczących funkcji F co ogranicza ich elastyczność.

Uczą się odwzorowania na podstawie silnych założeń co do danych i nadają się do prostszych problemów.

W praktyce rzadko udaje się zaprezentować poszukiwaną postać funkcji.

(126)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Wady modeli parametrycznych

Przyjmują dużo założeń (uproszczeń) dotyczących funkcji F co ogranicza ich elastyczność.

Uczą się odwzorowania na podstawie silnych założeń co do danych i nadają się do prostszych problemów.

W praktyce rzadko udaje się zaprezentować poszukiwaną postać funkcji.

(127)

Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele

Co to jest model? Modele nieparametryczne

Klasyfikacja na podstawie odległości i klątwa wymiarowości

Modele parametryczne

Modele

Modele parametryczne

Algorytm parametryczny obejmuje dwa etapy:

Wybór postaci funkcji.

Nauczenie się współczynników funkcji na podstawie danych treningowych.

Cytaty

Powiązane dokumenty

Erhan, Bengio, (2010) Why Does Unsupervised Pre-training Help Deep Learning?..

Wprowadzenie Uczenie agenta Podsumowanie Uczenia metodą prób i błędów Zarys modelu Przykład – Frozen-Lake Wprowadzenie Zarys modelu Stan.. Stan s ∈ S jest kompletnym

R´ownanie jest uproszczone, poniewa˙z znamy tylko rozk lady skutk´ow akcji nale˙z acych do ֒ polityki, i nie mo˙zemy oblicza´c najlepszej akcji w ka˙zdym stanie...

a ֒ eksploracji mog loby by´c wykonywanie przypadkowych akcji we wszystkich stanach, z pewnym ustalonym prawdopodobie´nstwem,. a w pozosta lych przypadkach wykonywanie akcji

• Składową błędu dla każdego j-tego połączenia określamy jako pochodną cząstkową błędu względem j-tej wagi. • Składowych tych będziemy mogli użyć do

wicieli Sojuszu Północnoatlantyckiego w dniu 12 września 2001 r. po raz pierwszy odwołano się do klauzuli wzajemnego bezpieczeństwa zawartej w artykule 5. siły powietrzne

Włodzimierz Stawiski Wpływ form organizacyjnych ćwiczeń z technicznych środków nauczania na kształtowanie umiejętności.. manualnych studentów

Hydrothermal alteration of the Meiduk porphyry copper deposit, south of the Kerman Cenozoic magmatic arc and southeast of the central Iranian volcano-plutonic belt has resulted