Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Podstawy uczenia maszynowego
Wykład 02 – Zadania, modele i daneJarosław Miszczak
10/03/2021
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
1 Warianty uczenia maszynowego
2 Ograniczenia uczenia maszynowego 3 Modele
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele Co to jest maszyna? ?... ?... ?... 3 / 57
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Przykład automatyzacji uczenia
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Przykład automatyzacji uczenia
przykład
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Przykład automatyzacji uczenia
przykład
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Przykład automatyzacji uczenia
przykład
etykieta
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Przykład automatyzacji uczenia
Zbiór treningowy
przykład
etykieta
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Wejściem jest zbiór uczący lub zbiór treningowy czyli zbiór opisanych przykładów
D = {(x(i ), y(i ))}Ni =1.
Celem jest określenie funkcji opisującej zależności między obiektami a etykietami
x(i ) 7→ y(i ).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Wejściem jest zbiór uczący lub zbiór treningowy czyli zbiór opisanych przykładów
D = {(x(i ), y(i ))}Ni =1.
Celem jest określenie funkcji opisującej zależności między obiektami a etykietami
x(i ) 7→ y(i ).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane Zbiór testowy ? ? ? ? ? ? 7 / 57
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Elementy składowe xi to cechy (ang. features).
Cechy to atrybuty (ang. attributes) wraz z wartościami.
W najprostszym przypadku xi to d -wymiarowe wektory.
Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Elementy składowe xi to cechy (ang. features).
Cechy to atrybuty (ang. attributes) wraz z wartościami.
W najprostszym przypadku xi to d -wymiarowe wektory.
Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Elementy składowe xi to cechy (ang. features).
Cechy to atrybuty (ang. attributes) wraz z wartościami.
W najprostszym przypadku xi to d -wymiarowe wektory.
Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Elementy składowe xi to cechy (ang. features).
Cechy to atrybuty (ang. attributes) wraz z wartościami.
W najprostszym przypadku xi to d -wymiarowe wektory.
Często są to obiekty takie jak obrazy (2D, 3D, RGB, hiperspektralne), teksty bądź grafy.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
W zależności o przeciwdziedziny funkcji nasze zadanie to
klasyfikacja bądź regresja.
W przypadku klasyfikacji zakładamy, że yi należy do zbioru
skończonego (dyskretnego).
Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.
Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy
regresją.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
W zależności o przeciwdziedziny funkcji nasze zadanie to
klasyfikacja bądź regresja.
W przypadku klasyfikacji zakładamy, że yi należy do zbioru
skończonego (dyskretnego).
Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.
Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy
regresją.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
W zależności o przeciwdziedziny funkcji nasze zadanie to
klasyfikacja bądź regresja.
W przypadku klasyfikacji zakładamy, że yi należy do zbioru
skończonego (dyskretnego).
Tego typu zmienną nazywamy kategoryczną.
Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.
Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy
regresją.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
W zależności o przeciwdziedziny funkcji nasze zadanie to
klasyfikacja bądź regresja.
W przypadku klasyfikacji zakładamy, że yi należy do zbioru
skończonego (dyskretnego).
Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.
Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy
regresją.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
W zależności o przeciwdziedziny funkcji nasze zadanie to
klasyfikacja bądź regresja.
W przypadku klasyfikacji zakładamy, że yi należy do zbioru
skończonego (dyskretnego).
Tego typu zmienną nazywamy kategoryczną. Jeżeli etykiety yi są dwie, to klasyfikacja jest binarna.
Jeżeli dopuszczamy yi ∈ R, to problem taki nazywamy
regresją.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Nasz algorytm może dawać różne wyniki określające
prawdopodobieństwo przynależności do klasy.
Odpowiedź systemu to ta klasa, dla której prawdopodobieństwo jest największe
arg maxc∈Cp(y = c|x , D)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia
Uczenie nadzorowane
Uczenie nienadzorowanie Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nadzorowane
Nasz algorytm może dawać różne wyniki określające
prawdopodobieństwo przynależności do klasy.
Odpowiedź systemu to ta klasa, dla której prawdopodobieństwo jest największe
arg maxc∈Cp(y = c|x , D)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
W uczeniu nienadzorowanym nie mamy do dyspozycji informacji o etykietach.
Do dyspozycji mamy jedynie dane wejściowe {xi}.
Jest to scenariusz podobny do tego z jakim spotykamy się przy uczeniu się człowieka.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
W uczeniu nienadzorowanym nie mamy do dyspozycji informacji o etykietach.
Do dyspozycji mamy jedynie dane wejściowe {xi}.
Jest to scenariusz podobny do tego z jakim spotykamy się przy uczeniu się człowieka.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
W uczeniu nienadzorowanym nie mamy do dyspozycji informacji o etykietach.
Do dyspozycji mamy jedynie dane wejściowe {xi}.
Jest to scenariusz podobny do tego z jakim spotykamy się przy uczeniu się człowieka.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
Podstawowym zadaniem uczenia nienadzorowanego jest
klasteryzacja, czyli odkrycie struktury danych wejściowych.
Kolejnym zadaniem jest asocjacja, gdzie chcemy określić
reguły opisujące nasze dane.
Uczeniem bez nadzoru jest również detekcja anomalii. Do tej grupy zalicza się również metody związane z redukcją
wymiarowości
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
Podstawowym zadaniem uczenia nienadzorowanego jest
klasteryzacja, czyli odkrycie struktury danych wejściowych.
Kolejnym zadaniem jest asocjacja, gdzie chcemy określić
reguły opisujące nasze dane.
Uczeniem bez nadzoru jest również detekcja anomalii. Do tej grupy zalicza się również metody związane z redukcją
wymiarowości
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
Podstawowym zadaniem uczenia nienadzorowanego jest
klasteryzacja, czyli odkrycie struktury danych wejściowych.
Kolejnym zadaniem jest asocjacja, gdzie chcemy określić
reguły opisujące nasze dane.
Uczeniem bez nadzoru jest również detekcja anomalii.
Do tej grupy zalicza się również metody związane z redukcją
wymiarowości
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane
Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie nienadzorowanie
Podstawowym zadaniem uczenia nienadzorowanego jest
klasteryzacja, czyli odkrycie struktury danych wejściowych.
Kolejnym zadaniem jest asocjacja, gdzie chcemy określić
reguły opisujące nasze dane.
Uczeniem bez nadzoru jest również detekcja anomalii. Do tej grupy zalicza się również metody związane z redukcją
wymiarowości
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie
Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie częściowo nadzorowanie
Jeżeli część naszych danych jest poetykietowana (czyli trudna do uzyskania), ale znaczna część nie zawiera informacji o etykietach to mówimy o uczeniu częściowo nadzorowanym.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Osobną grupą metod stanowi uczenie ze wzmocnieniem.
W tym schemacie agent otrzymuje nagrodę na podstawie wykonanych akcji.
Cel
Wypracowanie reguł postępowania które mają doprowadzić do rozwiązania problemu.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Osobną grupą metod stanowi uczenie ze wzmocnieniem. W tym schemacie agent otrzymuje nagrodę na podstawie wykonanych akcji.
Cel
Wypracowanie reguł postępowania które mają doprowadzić do rozwiązania problemu.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Osobną grupą metod stanowi uczenie ze wzmocnieniem. W tym schemacie agent otrzymuje nagrodę na podstawie wykonanych akcji.
Cel
Wypracowanie reguł postępowania które mają doprowadzić do rozwiązania problemu.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent
A
kc
j
e Interpretacja Nagroda StanŹródło: Reinforcement learning w Wikipedii
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent
A
kc
j
e Interpretacja Nagroda StanŹródło: Reinforcement learning w Wikipedii
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent
A
kc
j
e Interpretacja Nagroda StanŹródło: Reinforcement learning w Wikipedii
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent
A
kc
j
e Interpretacja Nagroda StanŹródło: Reinforcement learning w Wikipedii
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Agent wykonuje akcje ma podstawie stanu. Środowisko interpretuje akcje. Agent otrzymuje nagrodę. Na podstawie nagrody agent ma wypracować politykę. Środowisko Agent
A
kc
j
e Interpretacja Nagroda StanŹródło: Reinforcement learning w Wikipedii
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Ogólny schemat modelowania procesu uczenia się na podstawie zdobywanego doświadczenia.
Stosowany z powodzeniem do gier (komputerowych), w tym do Go.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przykład automatyzacji uczenia Uczenie nadzorowane Uczenie nienadzorowanie Uczenie częściowo nadzorowanie
Uczenie ze wzmacnianiem
Warianty uczenia maszynowego
Uczenie ze wzmacnianiem
Ogólny schemat modelowania procesu uczenia się na podstawie zdobywanego doświadczenia.
Stosowany z powodzeniem do gier (komputerowych), w tym do Go.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Przetrenowanie
Przetrenowanie
System nie powinien dopasowywać się idealnie do danych na których jest uczony.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Przetrenowanie 0 1 2 3 4 5 0 2 4 6 8
Dane wygenerowane jako x + U(−0.25, 0.25). Funkcja postaci x 7→ 10 X i =1 aixi
dopasowuje się idealnie.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Przetrenowanie 0 1 2 3 4 5 0 2 4 6 8
Dane wygenerowane jako x + U(−0.25, 0.25). Funkcja postaci
x 7→ ax
dopasowuje się do nich z pewnym błędem.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
W tym przypadku pierwsze dopasowanie jest za dobre. Przewidywanie wartości naszej funkcji za pomocą takiego dopasowanie da niepożądane wyniki.
Pierwsze dopasowanie ma dużą wariancję i dlatego jest podatne na przetrenowanie (ang. overfitting).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
W tym przypadku pierwsze dopasowanie jest za dobre. Przewidywanie wartości naszej funkcji za pomocą takiego dopasowanie da niepożądane wyniki.
Pierwsze dopasowanie ma dużą wariancję i dlatego jest podatne na przetrenowanie (ang. overfitting).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Co jest najważniejszym elementem uczenia się? ?...
?... ?...
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego
nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias) nadmierna wrażliwość ≡ wysoka wariancja (ang. variance) Kompromis między obciążeniem a wariancją to jeden z
podstawowych problemów uczenia maszynowego (i statystyki).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego
nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias)
nadmierna wrażliwość ≡ wysoka wariancja (ang. variance) Kompromis między obciążeniem a wariancją to jeden z
podstawowych problemów uczenia maszynowego (i statystyki).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego
nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias) nadmierna wrażliwość ≡ wysoka wariancja (ang. variance)
Kompromis między obciążeniem a wariancją to jeden z
podstawowych problemów uczenia maszynowego (i statystyki).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Do wysokiego błędu modelu poza próbą treningową może prowadzić zarówno jego
nadmierne uproszczenie ≡ wysokie obciążenie (ang. bias) nadmierna wrażliwość ≡ wysoka wariancja (ang. variance) Kompromis między obciążeniem a wariancją to jeden z
podstawowych problemów uczenia maszynowego (i statystyki).
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Sposoby radzenia sobie z tym dylematem między obciążeniem a wariancją to
regularyzacja – wzbogacanie algorytmu uczenia dodatkowe warunki (7→ regresja)
łączenie klasyfikatorów – zespół słabych klasyfikatorów daje dobry klasyfikator (7→ lasy losowe)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Sposoby radzenia sobie z tym dylematem między obciążeniem a wariancją to
regularyzacja – wzbogacanie algorytmu uczenia dodatkowe warunki (7→ regresja)
łączenie klasyfikatorów – zespół słabych klasyfikatorów daje dobry klasyfikator (7→ lasy losowe)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie
Obciążenie vs wariancja
Niedoskonałości danych Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Obciążenie vs wariancja
Sposoby radzenia sobie z tym dylematem między obciążeniem a wariancją to
regularyzacja – wzbogacanie algorytmu uczenia dodatkowe warunki (7→ regresja)
łączenie klasyfikatorów – zespół słabych klasyfikatorów daje dobry klasyfikator (7→ lasy losowe)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Brak danych
Większość metod uczenia maszynowego potrzebuje dużej ilości danych.
Dla prostych problemów potrzebne są tysiące próbek/przykładów.
Dla wielu problemów dotyczących przetwarzania obrazów bądź mowy potrzebnych są miliony próbek/przykładów.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Brak danych
Większość metod uczenia maszynowego potrzebuje dużej ilości danych.
Dla prostych problemów potrzebne są tysiące próbek/przykładów.
Dla wielu problemów dotyczących przetwarzania obrazów bądź mowy potrzebnych są miliony próbek/przykładów.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Brak danych
Większość metod uczenia maszynowego potrzebuje dużej ilości danych.
Dla prostych problemów potrzebne są tysiące próbek/przykładów.
Dla wielu problemów dotyczących przetwarzania obrazów bądź mowy potrzebnych są miliony próbek/przykładów.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Problemy wynikające z:
błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),
wprowadzenia danych niekompletnych,
wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Problemy wynikające z:
błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),
wprowadzenia danych niekompletnych,
wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Problemy wynikające z:
błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),
wprowadzenia danych niekompletnych,
wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Problemy wynikające z:
błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),
wprowadzenia danych niekompletnych,
wprowadzenia danych (częściowo) sprzecznych,
niezdefiniowania ograniczeń dziedzinowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja
Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Niedoskonałości danych
Problemy wynikające z:
błędnych danych (7→ poprzedni przykład z zaburzeniem losowym),
wprowadzenia danych niekompletnych,
wprowadzenia danych (częściowo) sprzecznych, niezdefiniowania ograniczeń dziedzinowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Zasada odpłatności za obiady
Twierdzenie (No Free Lunch Theorem)
Nie istnieje metoda uniwersalnie dobra do każdego problemu.
Konieczne są różne modele dla różnych rodzajów danych. Dla każdego modelu możemy wybrać różne metody trenowania.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Zasada odpłatności za obiady
Twierdzenie (No Free Lunch Theorem)
Nie istnieje metoda uniwersalnie dobra do każdego problemu. Konieczne są różne modele dla różnych rodzajów danych.
Dla każdego modelu możemy wybrać różne metody trenowania.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Przetrenowanie Obciążenie vs wariancja Niedoskonałości danych
Zasada odpłatności za obiady
Ograniczenia uczenia maszynowego
Zasada odpłatności za obiady
Twierdzenie (No Free Lunch Theorem)
Nie istnieje metoda uniwersalnie dobra do każdego problemu. Konieczne są różne modele dla różnych rodzajów danych. Dla każdego modelu możemy wybrać różne metody trenowania.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Modele to uproszczona reprezentacja rzeczywistości.
Modele sa tworzone na podstawie obserwacji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Modele to uproszczona reprezentacja rzeczywistości. Modele sa tworzone na podstawie obserwacji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Uproszczenie
Model to uproszczona reprezentacja rzeczywistości.
Model nie oddaje w pełni rzeczywistości. Model jest tworzony na podstawie obserwacji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Uproszczenie
Model to uproszczona reprezentacja rzeczywistości. Model nie oddaje w pełni rzeczywistości.
Model jest tworzony na podstawie obserwacji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Uproszczenie
Model to uproszczona reprezentacja rzeczywistości. Model nie oddaje w pełni rzeczywistości. Model jest tworzony na podstawie obserwacji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Jaka dziedzina wiedzy zajmuje się modelowaniem rzeczywistości? ?...
?... ?...
rzeczywistości?
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Jaka dziedzina wiedzy zajmuje się modelowaniem rzeczywistości? ?...
?...
?... rzeczywistości?
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λtRównanie Schor¨odingera
H|v i = i ~dtd|v i
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λtRównanie Schor¨odingera
H|v i = i ~dtd|v i
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λtRównanie Schor¨odingera
H|v i = i ~dtd|v i
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model? Fizyka ≡ natura. Równania ruchu x (t) = x0+ vt Prawo rozpadu m(t) = m0e−λtRównanie Schor¨odingera
H|v i = i ~dtd|v i
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Obserwacje
Model jest tworzony na podstawie obserwacji.
Model jest jest tak dobry jak dobre są dane które służą do jego stworzenia.
Obowiązuje zasada GIGO – Garbage In, Garbage Out.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Obserwacje
Model jest tworzony na podstawie obserwacji.
Model jest jest tak dobry jak dobre są dane które służą do jego stworzenia.
Obowiązuje zasada GIGO – Garbage In, Garbage Out.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Obserwacje
Model jest tworzony na podstawie obserwacji.
Model jest jest tak dobry jak dobre są dane które służą do jego stworzenia.
Obowiązuje zasada GIGO – Garbage In, Garbage Out.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Model vs. rzeczywistość
Models are to be used, not believed. – Henri Theil, Principles of Econometrics,
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Nadzorowane uczenie maszynowe można podsumować jako
zgadywanie funkcji F , która mapuje zmienne wejściowe X na
wyjściowe Y ,
F (X ) 7→ Y .
Forma funkcji F jest nieznana.
Algorytm UM buduje funkcję ˆF (czyli przybliżenie funkcji F ) na podstawie danych treningowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Nadzorowane uczenie maszynowe można podsumować jako
zgadywanie funkcji F , która mapuje zmienne wejściowe X na
wyjściowe Y ,
F (X ) 7→ Y . Forma funkcji F jest nieznana.
Algorytm UM buduje funkcję ˆF (czyli przybliżenie funkcji F ) na podstawie danych treningowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Nadzorowane uczenie maszynowe można podsumować jako
zgadywanie funkcji F , która mapuje zmienne wejściowe X na
wyjściowe Y ,
F (X ) 7→ Y . Forma funkcji F jest nieznana.
Algorytm UM buduje funkcję ˆF (czyli przybliżenie funkcji F ) na podstawie danych treningowych.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Zadaniem UM jest ocena różnych algorytmów i sprawdzenie, który z nich jest lepszy w przybliżaniu F .
Różne algorytmy przyjmują różne założenia dotyczące: formy funkcji,
sposobu jej uczenia się.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Zadaniem UM jest ocena różnych algorytmów i sprawdzenie, który z nich jest lepszy w przybliżaniu F .
Różne algorytmy przyjmują różne założenia dotyczące: formy funkcji,
sposobu jej uczenia się.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Co to jest model?
Klasyfikacja vs regresja
Jeżeli F ma wartości z zadanego, dyskretnego zbioru wartości, to funkcja dokonuje klasyfikacji.
Jeżeli F ma wartości ze zbioru ciągłego, to funkcja dokonuje regresji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne i parametryczne
Podstawowym podziałem modeli w UM jest podział na modele parametryczne,
modele nieparametryczne.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne i parametryczne
Parametryczne algorytmy uczenia maszynowego upraszczają mapowanie do znanej funkcji.
Algorytmy nieparametryczne mogą nauczyć się dowolnego
mapowania od wejść do wyjść.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele nieparametryczne
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Zalety modeli nieparametrycznych
Modele nieparametryczne nie przyjmują założeń dotyczących formy funkcji F .
Budują odwzorowanie na podstawie danych treningowych co pozwala im na dostosowanie się do skomplikowanych
zależności.
Są skuteczne jeżeli jest dostępnych dużo danych, ale nie jest dostępna wiedza na temat ich struktury.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Zalety modeli nieparametrycznych
Modele nieparametryczne nie przyjmują założeń dotyczących formy funkcji F .
Budują odwzorowanie na podstawie danych treningowych co pozwala im na dostosowanie się do skomplikowanych
zależności.
Są skuteczne jeżeli jest dostępnych dużo danych, ale nie jest dostępna wiedza na temat ich struktury.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Zalety modeli nieparametrycznych
Modele nieparametryczne nie przyjmują założeń dotyczących formy funkcji F .
Budują odwzorowanie na podstawie danych treningowych co pozwala im na dostosowanie się do skomplikowanych
zależności.
Są skuteczne jeżeli jest dostępnych dużo danych, ale nie jest dostępna wiedza na temat ich struktury.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Wady modeli nieparametrycznych
Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.
Przetwarzanie dużych ilości danych powoduje, że są
wymagające obliczeniowo.
Są podatne na przetrenowanie.
Uzyskane wyniki trudniejsze do zrozumienia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Wady modeli nieparametrycznych
Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.
Przetwarzanie dużych ilości danych powoduje, że są
wymagające obliczeniowo.
Są podatne na przetrenowanie.
Uzyskane wyniki trudniejsze do zrozumienia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Wady modeli nieparametrycznych
Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.
Przetwarzanie dużych ilości danych powoduje, że są
wymagające obliczeniowo.
Są podatne na przetrenowanie.
Uzyskane wyniki trudniejsze do zrozumienia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
Wady modeli nieparametrycznych
Wymagają dużo danych treningowych aby uzyskania zadowalających rezultatów.
Przetwarzanie dużych ilości danych powoduje, że są
wymagające obliczeniowo.
Są podatne na przetrenowanie.
Uzyskane wyniki trudniejsze do zrozumienia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
kNN – k najbliższych sąsiadów
drzewa decyzyjne
SVM – maszyny wektorów wspierających
sieci neuronowe (mają bardzo dużo parametrów)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
kNN – k najbliższych sąsiadów drzewa decyzyjne
SVM – maszyny wektorów wspierających
sieci neuronowe (mają bardzo dużo parametrów)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
kNN – k najbliższych sąsiadów drzewa decyzyjne
SVM – maszyny wektorów wspierających
sieci neuronowe (mają bardzo dużo parametrów)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model?
Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości Modele parametryczne
Modele
Modele nieparametryczne
kNN – k najbliższych sąsiadów drzewa decyzyjne
SVM – maszyny wektorów wspierających
sieci neuronowe (mają bardzo dużo parametrów)
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Najprostszy przykład modelu nieparametrycznego to algorytm kNN – k Nearest Neighbors.
Zasada: znalezienie określonej liczby próbek bliskich w sensie jakiejś odległości.
Predykcja jest wykonywana na podstawie etykiet tych próbek.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Jest to uczenie się na podstawie instancji, bez uogólnienia.
kNN nie próbuje on zbudować ogólnego modelu wewnętrznego, ale przechowuje instancje danych treningowych.
Może być wykorzystany do klasyfikacji oraz do regresji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Jest to uczenie się na podstawie instancji, bez uogólnienia. kNN nie próbuje on zbudować ogólnego modelu
wewnętrznego, ale przechowuje instancje danych treningowych.
Może być wykorzystany do klasyfikacji oraz do regresji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Jest to uczenie się na podstawie instancji, bez uogólnienia. kNN nie próbuje on zbudować ogólnego modelu
wewnętrznego, ale przechowuje instancje danych treningowych.
Może być wykorzystany do klasyfikacji oraz do regresji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Naszym wejściem są elementy
(x1, y1), (x2, y2), . . . , (xm, ym)
leżące w Rd× {0, 1}.
Mając normę k · k na R oraz punkt x ∈ Rd, możemy
uporządkować dane
(x(1), y(1)), (x(2), y(2)), . . . , (x(m), y(m))
tak, że
kx(1)− xk ¬ kx(2)− xk ¬ · · · ¬ kx(m)− xk.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Naszym wejściem są elementy
(x1, y1), (x2, y2), . . . , (xm, ym)
leżące w Rd× {0, 1}.
Mając normę k · k na R oraz punkt x ∈ Rd, możemy
uporządkować dane
(x(1), y(1)), (x(2), y(2)), . . . , (x(m), y(m))
tak, że
kx(1)− xk ¬ kx(2)− xk ¬ · · · ¬ kx(m)− xk.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Dla danych o wartościach ciągłych wykorzystywana jest typowo
norma Euklidesowa kxk = v u u t d X i =1 x2 i .
Dla danych dyskretnych (np. napisów) wykorzystywana jest
odległość Hamminga ≡ liczba pozycji na których ciągi się różnią.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Dla danych o wartościach ciągłych wykorzystywana jest typowo
norma Euklidesowa kxk = v u u t d X i =1 x2 i .
Dla danych dyskretnych (np. napisów) wykorzystywana jest
odległość Hamminga ≡ liczba pozycji na których ciągi się różnią.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Hiperparametry
Algorytm kNN nie wylicza parametrów modelu, ale korzystając z niego musimy określić hiperparametry czyli parametry metody.
Hiperparametr to własność (parametr) metody który jest ustalana przed rozpoczęciem procesu uczenia.
Natomiast parametry modelu są ustalane w trakcie uczenia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Hiperparametry
Algorytm kNN nie wylicza parametrów modelu, ale korzystając z niego musimy określić hiperparametry czyli parametry metody.
Hiperparametr to własność (parametr) metody który jest ustalana przed rozpoczęciem procesu uczenia.
Natomiast parametry modelu są ustalane w trakcie uczenia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Hiperparametry
Algorytm kNN nie wylicza parametrów modelu, ale korzystając z niego musimy określić hiperparametry czyli parametry metody.
Hiperparametr to własność (parametr) metody który jest ustalana przed rozpoczęciem procesu uczenia.
Natomiast parametry modelu są ustalane w trakcie uczenia.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Uczenie
Uczenie kNN polega na składowaniu przykładów uczących.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Predykcja
Predykcja jest dokonywana na podstawie głosowania.
Wybierana jest wartość etykiety, która ma większość spośród k najbliższych sąsiadów.
Możliwe jest zastosowanie wag zależnych od odległości.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Predykcja
Predykcja jest dokonywana na podstawie głosowania.
Wybierana jest wartość etykiety, która ma większość spośród k najbliższych sąsiadów.
Możliwe jest zastosowanie wag zależnych od odległości.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Predykcja
Predykcja jest dokonywana na podstawie głosowania.
Wybierana jest wartość etykiety, która ma większość spośród k najbliższych sąsiadów.
Możliwe jest zastosowanie wag zależnych od odległości.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Klątwa wymiarowości
Wraz ze wzrostem wymiaru danych drastycznie rośnie odległość od najbliższych sąsiadów.
Aby pokryć równomiernie przestrzeń k obserwacjami w każdym
kierunku potrzebujem nk próbek.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele parametryczne
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Zalety modeli parametrycznych
Budują ogólny model procesu, który chcemy aproksymować.
Szybko się uczą.
Są prostsze i dają wyniki łatwiejsze do zrozumienia. Wymagają znacznie mniej danych niż modele
nieparametryczne.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Zalety modeli parametrycznych
Budują ogólny model procesu, który chcemy aproksymować.
Szybko się uczą.
Są prostsze i dają wyniki łatwiejsze do zrozumienia. Wymagają znacznie mniej danych niż modele
nieparametryczne.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Zalety modeli parametrycznych
Budują ogólny model procesu, który chcemy aproksymować.
Szybko się uczą.
Są prostsze i dają wyniki łatwiejsze do zrozumienia.
Wymagają znacznie mniej danych niż modele nieparametryczne.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Zalety modeli parametrycznych
Budują ogólny model procesu, który chcemy aproksymować.
Szybko się uczą.
Są prostsze i dają wyniki łatwiejsze do zrozumienia. Wymagają znacznie mniej danych niż modele
nieparametryczne.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Wady modeli parametrycznych
Przyjmują dużo założeń (uproszczeń) dotyczących funkcji F co ogranicza ich elastyczność.
Uczą się odwzorowania na podstawie silnych założeń co do danych i nadają się do prostszych problemów.
W praktyce rzadko udaje się zaprezentować poszukiwaną postać funkcji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Wady modeli parametrycznych
Przyjmują dużo założeń (uproszczeń) dotyczących funkcji F co ogranicza ich elastyczność.
Uczą się odwzorowania na podstawie silnych założeń co do danych i nadają się do prostszych problemów.
W praktyce rzadko udaje się zaprezentować poszukiwaną postać funkcji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Wady modeli parametrycznych
Przyjmują dużo założeń (uproszczeń) dotyczących funkcji F co ogranicza ich elastyczność.
Uczą się odwzorowania na podstawie silnych założeń co do danych i nadają się do prostszych problemów.
W praktyce rzadko udaje się zaprezentować poszukiwaną postać funkcji.
Warianty uczenia maszynowego Ograniczenia uczenia maszynowego Modele
Co to jest model? Modele nieparametryczne
Klasyfikacja na podstawie odległości i klątwa wymiarowości
Modele parametryczne
Modele
Modele parametryczne
Algorytm parametryczny obejmuje dwa etapy:
Wybór postaci funkcji.
Nauczenie się współczynników funkcji na podstawie danych treningowych.