• Nie Znaleziono Wyników

TEORETYCZNE PODSTAWY

N/A
N/A
Protected

Academic year: 2021

Share "TEORETYCZNE PODSTAWY"

Copied!
85
0
0

Pełen tekst

(1)

TEORETYCZNE PODSTAWY INFORMATYKI

WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień

1

27/01/2020

(2)

Wykład 13c

27/01/2020

2

Data Science:

Uczenie maszynowe

Uczenie maszynowe: co to znaczy?

Metody

Regresja

Klasyfikacja

Klastering i wybór podzbioru

System do rekomendacji

Wykład na podstawie materiałów:

E. Fox & C. Guestrin, Univeristy of Waschington,

„Machine Learning Specialization”

http://www.coursera.org./learn/ml-foundations

(3)

Uczenie maszynowe

27/01/2020

3

Metody uczenia maszynowego (machine learning)

rewolucjonizują obecnie podejście do różnych problemów związanych z analizą danych.

Jeszcze kilka lat temu był to bardziej „akademicki” problem z zakresu numeryki i algorytmiki.

(4)

Uczenie maszynowe

27/01/2020

4

Obecnie, bardzo szybko staje się kluczową techniką dla wielu wiodących firm komercyjnych

(5)

Uczenie maszynowe: cel

27/01/2020

5

Uzyskać odpowiedź dla różnej klasy pytań na podstawie informacji zawartej w danych, bez potrzeby budowy „modelu zjawiska”.

ML metod = np. klasyfikacja, regresja liniowa, sieci neuronowe

(6)

Uczenie maszynowe: przykład

27/01/2020

6

Przewidywanie ceny domu na podstawie zebranych danych dotyczących ceny innych

(7)

Uczenie maszynowe: przykład

27/01/2020

7

Ranking restauracji

(8)

Uczenie maszynowe: przykład

27/01/2020

8

Znajdowanie podobnych dokumentów

(9)

Uczenie maszynowe: przykład

27/01/2020

9

Rekomendowanie podobnego produktu

(10)

Uczenie maszynowe: przykład

27/01/2020

10

Rekomendowanie podobnego produktu na podstawie jego charakterystycznych cech

(11)

Uczenie maszynowe: przykład

27/01/2020

11

Rekomendowanie podobnego produktu: na podstawie jego charakterystyki graficznej

(12)

Regresja

27/01/2020

12

Uczenie maszynowe:

Regresja

Przewidywanie odpowiedzi na podstawie informacji wejściowej

(13)

Cena akcji na giełdzie

27/01/2020

13

(14)

Tweet popularność

27/01/2020

14

(15)

Przykład: przewidywana cena domu

27/01/2020

15

(16)

Data, model

27/01/2020

16

(17)

Data, model

27/01/2020

17

Jaki model dla f(x)?

(18)

Przewidywanie

27/01/2020

18

A potem chcielibyśmy przewidzieć odpowiedź

(19)

Pętla iteracyjna?

27/01/2020

19

(20)

Simple linear regression model

27/01/2020

20

Co to znaczy „simple”?

1 input x, fitujemy zależność liniową do danych

(21)

Simple linear regression model

27/01/2020

21

Co to znaczy „simple”?

1 input x, fitujemy zależność liniową do danych

(22)

Pętla iteracyjna

27/01/2020

22

(23)

Funkcja „kosztu”

27/01/2020

23

(24)

Minimalizacja funkcji „kosztu”

27/01/2020

24

(25)

Pętla iteracyjna

27/01/2020

25

(26)

Minimalizacja funkcji „kosztu”

27/01/2020

26

(27)

Asymetryczny błąd kosztu

27/01/2020

27

(28)

Polynomial regression

27/01/2020

28

(29)

Multiple regression

27/01/2020

29

(30)

Regresja: przewidywanie na podstawie danych

27/01/2020

30

(31)

Klasyfikacja

27/01/2020

31

Uczenie maszynowe:

Klasyfikacja

Inteligentny system rankingu restauracji

(32)

Klasyfikacja

27/01/2020

32

Uczenie maszynowe:

Klasyfikacja

Inteligentny system rankingu restauracji

(33)

Prosta klasyfikacja

27/01/2020

33

(34)

Dane trenujące

27/01/2020

34

Używamy danych trenujących aby przypisać

prawdopodobieństwo (wagę) dla każdego słowa

Waga całego zdania (score) to będzie prosta suma tych wag

(35)

Uczenie klasyfikatora

27/01/2020

35

(36)

Jak wygląda nasz model

27/01/2020

36

(37)

Zmiana współczynników

27/01/2020

37

(38)

Jak wygląda nasz model?

27/01/2020

38

(39)

Czy jesteś pewny swojej klasyfikacji

27/01/2020

39

(40)

Interpretacja

27/01/2020

40

(41)

Interpretacja

27/01/2020

41

Link funkcja

(42)

Logistic regression model

27/01/2020

42

Sigmoid funkcja

(43)

Logistic regression model

27/01/2020

43

Effekt współczynników na kształt funkcji sigmoidalnej

(44)

Jak pewny jesteś swojej klasyfikacji

27/01/2020

44

(45)

Zmienne opisowe

27/01/2020

45

Nadajemy numeryczne wartości

(46)

Klasyfikacja: ranking restauracji

27/01/2020

46

(47)

Grupowanie i wybór podobnych

27/01/2020

47

Uczenie maszynowe:

Grupowanie i wyszukiwanie

podobnych obiektów

Poszukiwanie podobnych obiektów

(48)

Wyszukaj podobny tekst

27/01/2020

48

Musimy zdefiniować co to znaczy „podobny”

(49)

Wyszukaj podobny tekst

27/01/2020

49

Musimy zdefiniować co to znaczy „podobny”

(50)

Technika może być stosowana do wielu zagadnień

27/01/2020

50

(51)

„Odkryj” grupę podobnych obiektów

27/01/2020

51

(52)

Pogrupuj wg. tematów dokumenty

27/01/2020

52

(53)

Pogrupuj obrazki

27/01/2020

53

(54)

Zastosowanie: grupowanie obrazków

27/01/2020

54

Single RGB vector per image

(55)

Zastosowanie: grupowanie obrazków

27/01/2020

55

(56)

Zastosowanie: grupowanie zdjęć

27/01/2020

56

(57)

Zastosowanie: grupowanie zdjęć

27/01/2020

57

(58)

Zastosowanie: grupowanie zdjęć

27/01/2020

58

We see that they are grouping!

But not easy to distinguish between groups

(59)

Zastosowanie: grupowanie zdjęć

27/01/2020

59

In this dimmension separable groups!

(60)

Przykład: dokument na podobny temat

27/01/2020

60

Jak mierzymy podobieństwo ?

Jak szukamy podobieństw ?

(61)

Najbliższy sąsiad

27/01/2020

61

(62)

Reprezentacja dokumentu

27/01/2020

62

Dokument = zbiór słów

Nieistotna kolejność występowania

Zliczaj ilość wystąpień i zaznaczaj

(63)

Skalowana Euklidesowa miara odległości

27/01/2020

63

(64)

Cosinusowa miara odległości

27/01/2020

64

(65)

Naturalna miara odległości

27/01/2020

65

(66)

Reprezentacja dokumentów : TF-IDF

27/01/2020

66

Słowa mogą być rzadko występujące, te rzadko występujące są bardziej charakterystyczne.

(67)

Ważymy cechy charakterystyczne

27/01/2020

67

Niektóre cechy są bardziej ważne niż inne

Niektóre różnice (absolutna wartość) są bardziej istotne niż inne.

Liczy się rozmycie całego zbioru dla danej cechy.

(68)

Grupowanie:

27/01/2020

68

(69)

System rekomendujący

27/01/2020

69

Uczenie maszynowe:

system

rekomendujący

Personalizacja

(70)

Rekomendacja: filmy

27/01/2020

70

(71)

Rekomendacja: produkty

27/01/2020

71

(72)

System rekomendujący: popularność

27/01/2020

72

Popularność?

Ranking wg. liczby wyświetlań

Nie ma personalizacji

(73)

System rekomendujący: klasyfikacja

27/01/2020

73

Klasyfikacja?

Jakie prawdopodobieństwo że kupię ten produkt.

Personalizacja: patrzy na historię zakupów, koreluje z porą roku, porą dnia, etc.

(74)

System rekomendujący: korelacje

27/01/2020

74

Patrzy na korelacje. Osoby które kupiły A kupiły również B

Utwórzmy macierz korelacji

(75)

System rekomendujący: korelacje

27/01/2020

75

Patrzy na korelacje. Osoby które kupiły A kupiły również B

Macierz korelacji może należy znormalizować?

A może wprowadzić jakąś miarę „co znaczy podobne”?

Ograniczenie:

Nie patrzy na historię w czasie

Co zrobić z nowym użytkownikiem systemu?

(76)

System rekomendujący: filmy

27/01/2020

76

(77)

System rekomendujący: filmy

27/01/2020

77

(78)

System rekomendujący: filmy

27/01/2020

78

(79)

System rekomendujący: sprawność

27/01/2020

79

(80)

System rekomendujący: sprawność

27/01/2020

80

(81)

System rekomendujący: sprawność

27/01/2020

81

(82)

System rekomendujący: sprawność

27/01/2020

82

(83)

System rekomendujący: sprawność

27/01/2020

83

(84)

System rekomendujący: sprawność

27/01/2020

84

(85)

Rekomendacja produktu:

27/01/2020

85

Cytaty

Powiązane dokumenty

Jak mamy jedną dystrybucję i chcemy próbkować dla drugiej dystrybucji takiej, że funkcja gęstości znajduje się poniżej. To najpierw generujemy x dla pierwszej dystrybucji,

● Eksploracja danych (ang. data mining) odkrywanie niejawnych, wcześniej nieznanych i potencjalnie użytecznych informacji, zależności i związków w zbiorze danych. ●

● W następnych krokach będą łączone te obiekty lub grupy, gdzie średnie niepodobieństwo pomiędzy obiektami jest najmniejsze. ● Klasyczna metoda budowania hierarchii, z

Jak prawdopodobna jest nasza hipoteza przy znanych wartościach danych?.

 Klasyczne miary efektywności i ryzyka dla Twojej inwestycji oraz dla rynku, na którym

W ramach niniejszej pracy prezentujemy nasz autorski algorytm, który pozwala na detekcję zmian w obrazie dna oka oraz wstępne rezultaty, które zostały dzięki niemu

Każdy uczestnik otrzymuje trzy kartki, na których zapisuje odpowiedzi na następujące pytanie: „Oglądam wydarzenia, które dzieją się wokół mnie i zadaję sobie pytania

Wniosek końcowy pracy, do którego autor zdaje się być bardzo przywiązany, i do którego prawie za wszelką cenę stara się przekonać czytelnika, brzmi: