• Nie Znaleziono Wyników

Uczenie się klasyfikatorów przy zmieniającej się definicji klas.

N/A
N/A
Protected

Academic year: 2021

Share "Uczenie się klasyfikatorów przy zmieniającej się definicji klas."

Copied!
32
0
0

Pełen tekst

(1)

Uczenie się klasyfikatorów przy zmieniającej się definicji klas.

mgr inż. Magdalena Deckert Poznań, 01.06.2010r.

(2)

Plan prezentacji

 Wstęp

 Concept drift

Typy zmian

 Podział algorytmów stosowanych w

uczeniu się ze zmiennych środowisk

 Przykłady algorytmów  Podsumowanie

(3)

Wstęp

 Schemat tworzenia klasyfikatorów Dane

uczące

(4)

Wstęp

4

(5)

Wstęp

 Tradycyjne DBMS – dane przechowywane w

skończonych, trwałych zbiorach danych

 Strumienie danych – ciągłe, uporządkowane,

szybkie, zmieniające się, bardzo duże rozmiary

 Charakterystyka strumieni danych:

 Bardzo duże rozmiary danych, prawdopodobnie

nieskończone

 Szybkie zmiany wymagają szybkiej reakcji

 Wielokrotny dostęp do wszystkich danych jest

bardzo kosztowny – minimalizacja liczby zapamiętanych przykładów uczących

(6)

Wstęp

6

 Trudności w uczeniu ze strumieni

danych:

 Czy zapamiętywać przykłady uczące? ○ Full-instance memory

○ Partial-instance memory

○ No-instance memory

 Kiedy i w jaki sposób douczać? ○ Uczenie przyrostowe (IIL)

(7)

Concept drift - definicja

Concept drift oznacza, że właściwości

klasy decyzyjnej, którą model próbuje przewidzieć, zmieniają się wraz z

upływem czasu w nieprzewidziany sposób.

(8)

Concept drift - zastosowania

8  Monitoring i kontrola  Zindywidualizowane przetwarzanie informacji  Wspomaganie decyzji

(9)

Concept drift - zastosowania

 Monitoring i kontrola

 monitorowanie w celu zapobiegania nieuprawnionym działaniom

○ wykrywanie włamań

○ wykrywanie defraudacji

(10)

Concept drift - zastosowania

10  Zindywidualizowane przetwarzanie informacji  filtrowanie informacji  profile klientów ○ marketing bezpośredni

(11)

Concept drift - zastosowania

 Wspomaganie decyzji

 przewidywanie bankructwa

 zastosowania biomedyczne - leczenie antybiotykami

(12)

Concept drift - zastosowania

12

 AI i robotyka

 concept drift = dynamiczne środowiska  systemy „inteligentnych” domów

(13)

Rodzaje zmian

 nagłe

(14)

Rodzaje zmian

(15)

Rodzaje zmian

 Podczas wykrywania zmian napotkać

(16)

Algorytmy uczenia w zmiennych

środowiskach

(17)

Detektory zmian – triggers

 Dane etykietowane  Trafność klasyfikacji

DDM (ang. Drift Detection Method)

 obliczanie prawdopodobieństwa popełnienia błędu w

momencie nadchodzenia przykładu

 poziom ostrzegawczy oraz poziom zmiany

(18)

Algorytmy przyrostowe

18

 Algorytmy przyrostowe powstały

znacznie wcześniej niż pojęcie concept

drift.

Najbardziej znanym algorytmem

dostosowanym do przetwarzania zmiennych środowisk jest FLORA zaproponowana przez Widmera i Kubata w 1996.

(19)

Algorytmy przyrostowe

 Składowe algorytmu FLORA

 okno czasowe z zapamiętanymi przykładami

uczącymi

 wiedza – nieuporządkowany zbiór reguł  z każdą hipotezą związane są 3 zbiory

(20)

Algorytmy przyrostowe

20

(21)

Algorytmy przyrostowe

 Przykładowe wyniki algorytmu FLORA

(22)

Algorytmy przyrostowe

22

 Rodzaje algorytmu FLORA

 FLORA – stały rozmiar okna czasowego  FLORA2 – dynamiczne dostosowywanie

rozmiaru okna czasowego

 FLORA3 – rozpoznawanie powracających

opisów pojęć

(23)

Inne propozycje

 Hiszpanie zaproponowali przyrostowy algorytm regułowy pamiętający

przykłady graniczne.

 Maloof & Michalski zaproponowali

algorytm AQ11PM – WAH: przyrostowy algorytm AQ połączony z dynamicznym oknem czasowym

(24)

Klasyfikatory złożone

(25)

Klasyfikatory złożone

 Horse Racing

 Jest to grupa klasyfikatorów, w których

poszczególne klasyfikatory bazowe są tworzone z wyprzedzeniem, a dostosowywanie do zmian polega na modyfikacji reguły składania

(26)

Klasyfikatory złożone

26

 Przykładowe wyniki algorytmu DWM dla

(27)

Klasyfikatory złożone

 Replace-the-oldest

 W przypadku wykrycia zmiany najstarszy z klasyfikatorów bazowych jest zastępowany klasyfikatorem zbudowanym na

najnowszych danych.

 Replace-the-looser

 W przypadku wykrycia zmiany każdy z

klasyfikatorów bazowych poddawany jest ponownej ocenie i najsłabszy z nich zostaje

(28)

Algorytmy oparte na selekcji

przykładów uczących

28

 StreamMiner – podejście polegające na systematycznym wyborze starych oraz nowych przykładów uczących

 W celu znalezienie optymalnego rozwiązania rozważane są 4 sytuacje:

 Brak CD i nowe dane są wystarczające  Wykryto CD i nowe dane są wystarczające  Brak CD ale nowe dane nie są wystarczające  Wykryto CD i nowe dane nie są wystarczające

 W przypadku, gdy nowe dane nie są

wystarczające uwzględniane są historyczne przykłady, na których budowany był ostatni klasyfikator.

(29)

MOA – Massive Online Analysis

 Moa – rdzenny ptak z Nowej Zelandii,

niestety już wymarły, podobnie jak Weka jest nielotem

 Środowisko do przetwarzania

olbrzymich zbiorów danych w tym strumieni danych

 Napisane w języku

(30)

Podsumowanie

 Krótkie wprowadzenie do strumieni

danych

Definicja concept drift oraz

zastosowania problemu zmiany definicji klas.

 Podział oraz przykłady algorytmów

uczących się w zmiennych środowiskach.

(31)
(32)

Cytaty

Powiązane dokumenty

ukazały się następujące publikacje z dziedziny literatury romańskiej: Krzysztof Jarosz : Immanence et transtextualité dans l’œuvre romanesque.. de

The objective is then to explore varying input representa- tions and select the one with the best classification accuracy together with the poorest drift detection. To do so, we

• zachęcanie uczniów do poszukiwania własnych strategii rozwiązywania problemu, trak- towanie sposobu rozwiązania zaproponowanego przez nauczyciela lub obecnego w pod- ręczniku

„Tworzenie programów nauczania oraz scenariuszy lekcji i zajęć wchodzących w skład zestawów narzędzi edukacyjnych wspierających proces kształcenia ogólnego w

Zimą zajęcia szkolne odbywały się od godz. próbującą ograniczyć rolę religii. Szkoły te nie rozwinęły jednak szerszej działalności.. uczęszczali na nie

Autor co prawda zastrzega się przeciwko takiemu traktowaniu wsitępu, uważając, że kreśli tu jedynie ramy, któ­ re mają dopomóc czytelnikowi w zaszeregowaniu

Uhonorowano także gościa specjalnego - profesora Krzysztofa Zanussiego, który w roku 2014 obchodził 45-lecie p ra ­ cy artystycznej oraz swoje 75. Spotkanie uśw ietnił

2011.. Excavations have been carried out since 1960 by a joint Polish- -Bulgarian team and the results are regularly published.' There are altogether three Polish