• Nie Znaleziono Wyników

Projekt 4 Super k-NN

N/A
N/A
Protected

Academic year: 2021

Share "Projekt 4 Super k-NN"

Copied!
1
0
0

Pełen tekst

(1)

Projekt 4 Super k-NN

1. Zbiór danych: TNG, ok 18000 próbek, 20 klas. Zbiór danych MNIST (70000 próbek 10 klas). Odnośnie TNG wykorzystujemy gotowe dane reprezentujące tekst blogów w postaci wektorów (dostarcza prowadzący). Dane dekorelujemy wykorzystując transformatę PCA.

2. Celem projektu jest stworzenie zupełnie nowego zespołowego klasyfikatora k- NN i porównania jego jakości, czasów jego uczenia i odpowiedzi ze

standardowym klasyfikatorem SVM.

3. Z jednego zbioru danych tworzymy kilka sub-zestawów danych (>=5 <=10) na różnych zestawach cech (maski mogą być losowane w sposób random, ale nie powinny być gęste). Maski mogą mieć różną długość.

Prawdopodobieństwo wystąpienia cechy w zestawie może być proporcjonalne do jej istotności (np. mierzonej wielkością wartości własnych po transformacie PCA). Jednak nie może być takiej cechy, która nie dostała się do żadnego zestawu.

4. Liczymy średnią przynależność każdej próbki do danej klasy na bazie klasyfikatora k-NN dla każdego sub-zestawu danych. Dokonujemy fuzji wyników klasyfikacji (jakiej?) dla każdej próbki po sub-zestawach danych.

5. Jak zmieni się jakość klasyfikatora w zależności od k.

6. Wyniki jakości klasyfikatorów oceniać na bazie krzyżowej-walidacji, (accuracy - Loss-błąd, Krzywa ROC, Precision-Recall, (pola pod krzywymi) F1).

7. Należy sporządzić raport z projektu.

W nawiasie ocena maksymalna.

Cytaty

Powiązane dokumenty

Mimo że być może wydaje się to niektórym czy- telnikom nudne i dziwne, że wciąż o tym piszę – podjęto uchwały, które są jednocześnie zwykłe dla członków rady, ale

Licencje Creative Commons (tak jak inne licencje typu Open Content), mogą być skutecznie wykorzystywane jako narzędzie Open Access. Co więcej, wykorzystanie otwartych

w przypadku pola Czas trwania (typu Data/Godzina) koniecznie trzeba wybrad format danych, gdyż w tym polu należy przechowywad tylko czas; stałe czasowe w regule

Należy uznać za poprawne wszystkie wyniki, które są konsekwencją przyjętych przez zdającego poprawnych zaokrągleń... czerwona

W równaniach reakcji, w których ustala się stan równowagi, brak „ ⇄” nie powoduje utraty punktów.. Elementy odpowiedzi umieszczone w nawiasach nie

Należy uznać za poprawne wszyst- kie wyniki, które są konsekwencją przyjętych przez zdającego po- prawnych zaokrągleń1. 1

katoda – stal lub gwóźdź stalowy. - Za napisanie wzoru trans-alkenu: Uznaje się każdy poprawny wzór, który przedstawia izomer trans. Jeśli zdający zapisze równanie reakcji

[r]