• Nie Znaleziono Wyników

Po poprawnym wczytaniu danych przechodzimy do zakładki „Transform”

N/A
N/A
Protected

Academic year: 2021

Share "Po poprawnym wczytaniu danych przechodzimy do zakładki „Transform”"

Copied!
4
0
0

Pełen tekst

(1)

„Transformacja danych w Rattle”

Zajęcia 18.04.2012

Wczytanie zbioru danych:

http://zsi.tech.us.edu.pl/~nowak/ed/pima.data.txt

Zbiór ten zawiera dane statystyczne dotyczące kobiet pod kątem klasyfikacji czy chorują na cukrzycę czy też nie. Jest to zbiór zawierający 768 elementów.

Po poprawnym wczytaniu danych przechodzimy do zakładki „Transform”.

W ramach transformacji danych można mówić o skalowaniu danych do przedziału 0-1, albo uzupełnianiu braków w danych czy przekodowywaniu danych numerycznych na jakościowe i odwrotnie.

(2)

Normalizacja do przedziale [0..1] wartości atrybutu „cukrzyca”

Krok 1. Dla atrybutu „cukrzyca” dokonamy skalowania [0..1]

Efekt:

(3)

W zakładce Explorer powstaje nam nowy wiersz…

Gdy podglądniemy dane…

(4)

To widzimy, że faktycznie minimalną wartością tej cechy jest 0, a maksymalną 1.

Proszę przeanalizować pozostałe opcje zakładki Transform (zwłaszcza opcję „recode ” oraz „impute” – do czego ona służy ?).

Dla swojego zbioru proszę dla jednej z cech opisujących obiekty zastosować skalowanie, jeśli brakuje pewnych wartości – uzupełnić te brakujące wartości, a dla pewnej cechy zastosować kodowanie.

W formie krótkiego sprawozdania proszę przesłać mailowo do północy w środę 18.04.2012.

Cytaty

Powiązane dokumenty

Geophysical methods have been evaluated through field tests in terms of their ability to detect geological formations of high cutting resistance and hard rock inclusions during

– educational values and values of cultural tradition, where can be included the developing of the value for science – veracity, scientism, professional letters,

Można też rozwiązywać jedno jeszcze zadanie jako dodatkowe (wynik będzie wliczony do punk- tów uzyskanych za aktywność).. W rozwiązaniach proszę jawnie wskazywać na

Stosunkowo nowym modelem wartości dla klienta, który nie był jeszcze analizowany z perspektywy metod rachunkowości zarządczej, jest model oparty na pomiarze udziału w portfelu

One  more  certain  trace  of  the  relationship  between  Słonimski  and  Morska can be found in Dzienniki (Diaries) by Anna Iwaszkiewicz. The  record  of 

Jerzy Witczak zrelacjonował kontakty jakie miały miejsce w ostatnich miesiącach pomiędzy Federacją FIDES a Biblioteką Narodową i Krajową Radą Biblioteczną oraz

Przy założeniu, że długości rozmów mają rozkład normalny, wyznacz przedział ufności dla średniej długości rozmowy na poziomie ufności

Zakładając, że droga hamowania ma rozkład normalny, zbadaj, czy liczba prób jest wystarczająca do znalezienia 90% przedziału ufności dla wartości przeciętnej o długości