- wykład I Statystyka

(1)

Statystyka - wykład I

Pomoce do samodzielnej pracy

(2)

ANALIZA DANYCH

Kolejno zbierane informacje:

Uporządkowany ciąg danych:

𝑋₁, 𝑋₂, … , 𝑋_𝑛

𝑋_1:𝑛 ≤ 𝑋_2:𝑛 ≤ ⋯ ≤ 𝑋_𝑛:𝑛

(3)

MIERNIKI POŁOŻENIA

grupa charakterystyk opisująca poziom obserwowanej cechy

 średnia

 mediana

 dolny kwartyl

 górny kwartyl

 dominanta

(4)

ŚREDNIA

liczba charakteryzująca „środek ciężkości”

danych

ҧ

𝑥 = 1

𝑛 ෍

𝑖=1 𝑛

𝑋_𝑖

(5)

MEDIANA

„geometryczny środek” danych

𝑀𝑒 = 𝑋 _{𝑛/2 :𝑛}

(6)

DOLNY KWARTYL

rozdziela dane w proporcji 1 : 3, tzn. poniżej dolnego kwartyla znajduje się czwarta część danych, zaś powyżej reszta

𝑄₁ = 𝑋 _{𝑛/4 :𝑛}

(7)

GÓRNY KWARTYL

rozdziela dane w proporcji 3 : 1

𝑄₃ = 𝑋 _{3𝑛/4 :𝑛}

(8)

DOMINANTA

najczęściej występującą wartość

(9)

MIERNIKI ROZPROSZENIA

grupa charakterystyk opisująca zróżnicowanie cechy

 wariancja

 odchylenie standardowe

 współczynnik zmienności

 odchylenie przeciętne

 rozstęp

 odchylenie ćwiartkowe

(10)

WARIANCJA

charakteryzuje rozrzut danych wokół ich

„środka ciężkości”

𝑆² = 1

𝑛 ෍

𝑖=1 𝑛

𝑋_𝑖 − ҧ𝑥 ²

(11)

ODCHYLENIE STANDARDOWE

pierwiastek z wariancji

Zaletą odchylenia standardowego jest to, że wyrażone jest ono w tych samych jednostkach co oryginalne

dane (jednostką wariacji jest kwadrat jednostek pomiarowych.

(12)

WSPÓŁCZYNNIK ZMIENNOŚCI

względne zróżnicowanie danych, tzn. udział

odchylenia standardowego w wartości średniej

𝑉 = 𝑆

ҧ

𝑥 100%

(13)

ODCHYLENIE PRZECIĘTNE

podobnie jak odchylenie standardowe, charakteryzuje rozrzut danych wokół ich

średniej (jednak każda z danych ma taki sam udział)

𝑑 = 1

𝑛 ෍

𝑖=1 𝑛

𝑋_𝑖 − ҧ𝑥

(14)

ROZSTĘP

różnicą między największą a najmniejszą daną

(15)

ODCHYLENIE ĆWIARTKOWE

zakres zmienności środkowych 50% danych

𝑄 = 𝑄₃ − 𝑄₁ 2