• Nie Znaleziono Wyników

Cz˛e´s´c I Statystyka opisowa

N/A
N/A
Protected

Academic year: 2021

Share "Cz˛e´s´c I Statystyka opisowa"

Copied!
25
0
0

Pełen tekst

(1)

Cz˛e´s´c I

Statystyka opisowa

() Statystyka opisowa 24 maja 2010 1 / 8

(2)

Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.

Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19

Warto´sci próby nale˙z ˛a do przedziału [13, 19].

Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18

Warto´sci próby nale˙z ˛a do przedziału [10, 22].

W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.

St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.

() Statystyka opisowa 24 maja 2010 2 / 8

(3)

Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.

Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19

Warto´sci próby nale˙z ˛a do przedziału [13, 19].

Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18

Warto´sci próby nale˙z ˛a do przedziału [10, 22].

W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.

St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.

() Statystyka opisowa 24 maja 2010 2 / 8

(4)

Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.

Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19

Warto´sci próby nale˙z ˛a do przedziału [13, 19].

Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18

Warto´sci próby nale˙z ˛a do przedziału [10, 22].

W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.

St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.

() Statystyka opisowa 24 maja 2010 2 / 8

(5)

Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.

Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19

Warto´sci próby nale˙z ˛a do przedziału [13, 19].

Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18

Warto´sci próby nale˙z ˛a do przedziału [10, 22].

W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.

St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.

() Statystyka opisowa 24 maja 2010 2 / 8

(6)

Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.

Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19

Warto´sci próby nale˙z ˛a do przedziału [13, 19].

Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18

Warto´sci próby nale˙z ˛a do przedziału [10, 22].

W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.

St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.

() Statystyka opisowa 24 maja 2010 2 / 8

(7)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(8)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(9)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(10)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(11)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(12)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(13)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(14)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(15)

Charakterystyki próby x1, x2, ..., xn

´srednia arytmetyczna x = 1n Pn i=1

xi = x1+x2+...+xn n,

wariancja zwykła s2 =

n

P

i=1

(xi−x)2

n dla n > 30, wariancja skorygowana ˆs2 =

Pn i=1

(xi−x)2

n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =

s2, ˆs =

√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).

Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej

W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.

ˆs = 2.

W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.

W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.

() Statystyka opisowa 24 maja 2010 3 / 8

(16)

Szereg rozdzielczy, histogram

Szereg rozdzielczy jest tabel ˛a warto´sci próby wraz z liczebno´sci ˛a. Poni˙zszy szereg rozdzielczy podaje wyniki 101 pomiarów poziomu rzeki.

poziom rzeki (w m.) liczebno´s´c

4, 75 − 4, 95 15

4, 95 − 5, 15 17

5, 15 − 5, 35 20

5, 35 − 5, 55 25

5, 55 − 5, 75 14

5, 75 − 5, 95 10

Histogram jest wykresem słupkowym liczebno´sci od warto´sci próby.

() Statystyka opisowa 24 maja 2010 4 / 8

(17)

Szereg rozdzielczy, histogram

Szereg rozdzielczy jest tabel ˛a warto´sci próby wraz z liczebno´sci ˛a. Poni˙zszy szereg rozdzielczy podaje wyniki 101 pomiarów poziomu rzeki.

poziom rzeki (w m.) liczebno´s´c

4, 75 − 4, 95 15

4, 95 − 5, 15 17

5, 15 − 5, 35 20

5, 35 − 5, 55 25

5, 55 − 5, 75 14

5, 75 − 5, 95 10

Histogram jest wykresem słupkowym liczebno´sci od warto´sci próby.

() Statystyka opisowa 24 maja 2010 4 / 8

(18)

Zale˙zno´s´c mi˛edzy dwiema zmiennymi

Badamy zale˙zno´s´c mi˛edzy dwiema zmiennymi (cechami) np.

dawk ˛a nawozu a wielko´sci ˛a plonu

poziomem nasłonecznienia a wielko´sci ˛a plonu stopniem inflacji a poziomem bezrobocia.

Próba jest teraz postaci: {(x1, y1), (x2, y2), ...(xn, yn)}, np. xistopnie´n inflacji, yipoziom bezrobocia.

Jedn ˛a z miar zale˙zno´sci jest współczynnik korelacji liniowej r.

r =

1 n

Pn i=1

(xi− x)(yi− y) sxsy =

Pn i=1

(xi− x)(xi− y) s n

P

i=1

(xi− x)2 s n

P

i=1

(yi− y)2

() Statystyka opisowa 24 maja 2010 5 / 8

(19)

Zale˙zno´s´c mi˛edzy dwiema zmiennymi

Badamy zale˙zno´s´c mi˛edzy dwiema zmiennymi (cechami) np.

dawk ˛a nawozu a wielko´sci ˛a plonu

poziomem nasłonecznienia a wielko´sci ˛a plonu stopniem inflacji a poziomem bezrobocia.

Próba jest teraz postaci: {(x1, y1), (x2, y2), ...(xn, yn)}, np. xistopnie´n inflacji, yipoziom bezrobocia.

Jedn ˛a z miar zale˙zno´sci jest współczynnik korelacji liniowej r.

r =

1 n

Pn i=1

(xi− x)(yi− y)

sxsy =

Pn i=1

(xi− x)(xi− y) s n

P

i=1

(xi− x)2 s n

P

i=1

(yi− y)2

() Statystyka opisowa 24 maja 2010 5 / 8

(20)

Przykład: pier´snica drzewa (cm) 13 17,3 21 21,5 24 26 26,1 28,7 31,1 31,4

grubo´s´c kory (mm) 0,9 1,1 1,4 1,3 1,5 1,6 2 1,7 1,8 2,1

Wykres rozrzutu:

r = 0, 93. Punkty na wykresie rozrzutu układaj ˛a si˛e wzdłu˙z pewnej prostej.

Jak j ˛a wyznaczy´c?

() Statystyka opisowa 24 maja 2010 6 / 8

(21)

Przykład: pier´snica drzewa (cm) 13 17,3 21 21,5 24 26 26,1 28,7 31,1 31,4

grubo´s´c kory (mm) 0,9 1,1 1,4 1,3 1,5 1,6 2 1,7 1,8 2,1

Wykres rozrzutu:

r = 0, 93. Punkty na wykresie rozrzutu układaj ˛a si˛e wzdłu˙z pewnej prostej.

Jak j ˛a wyznaczy´c?

() Statystyka opisowa 24 maja 2010 6 / 8

(22)

Prosta regresji y = ax + b

Współczynniki a i b wyznaczane s ˛a metod ˛a najmniejszych kwadratów (MNK) pochodz ˛ac ˛a od Gaussa, tj.

n

X

i=1

yi− (axi+ b)2

osi ˛aga minimum.

Mo˙zna wykaza´c, ˙ze

a = Pn i=1

(xi− x)(xi− y)

n

P

i=1

(xi− x)2

b = y − ax

() Statystyka opisowa 24 maja 2010 7 / 8

(23)

Prosta regresji y = ax + b

Współczynniki a i b wyznaczane s ˛a metod ˛a najmniejszych kwadratów (MNK) pochodz ˛ac ˛a od Gaussa, tj.

n

X

i=1

yi− (axi+ b)2

osi ˛aga minimum.

Mo˙zna wykaza´c, ˙ze

a = Pn i=1

(xi− x)(xi− y)

n

P

i=1

(xi− x)2

b = y − ax

() Statystyka opisowa 24 maja 2010 7 / 8

(24)

Prosta regresji y = ax + b

Współczynniki a i b wyznaczane s ˛a metod ˛a najmniejszych kwadratów (MNK) pochodz ˛ac ˛a od Gaussa, tj.

n

X

i=1

yi− (axi+ b)2

osi ˛aga minimum.

Mo˙zna wykaza´c, ˙ze

a = Pn i=1

(xi− x)(xi− y)

n

P

i=1

(xi− x)2

b = y − ax

() Statystyka opisowa 24 maja 2010 7 / 8

(25)

Równanie prostej regresji: y = 0, 06x + 0, 11.

() Statystyka opisowa 24 maja 2010 8 / 8

Cytaty

Powiązane dokumenty

rozkład prawdopodobieństwa zmiennej losowej - przypisanie wartościom zmiennej losowej wartości funkcji prawdopodobieństwa (tzn. szans wystąpienia określonych wartości)

Opisz charakter histogramu, warto±ci wska¹ników poªo»enia, rozproszenia, asymetrii, koncentracji oraz eksces dla danych pogrupowa-

Opisz charakter histogramu, wartości wskaźników położenia, rozproszenia, asymetrii, koncentracji oraz eksces dla danych pogrupowa-

 platokurtyczne - kurtoza jest ujemna, wartości cechy mniej skoncentrowane niż przy rozkładzie normalnym. Kurtoza czasu trwania erupcji

Kwartyl trzeci (górny) to wartość cechy zmiennej, która dzieli badaną zbiorowość w taki sposób, że 75% jednostek zbiorowości charakteryzuje się wartościami nie wyższymi

C1 - Zapoznanie studentów z pojęciami, metodami i narzędziami statystyki opisowej oraz możliwościami ich wykorzystania w analizie zjawisk ekonomicznych C2 -

Changes in content of vitamin C in fruit of frozen (A) and freeze-dried (B) red pepper during storage.. Papryka w postaci mrożonek czy też liofilizatów może być przechowywana przez

przedziałowego (stosujemy gdy danych jest dużo i się nie powtarzają (ale mogą) lub zawsze dla cech ciągłych).