Cz˛e´s´c I
Statystyka opisowa
() Statystyka opisowa 24 maja 2010 1 / 8
Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.
Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19
Warto´sci próby nale˙z ˛a do przedziału [13, 19].
Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18
Warto´sci próby nale˙z ˛a do przedziału [10, 22].
W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.
St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.
() Statystyka opisowa 24 maja 2010 2 / 8
Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.
Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19
Warto´sci próby nale˙z ˛a do przedziału [13, 19].
Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18
Warto´sci próby nale˙z ˛a do przedziału [10, 22].
W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.
St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.
() Statystyka opisowa 24 maja 2010 2 / 8
Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.
Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19
Warto´sci próby nale˙z ˛a do przedziału [13, 19].
Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18
Warto´sci próby nale˙z ˛a do przedziału [10, 22].
W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.
St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.
() Statystyka opisowa 24 maja 2010 2 / 8
Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.
Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19
Warto´sci próby nale˙z ˛a do przedziału [13, 19].
Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18
Warto´sci próby nale˙z ˛a do przedziału [10, 22].
W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.
St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.
() Statystyka opisowa 24 maja 2010 2 / 8
Niech x1, x2, ..., xnb˛ed ˛a wynikami pomiarów, np. temperatury, ci´snienia, poziomu rzeki, wielko´sci plonów itp.
Przykład 1: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni maja 14, 15, 17, 18, 16, 16, 13, 19
Warto´sci próby nale˙z ˛a do przedziału [13, 19].
Przykład 2: wyniki pomiarów temperatury w ci ˛agu 8 kolejnych dni wrze´snia 11, 16, 21, 16, 10, 22, 14, 18
Warto´sci próby nale˙z ˛a do przedziału [10, 22].
W obu przykładach ´srednia temperatura jest taka sama (równa 16), ale w Przykładzie 2 wyst˛epuje wi˛ekszy rozrzut warto´sci próby.
St ˛ad do poprawnego opisu próby nale˙zy wprowadzi´c ró˙zne jej charakterystyki.
() Statystyka opisowa 24 maja 2010 2 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Charakterystyki próby x1, x2, ..., xn
´srednia arytmetyczna x = 1n Pn i=1
xi = x1+x2+...+xn n,
wariancja zwykła s2 =
n
P
i=1
(xi−x)2
n dla n > 30, wariancja skorygowana ˆs2 =
Pn i=1
(xi−x)2
n−1 dla n ≤ 30, odchylenia standardowe zwykłe i skorygowane s =
√ s2, ˆs =
√ ˆs2, mediana jest to warto´s´c ´srodkowa w uporz ˛adkowanej próbie (ew. ´srednia arytm. ´srodkowych).
Wariancja i odchylenie standardowe s ˛a miarami rozrzutu warto´sci próby wokół warto´sci ´sredniej
W próbie 1 ´srednia wynosi x = 16, wariancja ˆs2 = 4, odchylenie standard.
ˆs = 2.
W próbie 2 ´srednia wynosi x = 16, wariancja ˆs2 = 18, 6, odchylenie standard. ˆs = 4, 3.
W próbie 2 wi˛eksza wariancja gdy˙z wi˛ekszy rozrzut wyników.
() Statystyka opisowa 24 maja 2010 3 / 8
Szereg rozdzielczy, histogram
Szereg rozdzielczy jest tabel ˛a warto´sci próby wraz z liczebno´sci ˛a. Poni˙zszy szereg rozdzielczy podaje wyniki 101 pomiarów poziomu rzeki.
poziom rzeki (w m.) liczebno´s´c
4, 75 − 4, 95 15
4, 95 − 5, 15 17
5, 15 − 5, 35 20
5, 35 − 5, 55 25
5, 55 − 5, 75 14
5, 75 − 5, 95 10
Histogram jest wykresem słupkowym liczebno´sci od warto´sci próby.
() Statystyka opisowa 24 maja 2010 4 / 8
Szereg rozdzielczy, histogram
Szereg rozdzielczy jest tabel ˛a warto´sci próby wraz z liczebno´sci ˛a. Poni˙zszy szereg rozdzielczy podaje wyniki 101 pomiarów poziomu rzeki.
poziom rzeki (w m.) liczebno´s´c
4, 75 − 4, 95 15
4, 95 − 5, 15 17
5, 15 − 5, 35 20
5, 35 − 5, 55 25
5, 55 − 5, 75 14
5, 75 − 5, 95 10
Histogram jest wykresem słupkowym liczebno´sci od warto´sci próby.
() Statystyka opisowa 24 maja 2010 4 / 8
Zale˙zno´s´c mi˛edzy dwiema zmiennymi
Badamy zale˙zno´s´c mi˛edzy dwiema zmiennymi (cechami) np.
dawk ˛a nawozu a wielko´sci ˛a plonu
poziomem nasłonecznienia a wielko´sci ˛a plonu stopniem inflacji a poziomem bezrobocia.
Próba jest teraz postaci: {(x1, y1), (x2, y2), ...(xn, yn)}, np. xistopnie´n inflacji, yipoziom bezrobocia.
Jedn ˛a z miar zale˙zno´sci jest współczynnik korelacji liniowej r.
r =
1 n
Pn i=1
(xi− x)(yi− y) sxsy =
Pn i=1
(xi− x)(xi− y) s n
P
i=1
(xi− x)2 s n
P
i=1
(yi− y)2
() Statystyka opisowa 24 maja 2010 5 / 8
Zale˙zno´s´c mi˛edzy dwiema zmiennymi
Badamy zale˙zno´s´c mi˛edzy dwiema zmiennymi (cechami) np.
dawk ˛a nawozu a wielko´sci ˛a plonu
poziomem nasłonecznienia a wielko´sci ˛a plonu stopniem inflacji a poziomem bezrobocia.
Próba jest teraz postaci: {(x1, y1), (x2, y2), ...(xn, yn)}, np. xistopnie´n inflacji, yipoziom bezrobocia.
Jedn ˛a z miar zale˙zno´sci jest współczynnik korelacji liniowej r.
r =
1 n
Pn i=1
(xi− x)(yi− y)
sxsy =
Pn i=1
(xi− x)(xi− y) s n
P
i=1
(xi− x)2 s n
P
i=1
(yi− y)2
() Statystyka opisowa 24 maja 2010 5 / 8
Przykład: pier´snica drzewa (cm) 13 17,3 21 21,5 24 26 26,1 28,7 31,1 31,4
grubo´s´c kory (mm) 0,9 1,1 1,4 1,3 1,5 1,6 2 1,7 1,8 2,1
Wykres rozrzutu:
r = 0, 93. Punkty na wykresie rozrzutu układaj ˛a si˛e wzdłu˙z pewnej prostej.
Jak j ˛a wyznaczy´c?
() Statystyka opisowa 24 maja 2010 6 / 8
Przykład: pier´snica drzewa (cm) 13 17,3 21 21,5 24 26 26,1 28,7 31,1 31,4
grubo´s´c kory (mm) 0,9 1,1 1,4 1,3 1,5 1,6 2 1,7 1,8 2,1
Wykres rozrzutu:
r = 0, 93. Punkty na wykresie rozrzutu układaj ˛a si˛e wzdłu˙z pewnej prostej.
Jak j ˛a wyznaczy´c?
() Statystyka opisowa 24 maja 2010 6 / 8
Prosta regresji y = ax + b
Współczynniki a i b wyznaczane s ˛a metod ˛a najmniejszych kwadratów (MNK) pochodz ˛ac ˛a od Gaussa, tj.
n
X
i=1
yi− (axi+ b)2
osi ˛aga minimum.
Mo˙zna wykaza´c, ˙ze
a = Pn i=1
(xi− x)(xi− y)
n
P
i=1
(xi− x)2
b = y − ax
() Statystyka opisowa 24 maja 2010 7 / 8
Prosta regresji y = ax + b
Współczynniki a i b wyznaczane s ˛a metod ˛a najmniejszych kwadratów (MNK) pochodz ˛ac ˛a od Gaussa, tj.
n
X
i=1
yi− (axi+ b)2
osi ˛aga minimum.
Mo˙zna wykaza´c, ˙ze
a = Pn i=1
(xi− x)(xi− y)
n
P
i=1
(xi− x)2
b = y − ax
() Statystyka opisowa 24 maja 2010 7 / 8
Prosta regresji y = ax + b
Współczynniki a i b wyznaczane s ˛a metod ˛a najmniejszych kwadratów (MNK) pochodz ˛ac ˛a od Gaussa, tj.
n
X
i=1
yi− (axi+ b)2
osi ˛aga minimum.
Mo˙zna wykaza´c, ˙ze
a = Pn i=1
(xi− x)(xi− y)
n
P
i=1
(xi− x)2
b = y − ax
() Statystyka opisowa 24 maja 2010 7 / 8
Równanie prostej regresji: y = 0, 06x + 0, 11.
() Statystyka opisowa 24 maja 2010 8 / 8