• Nie Znaleziono Wyników

Analiza zróżnicowania, asymetrii i koncentracji

N/A
N/A
Protected

Academic year: 2021

Share "Analiza zróżnicowania, asymetrii i koncentracji"

Copied!
74
0
0

Pełen tekst

(1)

Analiza zróżnicowania,

asymetrii i koncentracji

(2)

Miary zróżnicowania

Miary średnie, chociaż reprezentują wszystkie jednostki

badanej zbiorowości, nie dają wyczerpującej charakterystyki szeregu statystycznego, nie pozwalają przeniknąć w

wewnętrzny układ zbiorowości.

Poznamy tu miary oceny zróżnicowania (inaczej: zmienności, rozproszenia, rozrzutu, dyspersji), które informują jak duże są odchylenia między wartościami cechy poszczególnych

jednostek a średnią, którą najczęściej jest średnia

arytmetyczna. Im mniejsze zróżnicowanie, tym większe jest znaczenie danej średniej.

(3)

Przykład

Grupa I Grupa II

3 0

3 1

3 1

3 2

3 2

4 3

4 3

4 3

4 4

4 4

4 4

4 4

4 5

4 5

4 5

5 6

5 6

5 7

5 7

5 8

0 1 2 3 4 5 6 7 8 9

Liczba błędów w dyktandzie

0 1 2 3 4 5 6 7 8

Grupa I Grupa II

Średnia arytmetyczna Grupy I: 4 Średnia arytmetyczna Grupy II: 4

(4)

Miary zróżnicowania

Miary zróżnicowania

Bezwzględne Względne

Klasyczne:

Odchylenie przeciętne

Odchylenie standardowe

Pozycyjne:

Obszar

zmienności (rozstęp)

Odchylenie ćwiartkowe

Klasyczne:

Współczynnik zmienności (dla średniej arytmetycznej)

Pozycyjne:

Współczynnik zmienności (dla mediany)

(5)

Bezwzględne miary zróżnicowania

Są miarami mianowanymi, tzn. wyrażone są w tych

jednostkach co wartości cechy poszczególnych jednostek badanej zbiorowości, np. kg, szt., m, zł, pkt. Służą one do analizy zróżnicowania jednej zbiorowości pod względem

jednej cechy. Porównanie zróżnicowania danej cechy w

różnych zbiorowościach przy pomocy bezwzględnych miar

jest uzasadnione tylko wtedy, gdy średni poziom cechy w tych zbiorowościach jest jednakowy lub bardzo podobny.

(6)

Względne miary zróżnicowania

Zwane też współczynnikami zmienności, wykorzystywane są do porównania zróżnicowania kilku zbiorowości pod

względem jednej cechy lub kilku cech jednej zbiorowości.

Najczęściej wyrażone są w procentach i nie są to miary mianowane (nie mają jednostki).

(7)

Obszar zmienności (Rozstęp)

Najprostszą miarą zróżnicowania jest obszar zmienności, zwany również rozstępem. Miarę tę oznaczamy Oz. Obszar zmienności to różnica między największą a najmniejszą

wartością cechy w szeregu statystycznym:

Oz = xmax − xmin,

gdzie:

xmin - najmniejsza wartość cechy, xmax - największa wartość cechy.

(8)

Przykład

Grupa I Grupa II

3 0

3 1

3 1

3 2

3 2

4 3

4 3

4 3

4 4

4 4

4 4

4 4

4 5

4 5

4 5

5 6

5 6

5 7

5 7

5 8

Oz = xmax − xmin = 5 − 3 = 2, Grupa I

Oz = xmax − xmin = 8 − 0 = 8.

Grupa II

W grupie I zróżnicowanie pod względem popełnionych

błędów w dyktandzie jest mniejsze niż w grupie II.

(9)

Obszar zmienności (Rozstęp)

Obszar zmienności jest miarą pozycyjną, ponieważ w obliczeniach uwzględnia się nie wszystkie, lecz tylko te

jednostki, które mają najmniejszą i największą wartość cechy.

Miara ta jest prosta, łatwa do obliczenia. Jest ona jednak bardzo czuła na dwie skrajne wartości cechy, które często różnią się istotnie od wszystkich pozostałych wartości, a nierzadko są wartościami nietypowymi dla badanej

zbiorowości, dlatego jest to miara o małej wartości

poznawczej i wykorzystywana jest najczęściej do wstępnej oceny zróżnicowania badanej zbiorowości.

(10)

Odchylenie przeciętne

Odchylenie przeciętne, które oznaczamy dx jest średnią arytmetyczną bezwzględnych odchyleń poszczególnych

wartości zbiorowości statystycznej od średniej arytmetycznej.

Innymi słowy: jest to średnie odchylenie od średniej

arytmetycznej. Wybór wzoru na odchylenie przeciętne,

podobnie jak dla średniej arytmetycznej, uzależnione jest od rodzaju szeregu statystycznego, a więc od przedstawienia

danych.

(11)

Odchylenie przeciętne

Dla szeregu szczegółowego dx = 1

N (

N

i=1

|xi − x|

) .

xi - poszczególne wartości cechy, x - średnia arytmetyczna,

N - liczba obserwacji.

(12)

Odchylenie przeciętne

Dla szeregu rozdzielczego punktowego dx = 1

N (

k

i=1

ni |xi − x|

) .

ni - liczebność i-tego przedziału, k - liczba różnych wartości cechy.

(13)

Odchylenie przeciętne

Dla szeregu rozdzielczego przedziałowego dx = 1

N (

k

i=1

ni |xi − x|

) .

ni - liczebność i-tego przedziału, k - liczba przedziałów klasowych,

xi - środek i-tego przedziału klasowego.

(14)

Przykład

Nr Grupa I Grupa II

1 3 1 0 4

2 3 1 1 3

3 3 1 1 3

4 3 1 2 2

5 3 1 2 2

6 4 0 3 1

7 4 0 3 1

8 4 0 3 1

9 4 0 4 0

10 4 0 4 0

11 4 0 4 0

12 4 0 4 0

13 4 0 5 1

14 4 0 5 1

15 4 0 5 1

16 5 1 6 2

17 5 1 6 2

18 5 1 7 3

19 5 1 7 3

20 5 1 8 4

Razem 80 10 80 34

xi |xi − x| xi |xi − x|

dx = 10

20 = 0,5 Grupa I

dx = 34

20 = 1,7 Grupa II

(15)

Przykład

Wysokość kredytów udzielonych przez jeden z oddziałów Banku PKO BP osobom fizycznym w kwietniu 2004 roku:

Kwota udzielonych

kredytów (w tys. zł) Liczba kredytów

10 — 20 5

20 — 30 10

30 — 40 20

40 — 50 40

50 — 60 20

60 — 70 4

70 — 80 1

(16)

Przykład

10 — 20 5 15 75 27,6 138

20 — 30 10 25 250 17,6 176

30 — 40 20 35 700 7,6 152

40 — 50 40 45 1800 2,4 96

50 — 60 20 55 1100 12,4 248

60 — 70 4 65 260 22,4 89,6

70 — 80 1 75 75 32,4 32,4

Razem 100 4260 932

x0i − x1i ni xi nixi |xi − x| ni|xi − x|

x = 1 N (

k

i=1

nixi

) = 1

100 ⋅ 4260 = 42,6 tys. zł

(17)

Przykład

10 — 20 5 15 75 27,6 138

20 — 30 10 25 250 17,6 176

30 — 40 20 35 700 7,6 152

40 — 50 40 45 1800 2,4 96

50 — 60 20 55 1100 12,4 248

60 — 70 4 65 260 22,4 89,6

70 — 80 1 75 75 32,4 32,4

Razem 100 4260 932

x0i − x1i ni xi nixi |xi − x| ni|xi − x|

dx = 1 N (

k

i=1

ni|xi − x|

) = 1

100 ⋅ 932 = 9,32 tys. zł

(18)

Odchylenie standardowe

Odchylenie standardowe, Sx jest pierwiastkiem kwadratowym ze średniej arytmetycznej kwadratów odchyleń

poszczególnych wartości cechy od średniej arytmetycznej.

Informuje, o ile przeciętnie różnią się wartości cechy

poszczególnych jednostek od ich średniej arytmetycznej.

Wzór na odchylenie standardowe, podobnie jak na odchylenie przeciętne, zależy od rodzaju szeregu statystycznego.

(19)

Odchylenie standardowe

Dla szeregu szczegółowego Sx = 1

N (

N

i=1

(xi − x)2

) .

xi - poszczególne wartości cechy, x - średnia arytmetyczna,

N - liczba obserwacji.

(20)

Odchylenie standardowe

Dla szeregu rozdzielczego punktowego Sx = 1

N (

k

i=1

ni(xi − x)2

) .

ni - liczebność i-tego przedziału, k - liczba różnych wartości cechy.

(21)

Odchylenie standardowe

Dla szeregu rozdzielczego przedziałowego Sx = 1

N (

k

i=1

ni(xi − x)2

) .

ni - liczebność i-tego przedziału, k - liczba przedziałów klasowych,

xi - środek i-tego przedziału klasowego.

(22)

Uwagi

Kwadrat odchylenia standardowego zwany jest wariancją i również mierzy stopień rozproszenia obserwacji wokół

średniej arytmetycznej. Jednak z powodu podniesienia jednostki do kwadratu traci się część interpretacji.

Sx2

Gdy liczymy wariancję w próbie oznaczamy ją jako s2

Natomiast, wariancję w populacji generalnej oznaczamy jako

σ

2

(23)

Uwagi

We wnioskowaniu statystycznym stosuje się również inny wzór na odchylenie standardowe

Sx = 1

N − 1 (

N

i=1

(xi − x)2

) .

Przyczyną zastąpienia mianownika N przez N - 1 większa

dokładność powyższego wzoru. Jednak przy dużych N różnica ta jest nieistotna.

(24)

Przykład

Grupa I Grupa II

3 -1 1 0 -4 16

3 -1 1 1 -3 9

3 -1 1 1 -3 9

3 -1 1 2 -2 4

3 -1 1 2 -2 4

4 0 0 3 -1 1

4 0 0 3 -1 1

4 0 0 3 -1 1

4 0 0 4 0 0

4 0 0 4 0 0

4 0 0 4 0 0

4 0 0 4 0 0

4 0 0 5 1 1

4 0 0 5 1 1

4 0 0 5 1 1

5 1 1 6 2 4

5 1 1 6 2 4

5 1 1 7 3 9

5 1 1 7 3 9

5 1 1 8 4 16

80 0 10 80 0 90

xi xi − x (xi − x)2 xi xi − x (xi − x)2

Razem

(25)

Przykład

Sx = 10

20 = 0,5 = 0,7 Grupa I

Sx = 90

20 = 4,5 = 2,12 Grupa II

(26)

Przykład

Sx = 10

20 = 0,5 = 0,7 Grupa I

Sx = 90

20 = 4,5 = 2,12 Grupa II

Z obliczonych wartości wynika, że w Grupie I liczba błędów popełnionych w dyktandzie odchyla się przeciętnie od

średniej (4 błędy) o 0,7 błędów. Natomiast w Grupie II przeciętne odchylenie od średniej (również równej 4) jest większe i wynosi 2,12 błędów.

Reasumując, uczniowie Grupy II są bardziej zróżnicowani pod względem popełnionych błędów.

(27)

Przykład

Właściciel salonu fryzjerskiego dokonał oceny funkcjonowania placówki w lutym 2019 roku. Analizował m. in. liczbę

klientów korzystających z usług w poszczególnych dniach lutego. Oto zebrane informacje

Liczba klientów Liczba dni

10 1

11 3

14 7

15 8

18 3

20 3

Razem 25

(28)

Przykład

Liczba

klientów Liczba dni

10 1 10 -5 25 25

11 3 33 -4 16 48

14 7 98 -1 1 7

15 8 120 0 0 0

18 3 54 3 9 27

20 3 60 5 25 75

Razem 25 375 182

xi − x

xi ni nixi (xi − x)2 ni(xi − x)2

x =

k

i=1 nixi

N = 375

25 = 15, Sx =

k

i=1 ni(xi − x)2

N = 182

25 ≈ 2,7

(29)

Przykład

xi − x

xi x = ni nixi (xi − x)2 ni(xi − x)2

k

i=1 nixi

N = 375

25 = 15, Sx =

k

i=1 ni(xi − x)2

N = 182

25 ≈ 2,7

Uzyskany wynik oznacza, że przeciętne odchylenie od średniej dziennej liczby klientów korzystających z usług salonu

fryzjerskiego wynosi 2,7 klienta. Inaczej mówiąc, dzienne wahania liczby klientów korzystających z salonu wokół średniej (wynoszącej 15 klientów) wynoszą 2,7 klientów.

(30)

Przykład

Na podstawie poniższego szeregu rozdzielczego

przedziałowego obliczymy odchylenie standardowe wydajności pracowników mierzonej w liczbie sztuk

wyprodukowanych wyrobów w ciągu dnia przez pracownika.

Dzienna wydajność pracy

w sztukach na dzień Liczba pracowników

2 — 4 9

4 — 6 29

6 — 8 45

8 — 10 27

10 — 12 10

Razem 120

(31)

Przykład

Dzienna wydajność

pracy w sztukach

Liczba

pracowników

2 — 4 9 3 27 -4 16 144

4 — 6 29 5 145 -2 4 116

6 — 8 45 7 315 0 0 0

8 — 10 27 9 243 2 4 108

10 — 12 10 11 110 4 16 160

Razem 120 840 528

xi

(x0i − x1i) ni

nixi xi − x (xi − x)2 ni(xi − x)2

x =

k

i=1 nixi

N = 840

120 = 7, Sx =

k

i=1 ni(xi − x)2

N = 528

120 ≈ 2,1

(32)

Przykład

x =

k

i=1 nixi

N = 840

120 = 7, Sx =

k

i=1 ni(xi − x)2

N = 528

120 ≈ 2,1

Obliczone odchylenie standardowe informuje, że dzienna wydajność pracy poszczególnych pracowników różni się

przeciętnie o 2,1 sztuki od średniej wydajności pracowników tego zakładu (wynoszącej 7 sztuk). Przeciętne dzienne

wahania wydajności pracy pracowników wokół średniej wynoszą 2,1 sztuk.

(33)

Własności odchylenia standardowego

Odchylenie standardowe umożliwia ocenę przeciętnego wahania wartości wokół średniej arytmetycznej oraz

wyznaczenie typowego klasycznego obszaru zmienności cechy, zwanego również obszarem wartości typowych.

Statystycy wykazali, że w odpowiednio licznych

zbiorowościach około 68% jednostek badanej zbiorowości

charakteryzuje się wartościami cechy różniącymi się (w dół i w górę) od średniej arytmetycznej więcej niż jedno odchylenie standardowe Sx. Tzn. 68% jednostek mieści się w przedziale:

(x − Sx, x + Sx) lub x − Sx < xtyp < x + Sx

(34)

Przykład

x =

k

i=1 nixi

N = 840

120 = 7, Sx =

k

i=1 ni(xi − x)2

N = 528

120 ≈ 2,1

Typowy obszar zmienności dla danych z ostatniego przykładu:

7 − 2,1 < xtyp < 7 + 2,1

4,9 < xtyp < 9,1

68% pracowników firmy wytwarza dziennie od 4,9 do 9,1 sztuk wyrobu.

(35)

Odchylenie ćwiartkowe Q i

odstęp międzykwartylowy IQR

Odstęp międzykwartylowy IQR jest rozpiętością przedziału, w którym znajduje się połowa obserwacji szeregu o

wartościach najbliższych medianie. Połowa odstępu

międzykwartylowego to tak zwane odchylenie ćwiartkowe Q.

IQR = Q3 − Q1, Q = IQR 2 .

Miary te są wykorzystywane wówczas, gdy do opisu tendencji centralnej zastosowano medianę. Obie są miarami

pozycyjnymi.

(36)

Odchylenie ćwiartkowe Q

Odchylenie ćwiartkowe Q informuje o ile przeciętnie wartości cechy 50% środkowych jednostek zbiorowości różnią się od

mediany. Tym samym odchylenie ćwiartkowe nie mierzy zróżnicowania całej zbiorowości, ale tylko 50% środkowych jednostek. 25% jednostek o najniższych wartościach cechy i 25% o najwyższych wartościach cechy jest odrzucana, nie uwzględniana w obliczeniach. Na wartość odchylenia

ćwiartkowego nie mają wpływu skrajne, często przypadkowe wartości szeregu statystycznego. Odchylenie ćwiartkowe ma przejrzystą interpretację i można je obliczyć nawet wtedy, gdy w szeregu rozdzielczym występują otwarte przedziały klasowe.

(37)

Przykład

Oto dane o rozkładzie wieku pracowników pewnej firmy świadczącej usługi reklamowe.

Wiek pracowników

(w latach) Liczba pracowników

Poniżej 20 18

20 — 30 45

30 — 40 70

40 — 50 38

50 i więcej 9

Razem 180

(38)

Przykład

Wiek

pracowników (w latach)

Liczba

pracowników Liczebność skumulowana

Poniżej 20 18 18

20 — 30 45 63

30 — 40 70 133

40 — 50 38 171

50 i więcej 9 180

Razem 180

NrQ1 = 180

4 = 45,

(x0i − x1i) ni nisk

Q1 = 20 + 10

45 ⋅ (45 − 18) = 26, NrQ3 = 3 ⋅ 180

4 = 135, Q3 = 40 + 10

38 ⋅ (135 − 133) ≈ 40,5,

Q = Q3 − Q1

2 = 7,25.

(39)

Przykład

(x0i − x1i) ni nisk

Q = Q3 − Q1

2 = 7,25.

Otrzymany wynik wskazuje, że przeciętne zróżnicowanie wieku pracowników analizowanej firmy po odrzuceniu 25%

pracowników najmłodszych i 25% najstarszych wynosi około 7 lat (dokładniej 7 lat i kwartał). Interpretacja odchylenia ćwiartkowego jest podobna do interpretacji odchylenia

standardowego: wiek poszczególnych pracowników różni się od średniego wieku (mierzonego medianą) o 7,25 lat, ale

dotyczy to tylko środkowych 50% obserwacji. Odchylenie ćwiartkowe mierzy więc zróżnicowanie w zawężonym

obszarze.

(40)

Względne miary

zróżnicowania

(41)

Przykład

(x0i − x1i) ni nisk

Załóżmy, że chcemy porównać dokładność pracy dwóch automatów do pakowania:

Automat do pakowania cukru Automat do pakowania cementu

(42)

Przykład

(x0i − x1i) ni nisk

Automat do pakowania cukru pakuje cukier do

kilogramowych torebek. Odchylenie pakowania od normy wynosi ± 0,05 kg.

Automat do pakowania cementu pakuje cement do 50

kilogramowych worków. Odchylenie pakowania od normy wynosi ± 0,2 kg.

Czy możemy wykorzystać te przeciętne odchylenia od normy w celu porównania precyzji tych dwóch automatów?

(43)

Względne miary zróżnicowania

Względne miary zróżnicowania noszą nazwę współczynników zmienności i oznaczane są wspólnie literą V.

Współczynnik zmienności jest stosunkiem bezwzględnej miary zróżnicowania (to jest odchylenia przeciętnego dx,

odchylenia standardowego Sx, bądź odchylenia ćwiartkowego Q) do odpowiedniej miary średniej (średniej arytmetycznej, bądź mediany) wyrażony w procentach.

Mówią one jaki jest procentowy udział odchylenia do wartości średniej.

(44)

Względne miary zróżnicowania

Zależnie od wykorzystanych bezwzględnych miar zróżnicowania współczynniki zmienności obliczamy według wzorów:

Vdx = dx

x ⋅ 100 % , VSx = Sx

x ⋅ 100 % , VQ = Q

Me ⋅ 100 % .

(45)

Przykład

Sx = 0,7 Grupa I

Sx = 2,12 Grupa II

x = 4 x = 4

VSx = Sx

x ⋅ 100 % = 17,5 % VSx = Sx

x ⋅ 100 % = 53 %

(46)

Przykład

Sx = 0,7 Grupa I

Sx = 2,12 Grupa II

x = 4 x = 4

VSx = Sx

x ⋅ 100 % = 17,5 % VSx = Sx

x ⋅ 100 % = 53 % Obliczone miary względnego zróżnicowania świadczą o

niewielkim zróżnicowaniu błędów dla Grupy I (17,5%) i średnim zróżnicowaniu błędów dla Grupy II (53%).

(47)

Miary asymetrii (skośności)

Kolejnym etapem analizy struktury jest badanie asymetrii, czyli skośności (lewostronnej bądź prawostronnej) szeregu statystycznego.

Analizując szeregi strukturalne można spotkać się z przypadkiem, gdy średni poziom badanej cechy i jej

zróżnicowania nie obrazuje dostatecznie różnic między badanymi szeregami, a szczegółowa obserwacja szeregów

wyklucza podobieństwo tych szeregów. W takim przypadku posługujemy się miarami asymetrii.

(48)

Przykład

Analizując poziom płac w przedsiębiorstwie, obliczyliśmy średnią płacę i chcemy ustalić, czy liczba pracowników, których płaca jest wyższa od średniej jest większa czy

mniejsza od liczby pracowników, których płaca jest niższa od średniej płacy.

Okazuje się, że istotny jest nie tylko przeciętny poziom i zróżnicowanie cechy ale także to, czy przeważająca liczba badanych jednostek ma wartość cechy powyżej czy poniżej przeciętnego poziomu.

(49)

Przykład

(50)

Miary asymetrii (skośności)

Zagadnienie asymetrii (skośności) można zbadać za pomocą miar asymetrii. Ich konstrukcja opiera się na spostrzeżeniu, że w szeregu symetrycznym wszystkie trzy miary średnie:

średnia arytmetyczna, dominanta i mediana są równe.

Rozkład symetryczny x = Me = Do

(51)

Miary asymetrii (skośności)

Do Me x

Do x Me

Prawostronna asymetria

Do ⩽ Me ⩽ x

Lewostronna asymetria

x ⩽ Me ⩽ Do

(52)

Wskaźnik asymetrii A S

Jest to różnica między średnią arytmetyczną a dominantą:

AS = x − Do

Mierzy on nie tylko stopień asymetrii lecz także wskazuje na jej kierunek:

AS = 0 — szereg jest symetryczny,

AS > 0 — asymetria prawostronna (dodatnia),

AS < 0 — asymetria lewostronna (ujemna).

(53)

Wskaźnik asymetrii A S

Wskaźnik asymetrii jest miarą bezwzględną (mianowaną) i jego przydatność jest niewielka, ponieważ nie nadaje się do porównywania asymetrii cech, które mierzone są w różnych jednostkach miary. Wartość tego miernika zależy również od stopnia rozproszenia (zmienności) cechy w badanej

zbiorowości.

(54)

Współczynnik asymetrii W S

Współczynnik asymetrii oblicza się dzieląc wskaźnik asymetrii przez odchylenie standardowe:

WS = AS

Sx = x − Do Sx .

Współczynnik asymetrii jest liczbą niemianowaną. Na ogół przyjmuje wartość z przedziału od -1 do +1. Może się

zdarzyć, że przy bardzo silnej asymetrii wartość bezwzględna współczynnika będzie większa od 1. Znak współczynnika

informuje o kierunku asymetrii, natomiast wartość bezwzględna — o sile asymetrii: im większa wartość bezwzględna, tym silniejsza asymetria.

(55)

Przykład

Poziom płac szwaczek zatrudnionych w dwóch zakładach odzieżowych na terenie województwa łódzkiego:

Płaca

(w tysiącach zł) Odsetek szwaczek

Zakład Claudia Zakład Linea

1,2 — 1,4 10 5

1,4 — 1,6 20 5

1,6 — 1,8 30 10

1,8 — 2,0 20 20

2,0 — 2,2 10 30

2,2 — 2,4 5 20

2,4 — 2,6 5 10

Razem 100 100

(56)

Przykład

Płaca Claudia 1,2 —

1,4

10 1,3 13 -0,47 0,22 2,21 10

1,4 — 1,6

20 1,5 30 -0,27 0,07 1,46 30

1,6 — 1,8

30 1,7 51 -0,07 0,00 0,15 60

1,8 — 2,0

20 1,9 38 0,13 0,02 0,34 80

2,0 — 2,2

10 2,1 21 0,33 0,11 1,09 90

2,2 — 2,4

5 2,3 11,5 0,53 0,28 1,40 95

2,4 — 2,6

5 2,5 12,5 0,73 0,53 2,66 100

Razem 100 177 9,31

(x0i − x1i) wi xi wixi xi − x (xi − x)2 wi(xi − x)2 wisk

x =

k

i=1 wixi

100 = 177

100 = 1,77,

(57)

Przykład

Płaca Claudia 1,2 —

1,4

10 1,3 13 -0,47 0,22 2,21 10

1,4 — 1,6

20 1,5 30 -0,27 0,07 1,46 30

1,6 — 1,8

30 1,7 51 -0,07 0,00 0,15 60

1,8 — 2,0

20 1,9 38 0,13 0,02 0,34 80

2,0 — 2,2

10 2,1 21 0,33 0,11 1,09 90

2,2 — 2,4

5 2,3 11,5 0,53 0,28 1,40 95

2,4 — 2,6

5 2,5 12,5 0,73 0,53 2,66 100

Razem 100 177 9,31

(x0i − x1i) wi xi wixi xi − x (xi − x)2 wi(xi − x)2 wisk

Do = x0 + (n0 − n−1)h0

(n0 − n−1) + (n0 − n+1) = 1,6 + (30 − 20) ⋅ 0,2

(30 − 20) + (30 − 20) = 1,7,

(58)

Przykład

Płaca Claudia 1,2 —

1,4

10 1,3 13 -0,47 0,22 2,21 10

1,4 — 1,6

20 1,5 30 -0,27 0,07 1,46 30

1,6 — 1,8

30 1,7 51 -0,07 0,00 0,15 60

1,8 — 2,0

20 1,9 38 0,13 0,02 0,34 80

2,0 — 2,2

10 2,1 21 0,33 0,11 1,09 90

2,2 — 2,4

5 2,3 11,5 0,53 0,28 1,40 95

2,4 — 2,6

5 2,5 12,5 0,73 0,53 2,66 100

Razem 100 177 9,31

(x0i − x1i) wi xi wixi xi − x (xi − x)2 wi(xi − x)2 wisk

NrMe = 50, Me = x0 + h0

w0 (NrMe − wisk−1) = 1,6 + 0,2

30 (50 − 30) = 1,73,

(59)

Przykład

Płaca Claudia 1,2 —

1,4

10 1,3 13 -0,47 0,22 2,21 10

1,4 — 1,6

20 1,5 30 -0,27 0,07 1,46 30

1,6 — 1,8

30 1,7 51 -0,07 0,00 0,15 60

1,8 — 2,0

20 1,9 38 0,13 0,02 0,34 80

2,0 — 2,2

10 2,1 21 0,33 0,11 1,09 90

2,2 — 2,4

5 2,3 11,5 0,53 0,28 1,40 95

2,4 — 2,6

5 2,5 12,5 0,73 0,53 2,66 100

Razem 100 177 9,31

(x0i − x1i) wi xi wixi xi − x (xi − x)2 wi(xi − x)2 wisk

Sx =

k

i=1 wi(xi − x)2

100 = 9,31

100 = 0,305, WS = x − Do

Sx = 1,77 − 1,7

0,305 = 0,23

(60)

Przykład

Analogiczne rachunki przeprowadzamy dla drugiego zakładu.

Jako proste ćwiczenie pozostawiamy je czytelnikowi. Wyniki obliczeń zbierzmy w tabeli

Parametry Zakład Claudia Zakład Linea

1,77 2,03

1,73 2,07

1,7 2,1

0,305 0,305

0,07 > 0 -0,07 < 0

0,23 -0,23

Relacja między średnimi

x MeDo

Sx AS WS

Do < Me < x x < Me < Do

(61)

Przykład

Z powyższego wynika, że oba zakłady charakteryzują się słabą asymetrią (AS = ±0,07). Siła asymetrii w tych

zakładach jest taka sama, natomiast różny jest jej kierunek:

w zakładzie Claudia — asymetria dodatnia, w zakładzie

Linea — ujemna, co oznacza, że w zakładzie Claudia więcej szwaczek zarabia poniżej średniej, a w zakładzie Linea

przeciwnie, więcej szwaczek zarabia powyżej średniej.

Parametry Zakład Claudia Zakład Linea

1,77 2,03

1,73 2,07

1,7 2,1

0,305 0,305

0,07 > 0 -0,07 < 0

0,23 -0,23

Relacja między średnimi

Mex Do Sx

AS WS

Do < Me < x x < Me < Do

(62)

Przykład

Zakład Claudia

0 7,5 15 22,5 30

1,2 — 1,4 1,4 — 1,6 1,6 — 1,8 1,8 — 2,0 2,0 — 2,2 2,2 — 2,4 2,4 — 2,6

Zakład Linea

0 7,5 15 22,5 30

1,2 — 1,4 1,4 — 1,6 1,6 — 1,8 1,8 — 2,0 2,0 — 2,2 2,2 — 2,4 2,4 — 2,6

(63)

Pozycyjny współczynnik asymetrii A Q

W przypadku, gdy średni poziom cechy mierzymy za pomocą miar pozycyjnych, stosujemy pozycyjny współczynnik

asymetrii:

AQ = (Q3 − Me) − (Me − Q1)

Q3 − Me) + (Me − Q1) = Q3 + Q1 − 2Me Q3 − Q1 .

Wartości współczynnika ograniczają się do przedziału od -1 do +1. Miernik ten oparty jest na obserwacji, że w

symetrycznym szeregu statystycznym kwartyl pierwszy jest tak samo oddalony od mediany jak kwartyl trzeci:

Q3 − Me = Me − Q1 .

(64)

Pozycyjny współczynnik asymetrii A Q

∙ (Q3 − Me) − (Me − Q1) = 0 - rozkład symetryczny,

Podobnie jak WS ,współczynnik asymetrii AQ określa siłę i kierunek asymetrii, ale tylko dla jednostek znajdujących się między pierwszym a trzecim kwartylem, a więc zawężonym obszarze 50% środkowych jednostek.

∙ (Q3 − Me) − (Me − Q1) > 0 - asymetria dodatnia,

∙ (Q3 − Me) − (Me − Q1) < 0 - asymetria ujemna,

(65)

Miary Koncentracji

Powyżej opisane miary średnie, miary zróżnicowania i miary asymetrii pozwalają w sposób wyczerpujący opisać strukturę badanej zbiorowości. W niektórych sytuacjach opis ten

można uzupełnić (wzbogacić) miarami koncentracji.

Zjawisko koncentracji — nierównomierny podział ogólnej sumy wartości cechy pomiędzy poszczególne jednostki

zbiorowości. Koncentracja jest przeciwieństwem

równomierności podziału. Mówimy często o koncentracji kapitału, ludności, ziemi, dochodów ludności w pewnych grupach społecznych, rodzajów zanieczyszczeń itd.

(66)

Miary Koncentracji

Skrajny przypadek absolutnej koncentracji zachodzi wtedy i tylko wtedy, gdy całą sumą wartości dysponuje tylko jedna jednostka zbiorowości, a pozostałe są ich całkowicie

pozbawione.

Drugi skrajny przypadek — całkowitego braku koncentracji

— występuje wtedy, gdy każda jednostka zbiorowości

otrzymuje taką samą część ogólnej sumy wartości, a więc wszystkie jednostki mają tę samą wartość rozpatrywanej cechy (podział równomierny).

W praktyce do oceny stopnia koncentracji stosuje się dwie metody: graficzną i numeryczną.

(67)

Metoda graficzna oceny koncentracji

Polega na wyznaczeniu krzywej Lorenza.

Dane dotyczące liczby jednostek ni oraz łącznego poziomu cechy dla wszystkich jednostek danej grupy, czyli xini zastępujemy

skumulowanymi wskaźnikami struktury. Dla przedziału -tego przedziału klasowego przyjmujemy: i

x0i − x1i

wi = ni/N ⋅ 100 % zi = mi/M ⋅ 100 % mi = nixi

ni N = k

i=1

ni M = k

i=1

mi zisk = i

j=1

zj

wisk = i

j=1

wj

(68)

0 20 40 60 80 100

0 20 40 60 80 100

Linia równomiernego podziału Krzywa Lorenza

Metoda graficzna oceny koncentracji

a

b zisk (%)

wisk (%)

(69)

Metoda numeryczna oceny koncentracji

Precyzyjnie siłę koncentracji określamy obliczając współczynnik koncentracji Lorenza K.

Współczynnik koncentracji Lorenza jest względną miarą

koncentracji zjawiska. Przyjmuje wartości z przedziału od 0 do 1.

K = a

a + b = (a + b) − b

a + b = 1 − b

a + b .

0 ⩽ K ⩽ 1.

Jeżeli K = 0, to koncentracja nie występuje, natomiast K = 1 oznacza koncentrację absolutną.

Cytaty

Powiązane dokumenty

Przez kolejne 4 dni temperatura spadała: pierwszego dnia o 1°C, drugiego o 3°C, a w następnych dniach o 2°C i o 1°C. Kieruj się

Rzucamy dwa razy symetryczną, sześcienną kostką, której jedna ściana ma jedno oczko, dwie mają dwa oczka i trzy ściany mają po trzy oczka.. Oblicz prawdopodobieństwo, że

Przegląd literatury dokonany przez Pierzchałkównę w r, 1954 doprowadził ją do wniosku, że w rozmieszczeniu obu typów dolin asymetrycznych w Europie zaznacza się

Rośliny prowadzące fotosyntezę typu C4 posiadają, jako pierwszy akceptor dwutlenku węgla fosfoenolopirogronian (PEP).. Jest to

W referacie przedstawiono, przy wykorzystaniu programu Mathcad, wyniki obliczeń wartości napięć wyjściowych transformatorów energetycznych SN/nn przy różnych

— w tym celu napisać funkcję parametry.opisowe, która dla dowolnej zmiennej wyznaczy pa- rametry opisowe: minimum, maksimum, rozstęp empiryczny, średnią, odchylenie

— w tym celu napisać funkcję parametry.opisowe, która dla dowolnej zmiennej wyznaczy parametry opisowe: średnia, kwartyl.1, mediana, kwartyl.3, min, max, rozstęp empiryczny, roz-

Analiza typologiczna zbioru jpk wyodrębnionych na obszarze Roztocza Zachodniego pozwoliła wyróżnić 6 grup typologicznych zróznicowanych na 16 podgrup oraz 7 jednostek