Analiza struktury i przeciętnego poziomu cechy

(1)

Analiza struktury i

przeciętnego poziomu cechy

(2)

Analiza struktury

Pod pojęciem analizy struktury rozumiemy badanie budowy (składu) określonej zbiorowości, lub próby, tj. ustalenie, z

jakich składa się elementów oraz jaką część stanowią owe elementy w całym zbiorze.

(3)

Wskaźniki struktury

Wyrażają stosunek części zbiorowości statystycznej (ni) do jej całości (N). Można je wyznaczyć za pomocą formuły

w_i = n_i

N ⋅ 100 % , i = 1,2,…, k . Wskaźniki struktury są liczbami względnymi

(niemianowanymi). Ma to nie tylko duże znaczenie poznawcze, ale również praktyczne. Przykładowo: w

przedsiębiorstwie A wykształcenie wyższe ma 10 na 1000 pracowników, natomiast w przedsiębiorstwie B — 5 na 50 pracujących, zatem 1% pracowników w ﬁrmie A, a 10% w ﬁrmie B ma wykształcenie wyższe.

(4)

Wskaźniki struktury

Wskaźniki struktury mówią jaką część stanowi wybrana grupa klasyﬁkacyjna w całej zbiorowości.

Wskaźniki struktury, jako proste i zrozumiałe mierniki, znajdują szerokie zastosowanie w praktyce badań

statystycznych. Istotną ich zaletą jest fakt, że mogą być

stosowane dla dowolnych cech (mierzalnych i niemierzalnych), gdyż wykorzystują liczebności cząstkowe i łączną liczebność zbiorowości, bez udziału samych wariantów cechy.

w_i = n_i

N ⋅ 100 % , i = 1,2,…, k .

(5)

Przykład

W pewnym łódzkim liceum do egzaminu maturalnego w 2009 roku przystąpiło 240 uczniów, z czego 162 osoby stanowiły

kobiety.

w₁ = 162

240 ⋅ 100 % = 0,675 ⋅ 100 % = 67,5 % .

Aby obliczyć jaki procent zdających maturę stanowiły kobiety, (w1) stosujemy wzór:

Z kolei w celu ustalenia, jaki odsetek stanowili mężczyźni (w2) stosujemy wzór:

w₂ = 240 − 162

240 ⋅ 100 % = 0,325 ⋅ 100 % = 32,5 % .

(6)

Wskaźnik podobieństwa struktur

Czasami badacza interesuje nie tylko, jaka jest struktura

danej zbiorowości, ale także to, czy jest ona podobna do innej (np. czy struktura zarobków kobiet i mężczyzn jest do siebie zbliżona). Syntetycznym miernikiem podobieństwa struktur jest wskaźnik podobieństwa struktur dany wzorem:

w_p = ∑^k

i=1

min(w_1i, w_2i), gdzie

w_1i - wskaźnik struktury pierwszej zbiorowości, w_2i - wskaźnik struktury drugiej zbiorowości.

(7)

Wskaźnik podobieństwa struktur

Warunkiem zastosowania tego wskaźnika jest takie samo grupowanie obu zbiorowości ze względu na badaną cechę mierzalną lub niemierzalną.

Wartości wskaźnika podobieństwa struktur zawierają się w przedziale od 0 do 1 (lub w wyrażeniu procentowym od 0 do 100 procent). Im bliższe jedności (lub 100%) wartości tego wskaźnika, tym większe podobieństwo analizowanych

struktur. Wartość wskaźnika równa 1 (100%) oznacza, że struktury są identyczne.

(8)

Przykład

Poniższa tablica przedstawia liczbę osób ukaranych przez sąd grodzki w miejscowościach A i B. Zbadamy czy struktura

wiekowa ukaranych w tych dwóch miejscowościach jest podobna.

Wiek (w

latach) Liczba ukaranych

A B

20 — 24 5 10

25 — 29 10 60

30 — 34 12 90

35 — 39 20 100

40 — 44 130 90

45 — 49 23 50

Razem 200 400

(9)

Przykład

Wiek (w latach)

Liczba ukaranych Wskaźniki struktury min(w1i, w2i)

A B w1i w2i

20 — 24 5 10 0,025 0,025 0,025

25 — 29 10 60 0,05 0,15 0,05

30 — 34 12 90 0,06 0,225 0,06

35 — 39 20 100 0,1 0,25 0,1

40 — 44 130 90 0,65 0,225 0,225

45 — 49 23 50 0,115 0,125 0,115

Razem 200 400 1 1 0,575

Wskaźnik podobieństwa struktur wynosi wp = 0,575.

Wielkość ta świadczy o umiarkowanym podobieństwie

badanych struktur ze względu na wiek osób ukaranych przez sądy grodzkie w porównywanych miejscowościach.

(10)

Analiza przeciętnego

poziomu cechy

(11)

Miary średnie

Jeżeli cecha, którą analizujemy w zbiorowości jest cechą

mierzalną, to zbiorowość możemy scharakteryzować w sposób

syntetyczny za pomocą miar wyrażających jej przeciętny poziom.

Miary przeciętne charakteryzują średni lub typowy poziom

wartości cechy. Są to więc takie miary, wokół których skupiają się wszystkie pozostałe wartości analizowanej cechy.

Miary przeciętne dzielą się na miary klasyczne i pozycyjne.

Pierwsze wyznaczane w oparciu o wszystkie wartości cechy

drugie wskazują określoną pozycję jednostek (np. środkową lub dominującą).

(12)

Miary średnie

Miary przeciętne

Klasyczne

• Średnia arytmetyczna

• Średnia harmoniczna

• Średnia geometryczna

Pozycyjne

• ^Dominanta

• ^Mediana

(13)

Średnia arytmetyczna

Wyraża ona przeciętny poziom badanej cechy (zmiennej) w populacji, np. przeciętna miesięczna sprzedaż, średnia ocena na świadectwie szkolnym itp. Interpretacja średniej i metoda jej wyznaczania jest zawsze taka sama, jednak techniczny

sposób obliczenia średniej zależy od typu szeregu

statystycznego, z którym mamy do czynienia. Średnia jest sumą wartości cechy podzieloną przez liczbę jednostek

zbiorowości. Średnią arytmetyczną oznaczamy symbolem:

x - dla próby,

μ - dla populacji.

(14)

Średnia arytmetyczna

Wzór na średnią arytmetyczną dla szeregu szczegółowego:

x = x₁ + x₂ + … + x_N

N =

∑N i=1 x_i

N .

Wzór na średnią arytmetyczną ważoną, gdy wartości cechy występują więcej niż jeden raz (xi występuje ni razy):

x = n₁x₁ + n₂x₂ + … + n_kx_k

N =

∑k

i=1 n_ix_i N .

(15)

Przykład

Oceny z matematyki

xi

Liczba uczniów

ni nixi

1 2 2

2 4 8

3 10 30

3,5 4 14

4 4 16

4,5 1 4,5

5 2 10

6 1 6

Razem 28 90,5

x =

∑k

i=1 n_ix_i

N = 90,5

28 = 3,23.

(16)

Średnia arytmetyczna

W szeregach rozdzielczych przedziałowych wartości cechy w każdej klasie nie są jednoznacznie określone, ale mieszczą się w pewnym przedziale. Możemy jednak przyjąć umowę, że

wartości cechy wewnątrz każdego przedziału rozłożone są

równomiernie, a wówczas środek przedziału jest jednocześnie średnią wartością cechy w danej klasie. Środek i-tego

przedziału klasowego oznaczamy przez .x^∘_i x∘_i = x_0i + x_1i

2

(17)

Średnia arytmetyczna

Jest to oczywiście pewne przybliżenie wartości cechy.

x =

∑k

i=1 n_ix^∘_i N .

Do obliczenia średniej ważonej dla szeregu rozdzielczego przedziałowego stosujemy wzór:

x_0i x^∘_i x_1i

⟨x0i, x_1i)

(18)

Przykład

W pewnym przedsiębiorstwie zatrudniającym 130 osób przeprowadzono badanie stażu pracy:

Staż pracy (w latach) (x0i — x1i)

Liczba pracowników (ni)

2 — 4 10

4 — 6 20

6 — 8 35

8 — 10 45

10 — 12 15

12 — 14 5

Razem 130

(19)

Przykład

Staż pracy (w latach) (x0i — x1i)

Liczba

pracowników (ni)

Środki przedziałów

klasowych

2 — 4 10 ( )3 30

4 — 6 20 5 100

6 — 8 35 7 245

8 — 10 45 9 405

10 — 12 15 11 165

12 — 14 5 13 65

Razem 130 — 1010

n_ix^∘_i x∘_i

x =

∑k

i=1 n_ix^∘_i

N = 1010

130 ≈ 7,77.

(20)

Średnia arytmetyczna

Jeśli zamiast liczebnościami (ni) dysponujemy wskaźnikami struktury (wi), to średnią wyznaczamy przy pomocy wzoru:

x = ∑^k

i=1

w_ix^∘_i albo wzoru

x =

∑k

i=1 w_ix^∘_i 100 ,

gdy wskaźniki struktury wyrażone są w procentach.

(21)

Własności średniej arytmetycznej

∙ x_min < x < x_max,

∙ ∑^N

i=1

(x_i − x) = 0, ∙ ∑^k

i=1

n_i(x_i − x) = 0,

∙ Nx = ∑^N

i=1

x_i, ∙ Nx = ∑^k

i=1

n_ix_i,

∙ Jeżeli wszystkie wartości cech powiększymy o pewną stałą, to średnia powiększy się o tą stałą.

(22)

Dominanta

Dominanta (wartość modalna, moda) jest to wartość, która w zbiorowości powtarza się najczęściej. Dominantę oznaczamy symbolem

D_o

Stosujemy ją wtedy, gdy chcemy za pomocą jednej liczby wyrazić wariant lub wartość cechy najbardziej typowy,

najczęściej spotykany.

Sposób wyznaczania dominanty zależy od typu szeregu

statystycznego, z którym mamy do czynienia. Dla szeregów szczegółowych lub rozdzielczych punktowych dominantę

wystarczy wskazać, gdyż jest to wartość o największej liczebności.

(23)

Przykład

W roku szkolnym 2017/2018 uczeń otrzymał następujące oceny: 2; 2; 3; 3; 3; 3,5; 3,5; 4; 4; 4,5; 4,5; 4,5; 4,5; 5; 5.

D_o = 4,5.

Oznacza to, że uczniowie najczęściej otrzymywali ocenę 4,5.

(24)

Przykład

Wyniki kolokwium ze statystyki w jednej z grup przedstawia poniższa tabela

D_o = 3.

Oznacza to, że najwięcej studentów otrzymało

ocenę dostateczną 3.

Ocena Liczba uczniów

2 4

3 10

3,5 4

4 4

4,5 1

5 2

Razem 25

(25)

Dominanta

W przypadku danych przedstawionych w postaci szeregu

rozdzielczego przedziałowego wiemy, która grupa dominuje na tle całości, ale nie wiemy, która wartość przedziału jest

rzeczywistą wartością dominującą. W takich przypadkach obliczamy tylko przybliżoną wartość dominanty:

D_o = x₀ + (n₀ − n₋₁)h₀

(n₀ − n₋₁) + (n₀ − n₊₁) ,

x₀ − dolna granica przedziału dominującego, n₀ − częstość przedziału dominującego,

n₋₁, n₊₁ − częstości przedziałów: poprzedzającego i następującego, h₀ − rozpiętość przedziału dominującego.

(26)

Dominanta

Aby wyznaczyć dominantę w przypadku szeregu rozdzielczego przedziałowego muszą być spełnione następujące warunki:

•

Musi występować jeden przedział klasowy z wyraźnie dominującą liczebnością w stosunku do pozostałych,

•

Przedział klasowy, w którym znajduje się dominanta oraz przedziały z nią sąsiadujące muszą mieć jednakowe

rozpiętości,

•

Szereg nie może być skrajnie asymetryczny z otwartym przedziałem dominującym.

(27)

Przykład

Wynagrodzenie miesięczne netto kadry kierowniczej dużego koncernu naftowego przedstawia poniższa tabela:

Wynagrodzenie miesięczne netto

w tys. Zł (x0i — x1i)

2 — 4 10

4 — 6 20

6 — 8 35

8 — 10 45

10 — 12 15

12 — 14 5

Razem 130

(28)

Przykład

Wynagrodzenie miesięczne netto

w tys. Zł (x0i — x1i)

2 — 4 10

4 — 6 20

6 — 8 35

8 — 10 45

10 — 12 15

12 — 14 5

Razem 130

x₀ = 8, n₀ = 45, n₋₁ = 35, n₊₁ = 15, h₀ = 10 − 8 = 2.

(29)

Przykład

x₀ = 8, n₀ = 45, n₋₁ = 35, n₊₁ = 15, h₀ = 10 − 8 = 2.

D_o = x₀ + (n₀ − n₋₁)h₀

(n₀ − n₋₁) + (n₀ − n₊₁) =

= 8 + (45 − 35) ⋅ 2

(45 − 35) + (45 − 15) =

= 8 + 20

40 = 8,5 tys. zł.

(30)

Mediana i pozostałe kwantyle

Mediana jest to wartość, która jest umieszczona dokładnie w środku, pod warunkiem, że mamy do czynienia z

uporządkowaną (z punktu widzenia badanej cechy)

zbiorowością według wielkości jej elementów, tzn. od ich wartości najmniejszej do największej.

Mediana dzieli zbiorowość na dwie równe części w ten

sposób, że połowa jednostek ma wartość cechy niższe lub równe medianie, a połowa ma wartości cechy większe lub równe od mediany.

Mediana zwykle jest oznaczana przez Me.

(31)

Mediana i pozostałe kwantyle

Sposób wyznaczania mediany zależy od rodzaju szeregu statystycznego, z którym mamy do czynienia.

Jeżeli informacje o wartościach cechy są przedstawione w

postaci danych indywidualnych (niepogrupowane), to w celu wyznaczenia mediany należy uporządkować informacje

rosnąco i ustalić, która z nich zajmuje miejsce środkowe.

Wartość tej cechy będzie wartością mediany.

50%

x_min x_max

50%

Me

(32)

Mediana i pozostałe kwantyle

W tym przypadku sposób wyznaczenia mediany zależy też od tego, czy liczba obserwacji jest parzysta czy nieparzysta.

•

N jest nieparzysta,

Me = x_(N+1)/2

•

N jest parzysta,

Me = x_N/2 + x_N/2+1 2

(33)

Przykład

Zapytano o wiek dwie grupy osób i otrzymano odpowiedzi:

•

Dla pierwszej grupy: 25, 32, 18, 22, 37 lat,

Me = x_(N+1)/2 = x₃ = 25

•

Dla drugiej grupy: 43, 24, 26, 29, 32, 41 lat.

Me = x_N/2 + x_N/2+1

2 = x₃ + x₄ 2

1 2 3 4 5

18 22 25 32 37

1 2 3 4 5 6

24 26 29 32 41 43

N = 5 N = 6

= 29 + 32

2 = 30,5

(34)

Mediana i pozostałe kwantyle

W sytuacji, gdy informacje o wartościach cechy

przedstawione są w postaci szeregu rozdzielczego punktowego medianę wyznaczamy na podstawie częstości (liczebności)

skumulowanych nisk w następujący sposób:

•

Wyznaczamy częstości skumulowane nisk,

•

Obliczamy numer mediany ze wzoru

Nr_Me = {N/2, gdy N jest parzyste,

(N + 1)/2, gdy N jest nieparzyste,

(35)

Mediana i pozostałe kwantyle

•

Wyznaczamy klasę, w której znajduje się mediana, tzn.

odszukujemy wartość numeru mediany NrMe wśród

częstości skumulowanych nisk. Jest to klasa o pierwszym numerze i, dla którego

•

Odczytujemy wartość mediany.

n_isk ⩾ Nr_Me .

(36)

Przykład

Wyniki klasówki w jednej z klas licealnych były następujące:

Nr_Me = (25 + 1)/2 = 13 ⩽ 14 = n_3sk, Me = 3.

Nr klasy Oceny xi

Liczba ocen (ni)

Częstości skumulowane

(nisk)

1 1 1 1

2 2 3 4

3 3 10 14

4 3,5 4 18

5 4 3 21

6 4,5 1 22

7 5 2 24

8 6 1 25

— Razem 25 —

(37)

Mediana i pozostałe kwantyle

Medianę w szeregu rozdzielczym przedziałowym wyznaczamy graﬁcznie lub analitycznie, korzystając ze wzoru:

Me = x₀ + h₀

n₀ (Nr^Me − n_isk−1), gdzie

x₀ - dolna granica przedziału zawierającego medianę, h₀ - rozpiętość przedziału mediany,

n₀ - częstość przedziału mediany,

n_isk−1 - częstość skumulowana przedziału poprzedzającego przedział mediany,

Nr_Me - numer mediany.

(38)

Przykład

Poniżej podane są dane dotyczące wydajności pracy pracowników pewnego przedsiębiorstwa. Wyznaczymy medianę tej wydajności.

Wydajność pracy w szt./godz.

x0i — x1i

Liczba

(nisk)

2 — 4 10 10

4 — 6 20 30

6 — 8 37 67

8 — 10 45 112

10 — 12 15 127

12 — 14 5 132

Razem 132 —

Nr_Me = N

2 = 132

2 = 66, 66 ⩽ 67.

(39)

Przykład

x0i — x1i

Liczba

(nisk)

2 — 4 10 10

4 — 6 20 30

6 — 8 37 67

8 — 10 45 112

10 — 12 15 127

12 — 14 5 132

Razem 132 —

Nr_Me = N

2 = 132

2 = 66, h₀ = 2, n₀ = 37, n_isk−1 = 30, Me = x₀ + h₀

n₀ (Nr^Me − n_isk−1) = 6 + 2

37 (66 − 30) = 7,95.

(40)

Przykład

Diagram częstości skumulowanych

Liczba pracowników

0 20 40 60 80 100 120 140

Wydajność pracy

2 4 6 Me 10 12 14

Nr mediany

(41)

Uwaga

Jeśli mamy dostęp tylko do danych o liczebnościach względnych wi, to w poniżym wzorze

Me = x₀ + h₀

n₀ (Nr^Me − n_isk−1), przyjmujemy:

x₀ - dolna granica przedziału zawierającego medianę, h₀ - rozpiętość przedziału mediany,

n₀ = w₀ - częstość względna przedziału mediany,

n_isk−1 = w_isk−1 - częstość skumulowana względna przedziału poprzedzającego przedział mediany,

Nr_Me = 50 - numer mediany.

(42)

Własności mediany

•

Może być ona wyznaczana w szeregach o otwartych przedziałach klasowych,

•

Można ją wyznaczać do opisania zbiorowości, których nie można określić liczbowo (do wyznaczenia mediany nie jest konieczna znajomość

wszystkich wartości cechy mierzalnej),

•

Jest jedyną średnią, którą można wyznaczyć dla rozkładów skrajnie asymetrycznych,

•

Nie jest wrażliwa na wartości skrajne (w przeciwieństwie do średniej arytmetycznej),

•

Może być wyznaczana w szeregach o nierównych rozpiętościach

przedziałów klasowych, tj. w sytuacji, kiedy niemożliwe jest wyznaczenie dominanty.

(43)

Kwantyle

Jeżeli konieczna jest bardziej szczegółowa analiza właściwości strukturalnych, oprócz mediany, która jest kwartylem

drugim, znajdują zastosowanie kwartyl pierwszy i trzeci.

Kwartyle należą do miar statystycznych zwanych kwantylami, które dzielą zbiorowość statystyczną w określonej proporcji.

Kwantyle

Kwartyle Q

Decyle D

Centyle (percentyle)

C

(44)

Pierwszy kwartyl Q 1

Dzieli zbiorowość na dwie części w ten sposób, że 25%

jednostek zbiorowości (czyli 1/4) ma wartości cechy niższe bądź równe wartości Q1, a 75% (czyli 3/4) — równe lub wyższe od wartości tego kwartyla.

x_min x_max

75%

Q₁

25%

(45)

Trzeci kwartyl Q 3

Dzieli zbiorowość na dwie części w ten sposób, że 75%

jednostek zbiorowości (czyli 3/4) ma wartości cechy niższe bądź równe wartości Q3, a 25% (czyli 1/4) — równe lub wyższe od wartości tego kwartyla.

x_min x_max

75%

Q₃

25%

(46)

Kwartyle

Kwartyle wyznaczamy w sposób analogiczny jak w

przypadku mediany, z tym że należy uwzględnić konkretny numer kwantyla.

W przypadku danych uporządkowanych rosnąco i

przedstawionych w postaci szeregu szczegółowego wartości kwartyla pierwszego i trzeciego możemy wyznaczyć przez podzielenie zbiorowości na dwie części: pierwszą, złożoną z jednostek nie większych od mediany i drugą, złożoną z

jednostek nie mniejszych od mediany. Mediana każdej z tych części jest odpowiednio kwartylem pierwszym i trzecim.

(47)

Przykład I

1 2 3 4 5 6 7 8 9 10 11 12

5 7 8 8 8 9 10 10 12 14 15 16

Me = 9,5

1 2 3 4 5 6

5 7 8 8 8 9

1 2 3 4 5 6

10 10 12 14 15 16

Q₁ = 8 + 8

2 = 8 Q₃ = 12 + 14

2 = 13

(48)

Przykład II

1 2 3 4 5 6 7 8 9 10 11 12 13 5 5 7 8 8 8 9 10 10 12 14 15 15

Me = 9

1 2 3 4 5 6 7

5 5 7 8 8 8 9

1 2 3 4 5 6 7

9 10 10 12 14 15 15

Q₁ = 8 Q₃ = 12

(49)

Kwartyle

Wyznaczenie kwartyla w przypadku danych przedstawionych w postaci szeregu rozdzielczego punktowego sprowadza się do odszukania numeru kwartyla w liczebnościach skumulowa-

nych.

Nr_Q₁ = {N/4, gdy N jest parzyste,

(N + 1)/4, gdy N jest nieparzyste, Nr_Q₃ = {3N/4, gdy N jest parzyste,

3(N + 1)/4, gdy N jest nieparzyste,

(50)

Przykład

Nr klasy Oceny

xi

(nisk)

1 1 1 1

2 2 3 4

3 3 10 14

4 3,5 4 18

5 4 3 21

6 4,5 1 22

7 5 2 24

8 6 1 25

— Razem 25 —

Nr_Q₁ = N + 1

4 = 25 + 1

4 = 6,5, 6,5 ⩽ 14 = n_3sk, Q₁ = 3.

(51)

Przykład

Nr klasy Oceny

xi

(nisk)

1 1 1 1

2 2 3 4

3 3 10 14

4 3,5 4 18

5 4 3 21

6 4,5 1 22

7 5 2 24

8 6 1 25

— Razem 25 —

Nr_Q₃ = 3(N + 1)

4 = 3(25 + 1)

4 = 19,5, 19,5 ⩽ 21 = n_5sk, Q₃ = 4.

(52)

Kwartyle

W przypadku materiału statystycznego przedstawionego w postaci przedziałowych szeregów rozdzielczych Q1 i Q3

wyznaczamy na podstawie wzorów:

Q₁ = x_Q₁ + h_Q₁

n_Q₁ (Nr^Q¹ − n_isk−1), Q³ = x_Q₃ + h_Q₃

n_Q₃ (Nr^Q³ − n_isk−1),

x_Q - dolna granica przedziału klasowego zawierającego Q, h_Q - rozpiętość przedziału kwartyla,

n_Q - częstość przedziału kwartyla,

n_isk−1 - częstość przedziału poprzedzającego przedział kwartyla, Nr_Q - numer kwartyla.

(53)

Przykład

x0i — x1i

Liczba

(nisk)

2 — 4 10 10

4 — 6 20 30

6 — 8 37 67

8 — 10 45 112

10 — 12 15 127

12 — 14 5 132

Razem 132 —

Nr_Q₁ = N

4 = 132

4 = 33, x_Q₁ = 6, h_Q₁ = 2, n_Q₁ = 37, n_isk−1 = 30.

Q₁ = x_Q₁ + h_Q₁

n_Q₁ (Nr^Q¹ − n_isk−1) = 6 + 2

37 (33 − 30) = 6,16.

(54)

Przykład

x0i — x1i

Liczba

(nisk)

2 — 4 10 10

4 — 6 20 30

6 — 8 37 67

8 — 10 45 112

10 — 12 15 127

12 — 14 5 132

Razem 132 —

Nr_Q₃ = 3N

4 = 3 ⋅ 132

4 = 99, x_Q₃ = 8, h_Q₃ = 2, n_Q₃ = 45, n_isk−1 = 67.

Q₃ = x_Q₃ + h_Q₃

n_Q₃ (Nr^Q³ − n_isk−1) = 8 + 2

45 (99 − 67) = 9,42.

(55)

Własności kwartyli

Należy zauważyć, że znajomość wartości Q1 i Q3 w

uporządkowanym szeregu pozwala nam na stwierdzenie, że połowa (50%) środkowych jednostek danej zbiorowości

statystycznej przyjmuje wartość od Q1 do Q3.

25%

x_min Me x_max

25% 25% 25%

Q₁ Q₃

50%

(56)

Kwantyle

Jeżeli zbiorowość jest bardzo liczna, może się okazać, że podział zbiorowości na ćwiartki jest niewystarczający.

Stosujemy wówczas decyle (dzielące zbiorowość na

subpopulacje dziesięcioprocentowe) lub percentyle (dzielące zbiorowość na subpopulacje jednoprocentowe).

10%

x_min x_max

90%

D₁

95%

x_min x_max

5%

C₉₅