• Nie Znaleziono Wyników

Nieparametryczne testy statystyczne

N/A
N/A
Protected

Academic year: 2021

Share "Nieparametryczne testy statystyczne"

Copied!
59
0
0

Pełen tekst

(1)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

Testy statystyczne

cz.II

(2)
(3)
(4)

Test zgodności χ

χχχ

2

( Pearsona )

Mamy dany histogram empiryczny, o klasach niekoniecznie równej szerokości,

z liczebnościami klas:

n

1

+ n

2

+ ….. + n

k

= n

Testujemy hipotezę, że rozkład populacji generalnej przewiduje dla tych klas

prawdopodobieństwa:

p

1

, p

2

, ….., p

k

Liczymy wartość:

(5)

Test zgodności χ

χχχ

2

( Pearsona )

Uwagi dot. testowanego histogramu:

wartości

np

i

≥ 5 (również

n

i

), dla każdego

i

przy ilości klas k ≤ 3 –

npi

≥ 10

w tych przypadkach klasy małoliczne należy połączyć.

Jeśli do wyznaczenia

np

i

używaliśmy

m

parametrów estymowanych z próby,

to ilość stopni swobody ulegnie zmniejszeniu:

r = k – m – 1

(6)

Test zgodności χ

χχχ

2

( Pearsona )

Jeśli

to badana próba nie przeczy hipotezie

weryfikowanej na poziomie istotności

α

α

α

α

(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)

W ramach unowocześniania produkcji tabletów wprowadzono nowe klawiatury.

Dla partii 500 sztuk wykonano zestawienie ilości działających jeszcze bez żadnej

naprawy po upływie danego okresu:

po1 miesiącu

343

po 9 miesiącach

16

2

250

10

7

3

160

11

7

4

95

12

5

5

60

13

2

6

45

14

2

7

35

15

1

8

25

16

0

Czy można twierdzić, że czas bezawaryjnej pracy tabletu

jest zmienną losową o rozkładzie wykładniczym?

Zadanie 37-JM

(17)
(18)
(19)

Dane są dwa histogramy empiryczne, o tej samej ilości klas

k

z liczebnościami:

n

1,1

+ n

2,1

….. + n

k,1

= n

*,1

n

1,2

+ n

2,2

….. + n

k,2

= n

*,2

Testujemy hipotezę, że rozkłady obu populacji generalnych są jednakowe.

Jeśli jest ona prawdziwa, to zmienna

Test χ

χχχ

2

dla dwu rozkładów

(

)

=

=

k i i i i

n

n

n

n

n

n

n

1 *,1 *,2 ,* 2 2 , 1 *, 1 , 2 *, 2

χ

ma rozkład zdążający do

χχχχ

2

o

r = k – 1

stopniach swobody.

Obszar krytyczny prawostronny.

gdzie

n

i,*

= n

i,1

+ n

i,2

(20)

Gdy próby są równej liczebności, to poprzedni wzór upraszcza się:

i stosować go można, gdy

n

i,1

+ n

i,2

≥ 10

dla każdego

i.

Test χ

χχχ

2

dla dwu rozkładów

(

)

=

+

=

k i i i i i

n

n

n

n

1 ,1 ,2 2 2 , 1 , 2

χ

(21)
(22)
(23)

Test niezależności χ

χχχ

2

Mamy dwuwymiarowy histogram empiryczny

n

i,j

i = 1, …, k

j = 1, …, m

z łącznego rozkładu zmiennych losowych

x

i

y

.

Jednowymiarowe (brzegowe) histogramy oraz całkowita liczebność próby

dane są wzorami:

=

=

m j j i i

n

n

1 , ,*

∑∑

= =

=

k i m j j i

n

n

1 1 , *,*

=

=

k i j i j

n

n

1 , *,

(24)

Test niezależności χ

χχχ

2

Testujemy hipotezę o statystycznej niezależności zmiennych x i y.

Jeśli jest ona prawdziwa, to zmienna:





=

∑∑

=

=

k

i

m

j

i

j

j

i

n

n

n

n

1

1

,*

*,

2

,

*,*

2

1

χ

ma rozkład

χχχχ

2

o

r = (k-1)(m-1)

stopniach swobody.

W praktyce wystarcza, jeśli dla każdego

i

,

j

mamy

n

i,*

n

*,i

/ n

*,*

≥ 5

;

jeśli nie – możemy połączyć niektóre z klas.

(25)
(26)
(27)

Test χ

χχχ

2

dla wielu rozkładów

Test niezależności

χχχχ

2

może być stosowany do weryfikacji hipotezy,

że

m

histogramów

k

- klasowych pochodzi z takich samych populacji generalnych

– drugim wymiarem jest wówczas numer histogramu.

Dla

m = 2

(28)
(29)

Test dla dystrybuanty

zwany

(30)

Test Kołmogorowa

Test Kołmogorowa służy do testowania zgodności

dystrybuanty empirycznej z próby

n

– elementowej,

F

n

(x)

, z hipotetyczną,

F(x)

.

Zmienna testowa definiowana jest jako największe odchylenie

między

F(x)

a

F

n

(x)

:

)

(

)

(

max

F

x

F

x

D

n x n

=

Z nieciągłości

F

n

(x)

i monotoniczności

F(x)

wynika,

że wartości różnicy dystrybuant należy sprawdzić dla

x = x

1

, x

2

… x

n

λλλλ

= D

n

·

√√√√

n

Hipotezę odrzucamy, gdy

λλλλ

jest większa od wartości krytycznej (stablicowane).

Nie zaleca się wyznaczania

F

na podstawie histogramu.

(31)
(32)

Test Kołmogorowa

Niżej – analiza zadania:

(33)
(34)
(35)
(36)
(37)
(38)

Test dla dwu dystrybuant

zwany

(39)

Testem Kołmogorowa – Smirnowa

Test Kołmogorowa - Smirnowa służy do testowania hipotezy o jednakowości

dystrybuant w populacjach generalnych na podstawie dwu dystrybuant

empirycznych

F

n

(x)

i

F

m

(x)

indeksy oznaczają liczebności prób

.

Zmienna testowa definiowana jest:

)

(

)

(

max

,

F

x

F

x

D

n m x m n

=

wartości krytyczne

λλλλ

(obszar prawostronny) stablicowane dla niewielkich

n

i

m

.

Nie zaleca się wyznaczania

F

n

i

F

m

na podstawie histogramu.

n

D

n,

m

=

(40)
(41)
(42)

Test znaków

Test znaków jest szczególnym przypadkiem

testu dla frakcji

dla prawdopodobieństwa wyróżnienia elementu próby = 1/2.

Typowe zastosowanie –

wykrywanie współzależności statystycznej między wartościami zmiennej losowej x,

a kolejnością elementów w próbie – np. trendu czasowego.

Jeśli uporządkowana próba liczy

n + 1

elementów,

możemy utworzyć z nich

n

par:

(

x

1

, x

2

), (

x

2

, x

3

), … (

x

n

, x

n+1

)

Pary te dzielimy na

n

1

takich, gdzie

x

i

< x

i+1

i

n

2

= n – n

1

takich, gdzie

x

i

>

x

i+1

.

(43)

Test znaków

n

– elementowa próba, zawierająca

n

1

elementów wyróżnionych

używając testu frakcji

testujemy hipotezę

H

0

: prawdopodobieństwo wyróżnienia wynosi

1/2

.

Obszar krytyczny

będzie dwu- lub jednostronny,

w zależności od hipotezy alternatywnej

H

1

- jakikolwiek trend

- trend rosnący

- trend malejący.

(44)

J. Greń – 1/146

(45)

J. Greń – 1/146

(46)
(47)
(48)

Test serii

Mamy przemieszane elementy dwóch rodzajów,

n

elementów 1-szego i

m

- 2-go rodzaju;

stąd może być

r

serii (każda od 1-elementowej w górę):

(49)

Test serii

Jeśli przemieszanie jest całkowicie losowe, to

r

ma rozkład:





+









+













+









=

n

m

n

k

m

k

n

k

m

k

n

n

m

n

k

m

k

n

r

p

1

1

1

1

1

1

1

1

1

1

2

)

(

dla

r = 2k

dla

r = 2k + 1

w granicy (

n, m

→ ∞

, praktycznie dla

m, n ≥ 10

) dąży do rozkładu normalnego

o parametrach:

1

2

+

+

=

m

n

nm

µ

)

1

(

)

(

)

2

(

2

2

+

+

=

m

n

m

n

m

n

nm

nm

σ

(50)

Test serii

Hipotezę o losowości odrzucamy, gdy ilość serii jest podejrzanie mała (

r ≤ r(

α

α

α

α

)

)

α

α

α

α

– poziom istotności;

Gdy nie stosujemy rozkładu normalnego,

to

r(

α

α

α

α

)

można wyliczyć, jako największą wartość

r

, dla której jeszcze zachodzi

α

= r i

i

p

2

)

(

Krytyczne wartości

r(

α

α

α

α

)

są stablicowane;

Test ten jest wykorzystywany np.. do badania losowości próby,

podobnie jak test znaków.

(51)
(52)
(53)
(54)
(55)
(56)
(57)
(58)
(59)

Cytaty

Powiązane dokumenty

Cziczerin twierdził: „[…] nie rodzi się [człowiek – M.T.] jako abstrakcyj- na istota, korzystająca z nieograniczonej wolności i nie znająca żadnych obo- wiązków, lecz

Testuje się program w wybranych podzakresach danych, traktując je jako klasy danych wejściowych – testy dla każdej klasy przeprowadza się jedynie dla pewnych wybranych danych w

inter.) test

Na podstawie tych danych, na poziomie istotno±ci 0, 01, przetestuj hipotez¦, »e odsetek dorosªych Polaków, którzy nie przeczytali w ubie- gªym miesi¡cu »adnej ksi¡»ki wynosi

Stosu- jemy test F, test Browna-Forsytha, test Welcha, poprawiony test Welcha, test Cochrana, test Kruskala-Wallisa oraz procedury porównań wielokrotnych. Na podstawie różnych

W związku z tym hipotezę zerową odrzucamy, gdy istotność podawana przez pro- gram jest mniejsza niż deklarowany przez nas poziom istotności, a nie mamy podstaw do odrzucenia, gdy

Na podstawie tych danych, na poziomie istotności 0, 01, prze- testować hipotezę, ze odsetek dorosłych Polaków, którzy nie przeczytali w ubiegłym miesiącu żadnej książki wynosi

[r]