• Nie Znaleziono Wyników

test zgodnosci 2 serii danych

N/A
N/A
Protected

Academic year: 2021

Share "test zgodnosci 2 serii danych"

Copied!
15
0
0

Pełen tekst

(1)

1

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Test serii (test Walda-Wolfowitza)

Założenie. Rozpatrywane rozkłady są ciągłe.

Mamy dwa uporządkowane ciągi danych statystycznych

x1x 2 ... xn oraz y1y2 ... ym łączymy je w jeden

ciąg uporządkowany niemalejąco. W otrzymanym ciągu elementom z pierwszej sekwencji przyporządkowujemy 0 a elementom z drugiej sekwencji przyporządkowujemy 1. Obliczamy liczbę serii w otrzymanym ciągu zerojedynkowym.

(2)

2 Rozpatrujemy hipotezy:

H0(pobrane próbki pochodzą z populacji o tym samym

rozkładzie),

H1(pobrane próbki pochodzą z populacji o różnych

(3)

3

Serie to podciągi złożone z jednakowych symboli. Stosujemy statystykę:

Un,m = liczba serii

Zbiór krytyczny:

K = (-; k>

gdzie k odczytujemy z tablicy rozkładu serii dla poziomu istotności  i liczb n, m.

Decyzje:

Jeśli un,mK to H0 odrzucamy ,

(4)

4 Uwaga.

Gdy n i m są większe od 20, to statystyka Un,m ma w

przybliżeniu rozkład

 

             1 2 2 ; 1 2 2 m n m n m n nm nm m n nm N

W naszym przypadku skorzystamy z powyższej uwagi i dla pobranej próby obliczamy wartość

 

1

2 2 1 2 2 , *                m n m n m n nm nm m n nm u u m n Statystyka ta ma rozkład N(0, 1) Zbiór krytyczny: K = (-; -k>

gdzie k odczytujemy z tablicy dystrybuanty N(0, 1) dla poziomu istotności 

 

(5)

5

TEST MEDIANY

Mamy dwa uporządkowane ciągi danych statystycznych

x1x 2 ... xn oraz y1y2 ... ym (n ≤ m), łączymy je w

jeden ciąg uporządkowany niemalejąco i wyznaczamy medianę me.

Rozpatrujemy hipotezy:

H0(pobrane próbki pochodzą z populacji o tym samym

rozkładzie),

H1(pobrane próbki pochodzą z populacji o różnych

(6)

6

Tworzymy tablicę:

X

Y

n

i

>m

e

n

11

n

12

n

1

≤m

e

n

21

n

22

n

2

n

j

n

1

n

2

n+m

(7)

7

Na podstawie próby obliczamy wartość statystyki

(*)



 

2 1 2 1 2

ˆ

ˆ

i j ij ij ij n

n

n

n

u

(rozpatrywana statystyka ma rozkład Y

1

)

gdzie

(suma i tego wiersza) (suma j tej kolumny) ˆ liczebność próby i j ij n n n n m        

(8)

8

 - poziom istotności.

Zbiór krytyczny ma postać

K

 

k

;

) ;

gdzie

=

k)

(

Y

1

P

Jeśli

unK

to H

0

odrzucamy, w przeciwnym

(9)

9

Uwaga.

Dla tablicy korelacyjnej

1

2

1

A

B

A+B

2

C

D

C+D

A+C

B+D

n+m

Statystyka

Un

ma postać:

2

(

)(

)

(

)(

)(

)(

)

n

n m AD

BC

U

A B A C B

D C

D

i ma rozkład Y

1

.

(10)

10 Test Wilcoxona

Założenie. Rozpatrywane rozkłady są ciągłe.

Mamy dwa uporządkowane ciągi danych statystycznych

x1x 2 ... xn oraz y1y2 ... ym (n ≤ m), łączymy je w

jeden ciąg uporządkowany niemalejąco i nadajemy rangi.

Rozpatrujemy hipotezy:

H0(pobrane próbki pochodzą z populacji o tym samym

rozkładzie),

H1(pobrane próbki pochodzą z populacji o różnych

(11)

11 Stosujemy statystykę:

U = suma rang elementów z I próbki Zbiór krytyczny:

K = (-; k1>  < k2; )

gdzie k1 , k2 odczytujemy z tablicy rozkładu sumy rang

dla poziomu istotności  i liczb n oraz m, Decyzje:

Jeśli u K to H0 odrzucamy ,

(12)

12 Uwaga.

Gdy n i m są większe od 10, to suma rang elementów z I próbki ma w przybliżeniu rozkład

        12 1 ; 2 ) 1 (n m nm n m n N

W naszym przypadku skorzystamy z powyższej uwagi i dla pobranej próby obliczamy wartość

12 ) 1 ( 2 ) 1 ( *       m n nm m n n u u statystyki *

U , gdzie

u

jest wartością zmiennej losowej

U (suma rang elementów z I próbki).

Zbiór krytyczny:

K = (-; -k>  < k; )

gdzie k odczytujemy z tablicy dystrybuanty rozkładu N(0, 1) 2 1 ) (  

 k .

(13)

13 Uwaga o decyzji.

Wyznaczamy liczbę

ˆ

(krytyczny poziom istotności) spełniającą równość

2 ˆ *    u n X P , gdzie X ~ N(0, 1). Podejmujemy decyzję:

nie ma podstaw do odrzucenia hipotezy H0, gdy

ˆ

jest istotnie większe od zera (standardowo

większe od 0,05) odrzucamy hipotezę H0, gdy

ˆ

(14)

14

Test (sumy rang) Kruskala-Wallisa Jest to uogólnienie testu Wilcoxona.

Założenie. Rozpatrywane rozkłady są ciągłe.

Rozpatrujemy m cech w m populacjach o rozkładach wyznaczonych przez dystrybuanty F1, F2, ..., Fm.

Mamy m ciągów danych statystycznych o liczebnościach ni, (n1 + n2 + ... + nm = n), łączymy je w

jeden ciąg uporządkowany niemalejąco i nadajemy rangi.

Rozpatrujemy hipotezy: H0(F1 = F2 = ... = Fm),

(15)

15

Niech Ti - suma rang w poszczególnych próbach.

Stosujemy statystykę:

)

1

(

3

)

1

(

12

1 2

n

n

T

n

n

u

m i i i

dla

ni

≥ 20 rozpatrywana statystyka ma rozkład

Y

m-1.

Zbiór krytyczny:

K = <k; )

Decyzje:

Jeśli u  K to H0 odrzucamy ,

Cytaty

Powiązane dokumenty

Struna o długości 100 cm jest zaczepiona na obu końcach i rozchodzi się w niej fala stojąca.. When the string is also clamped at its midpoint, the lowest

Bracia, zaklinamy was przez ową przeogromną miłość, której mle- kiem jesteśmy karmieni, której chlebem jesteśmy umacniani, zaklinamy przez chrystusa naszego Pana, przez

All in all, low values

There are three peaks present in both figures ( Fig. The first is free driving, for which there is no car-following or lane changing, therefore the TS is very low, near to zero.

5 Relationship between tensile strength and Edyn measured by using LV method and calculated with the individual (a) and average density (b) for European ash (Fraxinus

In this study, brightness temperature (TB) observations or soil moisture re- trievals from the NASA Soil Moisture Active Passive (SMAP) mission and land surface temperature

of competitors on knowledge sharing within coupled innovation projects; finding different project structures that use different formal and informal mechanisms are important and

To build integrated transport infrastructure and public space systems with con- sidering non-motorized travelers’ behavior, we present an integrated methodology incorporating