Testowanie jakoci dopasowania.

(1)

Testowanie jakości dopasowania.

Test

χ

2 jakości dopasowania

Metoda najmniejszych kwadratów opiera się na założeniu, że najlepszą funkcją opisującą zależność między wielkościami jest taka, która

minimalizuje ważoną sumę kwadratów odchyleń wartości

y

_i od dopasowywanej funkcji

y

(

x

_i

)

. Tę sumę można scharakteryzować wielkością wariancji dopasowania

s

2, która jest estymatorem wariancji danych

σ

2. Dla funkcji

y

(

x

_i

)

, liniowo zależnej od

m

parametrów i dopasowanej do

n

punktów, mamy:

( )

[

]

{

}

( )

_∑

( )

∑

[

]

∑

= = =

₌

₋

−

=

n i i i i n i i n i i i i

x

y

w

n

x

y

m

n

s

1 2 1 2 1 2 2 2

1 ₍

₎

1

1 )

(

1

1 ν

σ

gdzie czynnik

ν

=

n

−

m

jest liczbą stopni swobody dopasowania funkcji o

m

parametrach do

n

punktów, a czynniki wagowe dla każdego punktu wynoszą

( )

∑

=

_n i i i i

n

w

1 2 2

1

1 σ

σ

i są równe odwrotnościom wariancji

1 σ

_i2 opisującym niepewności pomiarowe dla tego punktu unormowanych do średniej z wszystkich czynników wagowych

(

∑

w

_i

=

n

)

.

Wariancja dopasowania jest również scharakteryzowana przez samą wartość

χ

2:

[

]

∑

=













₋

≡

n i i i i

x

y

1 2 2 2

1 ₍

₎

σ

χ

gdzie

)

(

)

(

1

∑

=

m j i j j i

a

f

x

y

Związek między

s

2 a

χ

2 najwyraźniej widać, jeżeli porównać

s

2 ze zredukowana

χ

_ν2:

(2)

2 2 2 2 ν i

s

σ

ν

χ

=

albo 2 2 2 i

s

σ

ν

χ

=

gdzie

σ

_i2 jest ważoną średnią indywidualnych wariancji:

1 2 2 2 2 2

1

−













=

























=

∑

i i i i i

n

σ

i jest równe

σ

2 w przypadku gdy wszystkie niepewności są jednakowe

σ

i

=

.

Wariancja

σ

2 charakteryzuje rozkład jakiemu podlegają wartości wielkości mierzonej – jest miarą rozrzutu wartości mierzonych – i nie może być miarą jakości dopasowania. Z drugiej strony estymator wariancji dopasowania

s

2 względem dopasowanej funkcji jest miarą rozrzutu zarówno samych danych jak i jakości dopasowania. Zatem określenie

χ

2 jako stosunku wariancji dopasowania

s

2 do wariancji samych danych

σ

2 pomnożonego przez liczbę stopni swobody robi z niej wygodną miarę jakości dopasowania.

Jeżeli dopasowana funkcja jest dobrym przybliżeniem rzeczywistej zależności, to wartość

s

2 powinna zgadzać się z wartością

σ

2, a

wartość zredukowana

χ

_ν2 powinna być około jedności, 2

1

ν

≈

χ

. Jeżeli dopasowana funkcja nie jest właściwa dla danych punktów, to różnice

)

(

_i

i

y

x

y

−

będą większe i większa będzie wariancja dopasowania dając wartość

χ

_ν2 większa od jedności. Wartość

χ

_ν2 mniejsza od 1 nie

oznacza koniecznie lepszego dopasowania – jest prostym

odzwierciedleniem faktu, że wartości

s

2 i

χ

_ν2 są też zmiennymi losowymi i fluktuują od jednej serii pomiarowej do drugiej. Bardzo mała wartość

2 ν

χ

może oznaczać pomyłkę przy ustalaniu niepewności wartości wielkości mierzonej.

(3)

W tablicach statystycznych można znaleźć wartości dystrybuanty rozkładu

χ

2 i obliczyć prawdopodobieństwo:

2 2 2

_;

₎

₍

_;

₎

(

2

dx

x

p

P

∫

∞

=

χ χ χ

χ

ν

,

że przypadkowy zestaw danych wylosowanych z rozkładu wyjściowego da wartość

χ

2 równą lub większą od danej.

W przypadku właściwego doboru funkcji i dobrego dopasowania doświadczalna wartość

χ

_ν2 powinna być bliska oczekiwanej

i prawdopodobieństwo

(

_χ

2

;

_ν

)

χ

P

powinno wynosić około 0,5. Gorsze dopasowanie da powiększoną wartość

χ

_ν2, a odpowiednie

prawdopodobieństwo będzie mniejsze.

Trzeba pamiętać o pewnej dwuznaczności

χ

_ν2, która jest zależna zarówno od danych pomiarowych i od wybranej funkcji, a zatem nawet właściwie dobrana funkcja może dać czasami dużą wartość

χ

_ν2.

(4)

Współczynnik korelacji liniowej

Dane pomiarowe składają się z par zmierzonych wartości wielkości fizycznych

{

x ,

_i

y

_i

}

. Zanim dopasujemy do nich funkcje liniową (lub jakąkolwiek inną), powinniśmy zapytać, czy między mierzonymi wielkościami w ogóle występuje jakaś zależność fizyczna.

Jeżeli założymy, że wielkość

Y

jest wielkością zależną, to chcielibyśmy wiedzieć, czy dane dają się przedstawić przy pomocy funkcji liniowej

b

x

a

y

=

+

Poprzednio otrzymaliśmy analityczne rozwiązanie dla najlepszej (w sensie metody minimalizacji

χ

2) parametru

a

, który jest

współczynnikiem kierunkowym dopasowanej funkcji

( )

2 2

∑

−

=

i i i i i i

x

n

y

x

y

x

n

a

(czynniki wagowe zostały opuszczone dla lepszej przejrzystości wzoru). Jeżeli wielkości

X

i

Y

są niezależne od siebie, to również niezależne i nieskorelowane są wyniki pomiarów. Nie powinniśmy obserwować żadnej tendencji wzrostu (lub zmniejszania się) wartości

y

wraz ze wzrostem

x

, a współczynnik kierunkowy

a

wyniesie 0.

Ponieważ interesuje nas wzajemna relacja między wielkościami

X

i

Y

, to równie dobrze możemy zapytać o zależność

'

y

b

a

x

=

+

.

W tym wypadku parametry

a

'

i

b

'

będą miały inne wartości (i wymiary), ale jeżeli dane są skorelowane, to powinien między nimi zachodzić jakiś związek. Dla parametru

a

'

można otrzymać rozwiązanie w postaci

(

)

2 2

'

∑

−

=

i i i i i i

y

n

y

x

y

x

n

a

i jeśli dane nie są skorelowane, to znowu współczynnik kierunkowy odwróconej zależności powinien wynosić

a

'

=

0

.

Jeżeli dane są zależne w sposób całkowicie jednoznaczny (całkowicie skorelowane), to powinien zachodzić związek

b

x

a

b

x

a

y

=

−

=

+

'

1

(5)

oraz równość współczynników

a

'

=

1 b

a

b

₌

−

'

.

W przypadku całkowitej korelacji

a

'

=

1

. Jeżeli nie ma żadnej korelacji, to oba współczynniki są zerami i związek powyżej w ogóle nie zachodzi. Jeżeli zdefiniujemy, jako miarę korelacji liniowej, wielkość

r

'

2

_a

r

≡

albo

( )

2 ₂

(

)

2 2

∑

−

∑

−

≡

i i i i i i i i

y

n

x

n

y

x

y

x

n

r

.

Współczynnik korelacji

r

przyjmuje wartości od 0, w przypadku braku korelacji, do ±1 przy całkowitej korelacji. Znak nie jest istotny dla istnienia korelacji, ważna jest natomiast wartość bezwzględna współczynnika.

Najczęściej istnienie korelacji testujemy porównując otrzymaną wartość

r

z rozkładem prawdopodobieństwa dla populacji, która jest całkowicie nieskorelowana. Porównanie daje nam informację, czy jest

prawdopodobne, że analizowane dane mogły zostać wylosowane z populacji nieskorelowanej. Jeżeli prawdopodobieństwo przypadkowego otrzymania wartości równej lub większej od

r

(lub równej lub mniejszej od

−

r

) jest niewielkie, to mamy prawo sądzić, że nasze dane są

skorelowane.

Współczynnik korelacji liniowej (w przypadku braku korelacji między zmiennymi) ma następujący symetryczny rozkład prawdopodobieństwa:

(

)

[

]

( )

2 (

1

2

)

( 2) 2

2

1

1 )

;

(

−

Γ

+

Γ

=

ν

π

ν

x

p

_r

Tablice statystyczne podają wartości prawdopodobieństwa dla

n

nieskorelowanych par wartości

(

) (

)

[

>

∪

<

−

]

=

_∫

−

=

2

1

(

;

2 )

)

;

(

r r c

r

n

P

x

r

x

r

p

x

n

dx

P

(6)

Przykład

1.

Dla danych liczbowych z przykładu pomiarów spadku napięcia wzdłuż drutu oporowego otrzymujemy

( )

2 ₂

(

)

2 2

∑

−

∑

−

=

i i i i i i i i

y

n

x

n

y

x

y

x

n

r

(

)

2

(

)

2

44 ,

12

32 ,

21

9

0 ,

450 28500

9

44 ,

12

0 ,

450

3 ,

779

9 −

×

−

×

−

×

=

0 ,

9994

W tablicach znajdujemy dla

n

=

9

wartość

P

c

(0,898; 9) = 0,001

.

Oznacza to, że.

P

c

(0,9994; 9) < 0,001

2.

Dla danych liczbowych z pomiarów liczby impulsów licznika G-M w funkcji odległości preparatu otrzymujemy:

(

)

2 ₂

(

)

2 2

∑

−

∑

×

∑

−

=

i i i i i i i i i i i i i i i i i i

y

w

y

w

x

w

x

w

y

w

x

w

y

x

w

r

( )

(

2

)

(

( )

2

)

y yy w x xx w y x xy w

S

−

×

−

=

(

)

(

2

)

(

( )

2

)

0 ,

10

0 ,

3693

03570

,

0 1868

,

0

912 ,

1 03570

,

0

0 ,

10 1868

,

0

02 ,

81 03570

,

0 −

×

−

×

−

×

=

0 ,

9938

Dla

n

=

10

w tablicach znajdujemy

001 ,

0 )

10 ;

872 ,

0 (

)

10 ;

9938

,

0 (

<

_c

=

c

P

.

W obu przykładach odpowiednie prawdopodobieństwa są na tyle małe, że z dużą pewnością możemy uznać istnienie korelacji między

(7)

Współczynniki korelacji liniowej między wieloma zmiennymi

Jeżeli zmienna zależna jest liniową funkcją więcej niż jednej zmiennej niezależnej,

!

+

=

0 1 i1 2 i2 3 i3 i

a

x

a

x

a

x

y

to możemy sprawdzać korelacje między

{ }

y

_i a każdą ze zmiennych niezależnych

{ }

x

_ij (pierwszy indeks oznacza numer pomiaru, a drugi zmiennej niezależnej). Nie ma znaczenia, czy

x

_ij są oddzielnymi zmiennymi, potęgami

x

_i, czy dowolnymi funkcjami

f

_j

( )

x

_i .

Wprowadzimy pojęcie kowariancji z próby

s

_jk:

(

)

(

)

[

]

∑

=

−

≡

n i k ik j ij jk

x

n

s

1

gdzie odpowiednie średnie wynoszą oczywiście:

∑

=

n i ij j

x

n

x

1

1 ∑

=

n i ik k

x

n

x

1

(wagi są pominięte, żeby nie komplikować formy wzorów).

Przy takim podejściu estymatorem wariancji z próby

j

-tej zmiennej jest

(

)

∑

=

−

=

≡

n i j ij jj j

x

n

s

1 2 2

1

Trzeba zwrócić uwagę, że wariancje z prób są miarą szerokości przedziałów zmienności odpowiednich zmiennych i nie maja nic wspólnego z niepewnościami, z jakimi mierzymy ich wartości.

(8)

Zauważmy, że

(

)

(

)

[

]

∑

=

−

≡

n i k ik j ij jk

x

n

s

1

1 (

)

∑

=

+

−

=

n i k j k ij ik j ik ij

x

n

1

1 (

)

∑

=

+

−

=

n i k j k ij ik j ik ij

x

n

1

1 







₋

₊

−

=

∑

= = = = n i k j n i k ij n i ik j n i ik ij

x

n

1

1 1 1 1

1 







₋

₊

−

=

∑

= = = = n i k j n i ij k n i ik j n i ik ij

x

n

1 1 1 1

1

1 







₋

₊

−

=

∑

=

n

x

n

x

n

x

n

j k k j j k n i ik ij

1









₋

−

=









₋

−

=

∑

∑ ∑

= = = = n i n i ik ij n i ik ij k j n i ik ij

x

n

x

n

x

n

x

n

1 1 1 1

1

Porównując to z wzorem definiującym współczynnik korelacji

( )

(

₂ 2

)

(

₂

(

)

2

)

∑

−

∑

−

=

i i i i i i i i

y

n

x

n

y

x

y

x

n

r

,

który po podzieleniu licznika i mianownika przez

n

przyjmuje postać

( )

(

₂ ₁ 2

)

(

₂ ₁

(

)

2

)

1

∑

−

∑

−

=

i n i i n i i i n i i

y

x

y

x

y

x

r

możemy przez analogię zapisać

k j jk jk

s

r

⋅

=

. jk

r

jest współczynnikiem korelacji liniowej z próby między dwoma dowolnymi zmiennymi

x

_j i

x

_k. Podobnie współczynnikiem korelacji między

j

-tą zmienną

x

_j a zmienną zależną

y

jest

y j jy jy

s

r

⋅

=

.

(9)

W szczególnym przypadku dopasowania wielomianu

∑

=

m k k k

x

a

x

y

0

)

(

,

kolejne zmienne

x

_j są potęgami zmiennej niezależnej

x

j

i ij

x

=

i współczynnik korelacji między zmienną zależną i

j

-tym składnikiem wielomianu wynosi y j jy jy

s

r

⋅

=

gdzie

























−

=

∑

= = 2 1 1 2 2

1

n i j i n i j i j

x

n

x

n

s

























−

=

∑

= = 2 1 1 2 2

1

n i i n i i y

y

n

y

n

s









₋

−

=

∑

∑ ∑

= = = n i n i i j i n i i j i jy

x

y

n

y

x

n

s

1 1 1

1

Jeżeli niepewności punktów pomiarowych nie są wszystkie jednakowe, to musimy uwzględnić odpowiednie wagi statystyczne w definicjach wariancji, kowariancji i współczynnika korelacji z próby. Wzory na wartości współczynników korelacji w formie

k j jk jk

s

r

⋅

=

pozostają niezmienione. Wzory na wariancje i kowariancje z próby muszą 9natomiast być zmodyfikowane:

(

)

(

)

∑

= =













₋

−

≡

_n i i n i k ik j ij i jk

n

x

n

s

1 2 1 2

1

1 σ

σ

(10)

(

)

∑

= =













₋

−

≡

_n i i n i j ij i jj j

n

x

n

s

1 2 1 2 2 2

1

1 σ

σ

.

Średnie

x

_j i

x

_k są też ważone

∑

= = =

=

_n i i n i i ij n i i ij j

x

w

x

n

x

1 2 1 2 1

1

1 σ

σ

unormowanymi czynnikami wagowymi równymi

( )

∑

=

_n i i i i

n

w

1 2 2

1

1 σ

σ