Estymatory redniej i dyspersji.

(1)

Estymatory średniej i dyspersji.

Zakładamy, że w czasie doświadczenia otrzymaliśmy zestaw

n

wartości

zmiennej losowej

X

o pewnym rozkładzie prawdopodobieństwa

(gęsto-ści prawdopodobieństwa).

{

x

1

,

x

2

,

x

3

,...

x

n

}

Prawdopodobieństwo otrzymania dowolnej z tych wartości wynosi

)

(

x

_i

P

albo

dP

(

x

_i

,

x

_i

+

dx

)

=

p

(

x

_i

)

⋅

dx

odpowiednio dla zmiennej dyskretnej albo ciągłej.

Jeżeli możemy założyć, że kolejne wartości są niezależne, to prawdopo-dobieństwo otrzymania całego ich zestawu

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

wynosi

)

(

})

({

1 i n i i

P

x

P

=

∏

=

dla zmiennej dyskretnej albo

(

p

x

dx

)

x

dP

_i n i i

=

∏

⋅

=

(

)

})

({

1

dla zmiennej ciągłej. Prawdopodobieństwo to zależy od samych wartości

{

x

_i

}

i od postaci rozkładu prawdopodobień-stwa. Na przykład dla rozkładu normalnego

N

(

µ

,

σ

)

dx

x

dx

x

dP

i i i



⋅





















 −

−

=

+

2

1 exp

2

1 )

,

(

σ

µ

π

σ

prawdopodobieństwo będzie zależało od średniej i dyspersji tego rozkła-du.













⋅























 −

−

∏

=

dx

x

dP

i n i i 2 1

2

1 exp

2

1 })

({

σ

µ

π

σ

( )

dx

x

dP

n i n i i n i 1 1 2

2

1 exp

2

1 })

({

= =

∏

⋅























 −

−













=

∑

σ

µ

π

σ

Funkcja























 −

−













=

∑

= n i i n i

x

p

1 2

2

1 exp

2

1 )

,

};

({

σ

µ

π

σ

µ

ma sens funkcji rozkładu gęstości prawdopodobieństwa otrzymania ze-stawu wartości

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

.

(2)

Metoda największej wiarogodności

Wykonując pomiary nie znamy wartości mierzonej, tzn. nie znamy para-metrów

µ

i

σ

rozkładu

p

({

x

_i

};

µ

,

σ

)

i celem pomiarów jest ich wyzna-czenie. Możemy jednak przypuszczać, że to co się wydarzyło, to znaczy, że otrzymaliśmy zestaw konkretnych wartości

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

, było

naj-bardziej prawdopodobne. Zamiast zatem pytać jakie są faktyczne warto-ści parametrów

µ

i

σ

(na to pytanie zwykle nie można odpowiedzieć), możemy zapytać o coś innego.

Dla uproszczenia załóżmy jeszcze, że interesuje nas tylko wartość śred-nia, a dyspersję albo znamy skądinąd, albo nie jest nam potrzebna jej wartość.

To inne pytanie brzmi:

Dla jakiej wartości

µ

'

hipotetycznej średniej rozkładu otrzymanie

zestawu wartości

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

jest najbardziej prawdopodobne?

Czyli dla jakiej wartości

µ

'

funkcja























 −

−













=

∑

= n i i n

x

p

1 2

'

2

1 exp

2

1 )

'

(

σ

µ

π

σ

µ

osiąga maksimum przy ustalonych

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

i

σ

.

Na takie pytanie można odpowiedzieć, i to stosunkowo łatwo, chodzi bowiem o znalezienie maksimum funkcji jednej zmiennej.

Funkcja

p

(

µ

'

)

osiąga maksimum kiedy wartość sumy

2 1

'

∑

=











 −

n i i

x

σ

µ

jest minimalna. Oznacza to, że pochodna sumy przyjmuje wartość zero

0 '

'

2 1

=











 −

∂

_∑

= n i i

x

σ

µ

(3)

Pochodna wynosi

∑

= = =











 −

−

=











 −











 −

=











 −

∂

n i i n i i n i i

x

1 1 2 1

'

2

1 '

2 '

'

σ

µ

σ

µ

σ

µ

i osiąga zero gdy zeruje się suma

0 '

1

=











 −

∑

= n i i

x

σ

µ

σ

µ

₌

_⋅











 −

∑

=

0 '

1 n i i

x

0 '

1

=

−

∑

=

µ

n

x

n i i

czyli gdy

µ

'

jest równe średniej arytmetycznej wartości

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

∑

=

n i i

x

n

1

1 '

µ

Wartość

µ

'

jest estymatorem największej wiarogodności wartości

śred-niej rozkładu

N

(

µ

,

σ

)

.

Jeżeli

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

są wynikami bezpośrednich pomiarów wielkości

fizycznej

X

, to ich średnia arytmetyczna jest najlepszym oszacowaniem

wartości

X

. Oprócz szacunku samej wartości musimy podać też nie-pewność oszacowania, czyli pierwiastek wariancji

µ

'

. Oznaczmy ją

przez

V

(

µ

'

)

.













=

∑

x

i

n

V

(

µ

'

)

1

W celu obliczenia wartości prawej strony możemy wykorzystać wprowa-dzone poprzednio prawo przenoszenia niepewności (w istocie było to prawo przenoszenia wariancji, które dla naszych celów przekształciliśmy w prawo przenoszenia niepewności), a właściwie pewne specjalne wzory wyprowadzone z tego prawa.

( )

_∑

∑

_

⋅











=













i i

V

x

n

x

n

V

2

1

Jeżeli wartości

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

są niezależne, to

( )

2

)

(

=

⋅

σ

=

∑

x

V

x

n

V

_i _i

(4)

Ostatecznie

n

V

2 2 2

1 )

'

(

µ



⋅

σ

=

σ











=

Czyli wynik serii pomiarów mógłby wyglądać na przykład tak:

∑

=

n i i

x

n

X

1

1 µ

,

σ

n

X

u

(

)

=

1

. ♦

Załóżmy teraz, że znamy wartość średnią rozkładu

µ

, a chcielibyśmy znaleźć estymator dyspersji tego rozkładu

σ

'

.

Jeżeli

σ

'

ma być estymatorem największej wiarogodności, to tym razem

funkcja























 −

−













=

∑

= n i i n

x

p

1 2

'

2

1 exp

2 '

1 )

'

(

σ

µ

π

σ

ma osiągnąć maksimum ze względu na

σ

'

, czyli

0 )

'

(

'

=

∂

_σ

σ

p

0 '

2

1 exp

2 '

1 '

1 2

=



































 −

−













∂

_∑

= n i i n

x

σ

µ

π

σ

0 '

)

(

2 '

1

2 '

1

2 '

1

1 3 2 (...) (...) 2 1

=









−













+













−













_∑

= − − − _n i i n n

x

e

n

σ

µ

π

σ

π

σ

π

σ

0 '

)

(

2 '

1

2 '

1 '

1 3 2 (...) (...)

=









−













+























 −

_∑

= − − n i i n n

x

e

n

σ

µ

π

σ

π

σ

Po podzieleniu stronami przez

(...)

2 '

1

₋













n

_e

π

σ

otrzymujemy 2 1 3 2

'

0 '

)

(

'

σ

µ

σ



=

⋅







−

+











 −

_∑

= n i i

x

n

(5)

(

)

0 '

1 2 2

+

−

=

−

∑

= n i i

x

n

σ

µ

czyli

(

)

∑

=

−

=

n i i

x

n

1 2 2

1 '

µ

σ

(

)

∑

=

−

=

n i i

x

n

1 2

1 '

µ

σ

Estymatorem największej wiarogodności wariancji rozkładu

N

(

µ

,

σ

)

jest

2

'

σ

– średni kwadrat odchylenia wartości

{

x

₁

,

x

₂

,

x

₃

,...

x

_n

}

od wartości

średniej tego rozkładu, a estymatorem dyspersji jest

σ

'

.

Najczęściej nie znamy żadnego parametrów rozkładu i musimy je osza-cować tylko na podstawie uzyskanych wartości doświadczalnych

{

x

1

,

x

2

,

x

3

,...

x

n

}

.

Nie zmienia to sposobu wyznaczenia wartości

µ

'

i w dalszym ciągu

naj-lepszym estymatorem (w sensie metody największej wiarogodności) po-zostaje średnia arytmetyczna.

∑

=

n i i

x

n

1

1 '

µ

.

Do wyznaczenia estymatora dyspersji (albo wariancji) potrzebna jest znajomość wartości średniej rozkładu. Jeżeli użyjemy w tym celu warto-ści

µ

'

zamiast

µ

, to moglibyśmy zapisać

(

)

∑

=

−

=

n i i

x

n

1 2 2

'

1 '

µ

σ

.

Okazuje się jednak, że taki estymator jest obciążony, to znaczy, że war-tość średnia 2

'

σ

jest różna od

σ

2

. W statystyce dowodzi się, że 2 2

)

'

(

σ

<

σ

E

.

(6)

Rzeczywiście

(

)

_



=

_



(

−

+

−

)

_



=





₋

=

∑

= = n i i n i i

x

n

E

x

n

E

1 2 1 2 2

)

'

(

)

(

1 '

1 )

'

(

σ

µ

[

]

_



=





₋

=

∑

= n i i

x

n

E

1 2

)

'

(

)

(

1 _µ

_µ

[

]

_



=





₋

₊

₋

=

∑

= n i i i

x

n

E

1 2 2

)

'

(

)

'

)(

(

2 )

(

1 _µ

_µ

=









₋

₊

₋

=

∑

= = 2 1 1 2

)

'

(

1 )

(

1 )

'

(

2 )

(

1 _µ

_µ

n

x

n

x

n

E

n i i n i i

=









₋

₊

₋

=

∑

= 2 2 1 2

)

'

(

)

'

(

2 )

(

1

n

_µ

i i

x

n

E

=









₋

=

∑

= 2 1 2

)

'

(

)

(

1

n

_µ

i i

x

n

E

(

−

) (

−

)

=

∑

= 2 1 2

)

'

(

)

(

1 µ

µ

E

x

E

n

n i i

(

x

µ

)

2

) (

E

(

µ

'

µ

)

2

)

V

(

x

)

V

(

µ

'

)

E

_i

−

=

−

=

Czyli

( )

2 2

1

2

1

2

'

σ

n

E

=

−

=

−

i

(

)

∑

=

−

=

n i i

x

n

s

1 2 2

'

1

1 _µ

jest już nieobciążonym estymatorem wariancji.

Po uwzględnieniu ostatniego wzoru wynik pomiarów można by przed-stawić następująco:

∑

=

n i i

x

n

x

X

1

,

∑

(

)

−

=

n i i

x

n

X

u

1 2

)

1 (

1 )

(

.

(7)

Średnia ważona We wzorze

(

P

x

dx

)

x

dP

_i n i i

=

∏

⋅

=

(

)

})

({

1

wcale nie jest konieczne, żeby wszystkie

x

_i miały dokładnie takie same

rozkłady. Równie dobrze moglibyśmy zapisać

(

)

∏

=

⋅

=

n i i i i

p

x

dx

x

dP

1

)

(

})

({

a funkcja

∏

=

n i i i i

p

x

p

1

)

(

})

({

miałaby taką samą interpretację jak poprzednio. Załóżmy, że rozkłady



















 −

−

=

2

1 exp

2

1 )

,

;

(

i i i i i i

x

p

σ

µ

π

σ

µ

mają wszystkie tę samą wartość średnią i różne dyspersje.

Wtedy rozkład gęstości prawdopodobieństwa otrzymania ciągu wartości

{

x

1

,

x

2

,...

x

n

}

wyniesie



















 −

−

⋅









=

∏

∑

= = = n i i i n i _i n i i i i i

x

p

x

p

1 2 1 1

2

1 exp

2

1 )

,

;

(

})

({

σ

µ

π

σ

µ

.

Taki przypadek odpowiada sytuacji, kiedy kolejne wartości

{

x

₁

,

x

₂

,...

x

_n

}

wyznaczono niezależnie metodami różniącymi się precyzją scharaktery-zowaną różnymi wartościami

σ

_i.

(8)

Stosując metodę największej wiarogodności do wyznaczenia estymatora wartości średniej

µ

będziemy szukali maksimum funkcji



















 −

−

⋅









=

∏

∑

= = n i _i i n i i

x

p

1 2 1

'

2

1 exp

2

1 )

'

(

σ

µ

π

σ

µ

.

Podobnie jak poprzednio odpowiada to znalezieniu minimum sumy

∑

=







 −

n i i i

x

1 2

'

σ

µ

0 '

2 '

'

1 2 1 2

=







 −

−

=







 −

∂

_∑

= = n i _i i n i i i

x

σ

µ

σ

µ

Stąd

0 '

1 2 1 2



=







−









∑

= = n i _i n i _i i

x

σ

µ

σ

∑

= =









=









n i _i n i _i i

x

1 2 1 2

1 '

σ

µ

σ

i ostatecznie

(

)

( )

∑

= =

=

_n i i n i i i

x

1 2 1 2

1 '

σ

µ

W celu ustalenia wariancji tego estymatora obliczamy pochodne cząst-kowe:

(

)

( )

_∑

( )

∑

= = =

₌

∂

=

∂

n i i i n i i n i i i i i

x

1 2 2 1 2 1 2

1

1 '

σ

µ

i zgodnie z prawem przenoszenia wariancja wynosi

( )

∑ ∑

_[

_{( )}

_]

_∑

( )

∑ ∑

_

=











=

= = 1 2 2 2 2 1 2 2 2 2

1

1 )

'

(

i n i i i n i i i i

V

σ

µ

(9)

Niepewności względne

Może się zdarzyć, że znamy względne wartości

σ

_i nie znając przy tym ich wartości bezwzględnych. Wprowadzimy czynniki wagowe (wagi)

w

_i

i i

kw

σ

1 =

gdzie

k

jest pewną stałą. Znajomość względnych niepewności odpowia-da znajomości wartości wag

w

_i nawet jeżeli

σ

_i pozostają nieznane.

Wtedy

(

)

( )

(

)

( )

(

)

( )

∑

= = = = = =

₌

=

_n i i n i i i n i i n i i i n i i n i i i

w

x

w

kw

x

kw

x

1 1 1 1 1 2 1 2

1 '

σ

µ

W celu ustalenia wariancji tak obliczonej średniej wprowadzimy nową wielkość – średnią ważoną wariancję wyników

σ

2

1 '

1 )

'

(

2 2 ₂ 2

−









−

=

−

=

∑

n

w

x

w

n

w

x

w

i i i i i i

µ

σ

Wartość w nawiasie jest różnicą średniego ważonego kwadratu wyników i kwadratu średniej ważonej wyników. Pozostały czynnik uwzględnia fakt, że wartość

µ

'

została obliczona z tych samych wyników, zmniejszając

liczbę stopni swobody.

Przez analogię z wcześniej otrzymanymi związkami możemy zapisać, że wariancja

µ

'

wynosi









−

=

∑

2 2 2

'

1

1 )

'

(

µ

σ

µ

i i i

w

x

w

n

V

Jeżeli chcielibyśmy znaleźć nieznane dotąd wartości

k

i

σ

_i, to możemy

przyrównać

∑

=

i i

k

w

n

1

2 2

σ

(10)

czyli









−

=

∑

2 2 2

'

1

1 µ

σ

i i i i i

w

x

w

n

w

n

k

oraz i i i i

nw

w

kw

∑

=

2 2

1 σ

σ

Przykład

Studentka przeprowadza doświadczenie w celu określenia napięcia ogniwa normalnego. Wykonuje 40 pomiarów przy pomocy pewnego przyrządu i znajduje, że

V

0220

,

1

=

x

z odchyleniem standardowym

V

010 ,

0

1

=

s

Po przyjrzeniu się wynikom zauważa, że mogłaby ulepszyć układ pomia-rowy i zmniejszyć niepewność o czynnik 2,5

s

₂

=

0 ,

0040

V

. Wykonuje

kolejnych 10 pomiarów, które dają

V

0180

,

1

2

=

x

Średnia wyników wszystkich wykonanych pomiarów wynosi

(

)

( )

(

) (

)

( ) ( )

∑

= = = = = =

+

=

₄₀ 1 10 1 2 2 2 1 10 1 2 2 2 40 1 2 1 1 50 1 2 50 1 2

1

i i i i i i i i i i i

s

x

s

x

σ

V

25 ,

6

00 ,

4

018 ,

1

25 ,

6

022 ,

1

00 ,

4 V

004 ,

0

10

01 ,

0

40

004 ,

0

018 ,

1

10

01 ,

0

022 ,

1

40

2 2 2 2

+

⋅

+

⋅

=

+

⋅

+

⋅

=

1 ,

019561

V

Niepewność wartości średniej napięcia

V

000987

,

0

004 ,

0

10

01 ,

0

40 )

(

2 1 2 2



=











₊

=

−

x

u

(11)

Ostateczny wynik należy zapisać w formie

V

01956

,

1 =

x

,

u

(

x

)

=

0 ,

00099

V

lub alternatywnie

x

=

1 ,

01956

(

99 )

V

Niepewność końcowego wyniku jest mniejsza od niepewności uzyska-nych w każdej z części doświadczenia

V

0016

,

0 V

40

01 ,

0 )

(

x

₁

=

u

,

V

0 ,

0013

V

10

004 ,

0 )

(

x

₂

=

u

Co by było gdyby studentka nie znała bezwzględnych wartości niepew-ności swoich pomiarów, a tylko wiedziała (np. od prowadzącego zajęcia), że zostały zmniejszone w drugiej części o czynnik 2,5?

Średnią ważoną może obliczyć w taki sposób

1

2 1 1

=

s

w

, ₂ 2 2 2

2 ,

5

1 ₌

=

s

w

(

)

( )

40

1

10

2 ,

5 V

1 ,

01956

V

018 ,

1

5 ,

2

10

022 ,

1

40

2 2 1 1

=

⋅

+

⋅

+

⋅

=

∑

= = n i i n i i i

w

x

w

x

Niepewność średniej ważonej wyniesie wtedy













−

⋅

+

=









−

=

∑

= = 2 2 10 1 2 2 2 40 1 2 1 2 2

5 ,

2

10

40

5 ,

2

39

1

1 )

(

x

w

x

w

n

x

u

i i i i i i i

(12)

Przykład

Student wykonał 100 niezależnych pomiarów długości drewnianego klocka. Wyniki, po korekcie błędów systematycznych, mieszczą się w przedziale od około 18 do 22 cm i wiele z nich powtarza się. Na wykresie przedstawiono je w postaci histogramu (słupki narysowane cienką ciągłą linią) o szerokości przedziału 0,2 cm. Jeżeli obserwowany rozkład wyni-ka z błędów przypadkowych, to jest bardzo prawdopodobne, że da się opisać przy pomocy rozkładu Gaussa (normalnego). Rozkład narysowa-ny linia ciągłą odpowiada parametrom wyznaczonarysowa-nym z wyników pomia-rów: średnia 19,98 cm i odchylenie standardowe 0,54 cm.

18.00 19.00 20.00 21.00 22.00 długość zmierzona, cm 0 4 8 12 16 lic zb a p omi arów

Histogram z szarych słupków jest wyliczony z tego rozkładu normalnego i przedstawia oczekiwaną (średnią) liczbę pomiarów w każdym przedzia-le. Rozkład narysowany linią przerywaną odpowiada

N

(

20 ,

00 ;

0 ,

50 )

.

(13)

Usuwanie wyników odstających

Załóżmy, że wśród wyników zanotowanych przez studenta w karcie po-miarowej znalazł się jeden wyraźnie inny od pozostałych – 91,2 cm. Zwykle w takim przypadku nie ma wątpliwości, że nastąpiła pomyłka przy zapisywaniu wyniku i wynik odrzuca się jako tzw. błąd gruby. Sytu-acja wygląda jednak inaczej jeżeli odstający wynik wynosiłby np. 22,2 cm. Jeżeli w zestawie 100 wyników wartość 21,2 zastąpimy przez 22,2, to średnia i odchylenie standardowe zmienią się odpowiednio na 19,99 i 0,54. Odległość wyniku od średniej wynosi prawie 4 odchylenia standar-dowe. Z rozkładu Gaussa

N

(

19 ,

99 ;

0 ,

54 )

można wyliczyć, że

prawdo-podobieństwo przypadkowego pojawienia się rezultatu, który jest nie-mniej oddalony od średniej wynosi około 12⋅10-5, to znaczy że spodzie-wana liczba wyników ≥22,2 cm (lub ≤17,78 cm) wynosi 12⋅10-5 × 100 = 0,012. Czy tak mało prawdopodobny rezultat możemy odrzucić?

Kryterium Chauveneta

Odstający rezultat

x

₀ można odrzucić, jeżeli spodziewana liczba takich przypadków, że

|

x

−

x

|

≥

|

x

₀

−

x

|

5 ,

0 |)

|

(|

−

≥

₀

−

<

⋅

=

N

P

x

n

Kryterium Chauveneta należy stosować z dużą ostrożnością, mając pewność, że potrafimy poprawnie obliczyć prawdopodobieństwo