Praca domowa #1 z SAD – przykładowe rozwiązania

(1)

Praca domowa #1 z SAD – przykładowe rozwiązania

Zadanie 1:

Obserwujemy dwie niezależne próby losowe (X1, . . . , Xn), (Y1, . . . , Ym). Wiadomo, że Xi∼ N (2µ, 1) oraz Y_i∼ N (µ, 1).

• Wyznaczyć Metodą Największej Wiarogodności estymator parametru µ (korzystając z obydwu prób).

Czy otrzymany estymator jest nieobciążony?

• Wyznaczyć ryzyko (średni błąd kwadratowy – MSE) uzyskanego estymatora.

Rozwiązanie: Gęstość zmiennej losowej X ma postać ^√¹_2π · exp(−¹₂(x − 2µ)²), a gęstość zmiennej Y:

√1

2π · exp(−¹₂(y − µ)²).

Zapiszmy funkcję wiarogodności:

L(x₁, . . . , x_n, y₁, . . . , y_m, µ) =

1

√2π

n+m

exp

−1 2

n

X

i=1

(x_i− 2µ)²

exp

−1 2

m

X

i=1

(y_i− µ)²

Znajdźmy µ, dla którego otrzymane wyniki są najbardziej prawdopodobne. Funkcja L przyjmuje maksimum w tym samym punkcie co ln(L) =: l.

l(x₁, . . . , x_n, y₁, . . . , y_m, µ) = −n + m

2 ln(2π) − 1 2

n

X

i=1

(x_i− 2µ)²−1 2

m

X

i=1

(y_i− µ)²

Policzmy pochodną l po µ i znajdźmy µ, dla którego się ona zeruje.

∂l

∂µ(x1, . . . , xn, y1, . . . , ym, µ) = −1 2

n

X

i=1

2(xi− 2µ) · (−2) −1 2

m

X

i=1

2(yi− µ) · (−1) =

=

n

X

i=1

2 x_i− 2µ +

m

X

i=1

y_i− µ =

n

X

i=1

2x_i+

m

X

i=1

y_i− µ · (4n + m) Zatem:

∂l

∂µ(x1, . . . , xn, y1, . . . , ym, µ) = 0 ⇐⇒ µ = 1 4n + m

n

X

i=1

2xi+

m

X

i=1

yi

Dostajemy więc wzór estymatora parametru µ:

1 4n + m

n

X

i=1

2x_i+

m

X

i=1

y_i

=: ˆµ.

Czy l ma maksimum w ˆµ (czyli czy ˆµ = MLE(µ))? Tak, bo:

∂²l

∂²µ(x₁, . . . , x_n, y₁, . . . , y_m, µ) = −(4n + m) < 0dla każdego µ, w tym dla ˆµ.

(2)

Czy jest on nieobciążony? Tak, bo:

E(ˆµ) = 1 4n + mE

2

n

X

i=1

X_i+

m

X

i=1

Y_i

= 2n · 2µ + m · µ

4n + m = 4n + m 4n + mµ = µ.

Wyznaczmy ryzyko estymatora ˆµ.

M SE(ˆµ) = E

1

4n + m(

n

X

i=1

2Xi+

m

X

i=1

Yi) − µ

2

=

= E

1

(4n + m)²

n

X

i=1

2X_i+

m

X

i=1

Y_i

2

− 2µ 4n + m

n

X

i=1

2X_i+

m

X

i=1

Y_i

+ µ²

=

= µ²− 2µ 4n + mE

ⁿ X

i=1

2Xi+

m

X

i=1

Yi

+ 1

(4n + m)²E

4

ⁿ X

i=1

Xi

2

+ 4

n

X

i=1

Xi m

X

i=1

Yi+

^m X

i=1

Yi

2

=











X, Y niezależne ⇒

E(XiYj) = E(Xi)E(Yj) ∀i,j

podobnie dla i 6= j E(X_iX_j) = E(X_i)E(X_j)











=

= µ²−2µ²(4n + m)

4n + m +4 · 2µ²nm

(4n + m)²+4 · (2µ)²n(n − 1) + µ²m(m − 1

(4n + m)² + 1

(4n + m)²

4E

n

X

i=1

X_i²

+E

m

X

i=1

Y_i²

=

= µ²

1−8n + 2m

4n + m + 8nm

(4n + m)²+16n²− 16n + m²− m (4n + m)²

+ 1

(4n + m)²

4n(V ar(X)+(2µ)²)+m(V ar(Y )+µ²)

=

= µ²

1 −8n + 2m

4n + m +16n²− 16n + 8nm + m²− m + 16n + m (4n + m)²

+ 4n + m (4n + m)² =

= µ²

1 −8n + 2m

4n + m +(4n + m)² (4n + m)²

+ 4n + m

(4n + m)² = 1 4n + m

(3)

Zadanie 2:

Niech (X1, . . . , X_n) będą niezależnymi zmiennymi losowymi o takim samym rozkładzie o gęstości postaci:

f_λ(x) = 1

2λ³x²e⁻^x^λ, x > 0, λ > 0 .

• Wyznacz estymator Metodą Największej Wiarogodności nieznanego parametru λ.

• Wiedząc, że wartość oczekiwana wynosi EXi = 3λ, sprawdź, czy otrzymany estymator jest estymatorem nieobciążonym.

• Wyznacz ryzyko (średni błąd kwadratowy, MSE) dla otrzymanego estymatora. Czy otrzymany estymator jest zgodny? (Obserwacja: dla estymatorów zgodnych limn→∞M SE(θ) → 0)

Rozwiązanie:

część 1, wartość estymatora:

Funkcja wiarogodności to iloczyn gęstości prawdopodobieństw:

L(X₁, ..., X_n, λ) = 1

2λ³X₁²e⁻^X1^λ · ... · 1

2λ³X_n²e⁻^Xn^λ = (1)

= 1

(2λ³)ⁿ· X₁²· ... · X_n²· e⁻^X1^λ · ... · e⁻^Xn^λ = (2)

= 1

(2λ³)ⁿ· X₁²· ... · X_n²· e⁻^X1^λ ^−...−^Xn^λ (3) Jako, że funkcja wiarogodności jest ściśle dodatnia oraz funkcja logarytm jest monotoniczna, rosnąca, okre- ślona na wartościach dodatnich, to aby znaleźć maksimum funkcji wiarogodności można znaleźć maksimum jej logarytmu:

ln L(X₁, ..., X_n, λ) = −n ln(2λ³) + 2 ln X₁+ ... + 2 ln X_n−X₁+ ... + X_n

λ = (4)

ln L(X₁, ..., X_n, λ) = −3n ln λ − n ln 2 + 2 ln X₁+ ... + 2 ln X_n−X₁+ ... + X_n

λ (5)

Ekstremum funkcja gładka osiąga tam, gdzie pochodna się zeruje więc obliczmy pierwszą pochodną logarytmu naturalnego L po λ:

∂ ln L

∂λ = −3n1

λ− 0 + 0 + ... + 0 − (X₁+ ... + X_n)(−λ⁻²) = (6)

= −3n

λ +X₁+ ... + X_n

λ² (7)

i przyrównajmy tę pochodną do 0:

X₁+ ... + X_n λ² − 3n

λ = 0 (8)

(4)

X1+ ... + Xn

λ² − 3nλ

λ² = 0 (9)

X1+ ... + Xn− 3nλ

λ² = 0 (10)

X₁+ ... + X_n− 3nλ = 0 (11)

X1+ ... + Xn= 3nλ (12)

X1+ ... + Xn

3n = λ (13)

Czyli nasz kandydat na estymator to:

λ_n= X₁+ ... + X_n

3n (14)

Teraz musimy sprawdzić, czy dla tej wartości druga pochodna logarytmu jest ujemna:

∂²ln L

∂λ² = ∂

∂λ((X₁+ ... + X_n)λ⁻²− 3nλ⁻¹) = (15)

= (X₁+ ... + X_n)(−2)λ⁻³− 3n(−1)λ⁻²= (16)

=

−2(X₁+ ... + Xn)1 λ+ 3n

1

λ² = (17)

=

3n − 2(X₁+ ... + X_n) 3n X₁+ ... + X_n

(3n)²

(X₁+ ... + X_n)² = (18)

= (3n − 6n) (3n)²

(X1+ ... + Xn)² = (19)

= −3n (3n)²

(X₁+ ... + X_n)² = (20)

= − (3n)³

(X₁+ ... + X_n)² (21)

n jest liczbą naturalną dodatnią więc (3n)³ jest dodatnie, mianownik to liczba rzeczywista podniesiona do kwadratu, czyli również jest dodatnia (X1, ..., Xn są dodatnie, czyli ich suma też). Jako, że licznik i mianownik są dodatnie a przed całością jest minus to druga pochodna rzeczywiście jest ujemna, czyli dla λ_nfunkcja wiarogodności przyjmuje maksimum.

(5)

część 2, obciążenie estymatora:

Chcemy wyznaczyć obciążenie estymatora, to znaczy różnicę pomiędzy wartością oczekiwaną estymatora Eλn a wartością estymowaną λ:

b(λ_n) = Eλn− λ = (22)

= E X1+ ... + Xn

3n

− λ = (23)

= EX1+ ... + EXn

3n − λ = (24)

=

n

z }| {

3λ + ... + 3λ

3n − λ = (25)

= 3nλ

3n − λ = λ − λ = 0 (26)

czyli obciążenie naszego estymatora wynosi 0, to znaczy ten estymator jest nieobciążony.

część 3, średni błąd kwadratowy:

Średni błąd kwadratowy to wartość oczekiwana kwadratu różnicy między estymatorem a wartością estymo- waną:

MSE(λ_n) = E(λn− λ)² = (27)

= E(λ²n− 2λ_nλ + λ²) = (28)

= Eλ²n− 2E(λnλ) + Eλ² = (29)

= Eλ²n− 2EλnEλ + Eλ² = (30)

= Eλ²n− 2λ²+ λ²= (31)

= Eλ²n− λ²= (32)

= E X₁+ ... + X_n 3n

2

− λ² = (33)

(6)

= 1

(3n)²E (X1+ ... + X_n)²− λ² = (34)

= 1

(3n)² nEXi²+ n(n − 1)E(XiX_j) − λ²= (35)

= nEX_i²

(3n)² +n(n − 1)E(XiX_j)

(3n)² − λ² (36)

Teraz w ramach rachunków pomocniczych obliczmy wartość oczekiwaną X_i²:

EXi²= Z ∞

0

x² 1

2λ³x²e⁻^x^λdx (37)

oraz możemy przy okazji obliczyć wartość oczekiwaną Xi:

EXi = Z ∞

0

x 1

2λ³x²e⁻^λ^xdx (38)

Wykonajmy najpierw dodatkowe rachunki ogólne:

I(a, λ, m, n) = Z ∞

0

a 1

λ^mxⁿe⁻^x^λdx = (39)

= Z ∞

0

a 1 λ^mxⁿ

−λe⁻^λ^x0

dx = (40)

=

−a 1

λ^m−1xⁿe⁻^x^λ

∞ 0

− Z ∞

0

an 1

λ^mxⁿ⁻¹

−λe⁻^x^λ

dx = (41)

= [0 − 0] + Z ∞

0

an 1

λ^m−1xⁿ⁻¹e⁻^λ^xdx = (42)

= Z ∞

0

an 1

λ^m−1xⁿ⁻¹e⁻^x^λdx = I(an, λ, m − 1, n − 1) (43) Oprócz tego musimy jeszcze obliczyć:

I(a, λ, m, 0) = Z ∞

0

a 1

λ^me⁻^x^λdx = (44)

= a λ^m

h

−λe⁻^λ^xi∞

0 = a

λ^m−1[0 − (−1)] = a

λ^m−1 = a · λ^1−m (45)

Wracając do naszych wartości oczekiwanych:

EXi = Z ∞

0

1

2λ³x³e⁻^x^λdx = I 1 2, λ, 3, 3

= (46)

= I 3 2, λ, 2, 2

= I 3 · 2 2 , λ, 1, 1

= I 3 · 2 · 1 2 , λ, 0, 0

= 3λ¹= 3λ (47)

(7)

co jest zgodne z treścią zadania, teraz pora na:

EXi²= Z ∞

0

1

2λ³x⁴e⁻^x^λdx = I 1 2, λ, 3, 4

= (48)

= I 4 2, λ, 2, 3

= I (2, λ, 2, 3) = I (2 · 3, λ, 1, 2) = (49)

= I (2 · 3 · 2, λ, 0, 1) = I (2 · 3 · 2 · 1, λ, −1, 0) = I (12, λ, −1, 0) = (50)

= 12λ¹⁻⁽⁻¹⁾ = 12λ² (51)

Teraz możemy wrócić do obliczania średniego błędu kwadratowego:

MSE(λ_n) = nEX_i²

(3n)² +n(n − 1)E(XiXj)

(3n)² − λ² = (52)

= EX_i²

9n +(n − 1)EXiEXj)

9n − λ² = (53)

= 12λ²

9n + (n − 1)3λ3λ

9n − λ² = (54)

= 4λ²

3n +(n − 1)λ²

n − λ² = (55)

= 4λ² 3n +nλ²

n −λ²

n − λ² = (56)

= 4λ²

3n + λ²−3λ²

3n − λ² = (57)

= 4λ² 3n −3λ²

3n = (58)

= MSE(λ_n) = 4λ²− 3λ² 3n = λ²

3n (59)

Znamy już średni błąd kwadratowy estymatora największej wiarogodności, pozostaje pytanie czy jest on zgodny? Sprawdźmy granicę tak jak w poleceniu:

n→∞lim MSE(λ_n) = lim

n→∞

λ²

3n = 0 (60)

czyli rzeczywiście ten estymator jest zgodny.

(8)

Zadanie 3:

Mamy sześciościenną kostkę do gry, przy czym nie znamy prawdopodobieństwa wypadnięcia 6, oznaczo- nego przez p. W celu oszacowania p rzucamy kostką dopóki nie wypadnie 6 i przez Y oznaczamy liczbę wykonanych rzutów. Jednak jeśli w pierwszych k rzutach nie wypadła 6 to przerywamy eksperyment i Y = k + 1.

• Na podstawie n niezależych powtórzeń powyższego eksperymenty wyznacz estymator Metodą Naj- większej Wiarogodności parametru p.

• Sprawdź, czy podany estymator jest estymatorem nieobciążonym

• Wyznacz ryzyko (średni błąd kwadratowy, MSE) dla otrzymanego estymatora. Czy otrzymany estymator jest zgodny? (Obserwacja: dla estymatorów zgodnych limn→∞M SE(θ) → 0)

Rozwiązanie: W dalszej części zadania będe używał, że p ∈ (0, 1), tzn kiedy pisze nierówność na p mam na myśli w dziedzinie określoności.

Z treści zadania wiemy że Y ma następujący rozkład:

P (Y = s) = p(1 − p)^s−1 dla s ∈ {1, ..., k}.

P (Y = k + 1) = 1 −Pk

i=1p(1 − p)ⁱ = (1 − p)^k. Stad nasza funkcja wiarygodności ma postać:

L(Y1, ..., Yn, p) = P (Y1= y1, ..., Yn= yn) =(z niezależności) = P (Y1= y1) ∗ ... ∗ P (Yn= yn) = A.

Nasze zmienne losowe mają wyszczególnione prawdopodobieństwo dla k + 1, stąd załóżmy, że ten wynik uzyskaliśmy w (BSO 0 ≤ w ≤ n) ”w” ostatnich próbach. Wiedząc to podstawiamy i otrzymujemy:

A = p(1 − p)^y¹⁻¹∗ ... ∗ p(1 − p)^y^n−w⁻¹∗ ((1 − p)^k)^w.

Niech G(p) = Ln(L(Y1, ..., Yn, p)). Oczywiście, ponieważ logarytm jest funkcja ściśle rosnącą to G(p) przyjmuje maksimum w p0 ⇐⇒ funkcja L(Y1, ..., Y_n, p) przyjmuje maksimum w p0.

Podstawiając do definicji funkcji G dane otrzymujemy:

G(P ) = (n − w)ln(p) + (Pn−w

i=1 (yi− 1))ln(1 − p) + (kw)ln(1 − p). Teraz liczymy pochodną funkcji G.

∂G

∂p = ^n−w_p −⁽

Pn−w

i=1 (yi−1))+kw

Chcemy policzyć maksimum stąd z lematu Fermata pochodna, (o ile funkcja jest różniczkowalna jak w1−p

naszym przypadku), zeruje się w punkcie przyjmowania maksimum. Po przyrównaniu do 0 dostajemy:

∂G

∂p = 0 ⇐⇒ p = ^n−w

kw+Pn−w i=1 (yi).

Pozostaje sprawdzić czy jest to maksimum. Zauważmy, że:

∂G

∂p > 0 ⇐⇒ p < ^n−w

kw+Pn−w i=1 (yi)

∂G

∂p < 0 ⇐⇒ p > ^n−w

kw+Pn−w i=1 (yi)

Czyli pochodna zmienia znak z czego wnioskujemy że punkt p = _kw+^P^n−wn−w

i=1 (yi) jest maksimum. Stąd nasze wyliczone p jest dokładnie szukanym parametrem największej wiarygodnosci.

(9)

Zadanie 4:

Niech X1, ..., X_n będzie próbą prostą z rozkładu Poissona o intensywności θ P (Xi= x) = θ^x

x!e^−θ

• Znajdź ˆθ estymator Metodą Największej Wiarogodności parametru θ.

• Oblicz obciążenie oraz wariancję estymatora ˆθ, uzyskanego w poprzednim podpunkcie.

• Jak duże powinno być n, żeby błąd średniokwadratowy dla θ = 1 był mniejszy niż 0, 01, gdzie M SE(θ) = E_θ[(θ − ˆθ)²].

Rozwiązanie:

Zmiennne losowe X1, ..., X_n są niezależne bo pochodzą z próby prostej, więc L(X₁, ..., X_n, θ) =

n

Y

i=1

P (X_i|θ) =

n

Y

i=1

θ^Xⁱ

X_i!e^−θ = θ^Pⁿⁱ⁼¹^Xⁱ Qn

i=1X_i!e^−θn log(L(X₁, ..., X_n, θ)) = log(θ)

n

X

i=1

X_i − θn −

n

X

i=1

log(X_i) Teraz jeszcze pochodna dla znalezienia ekstremum:

∂l(X₁, ..., X_n, θ)

∂θ =

Pn i=1X_i

θ − n = 0

⇔ θ = Pn

i=1X_i

n = X

Czy to maksimum?

∂²l(X₁, ..., X_n, θ)

∂θ² = −

Pn i=1X_i

θ² < 0 Więc ˆθ = X

Zmiennne losowe X1, ..., X_nmają rozkład Poissona z parametrem θ więc E(Xi) = θ i V ar(X_i) = θ dla każdego i

E(θ) = E(ˆ Pn

i=1X_i n ) = 1

nE(

n

X

i=1

X_i) = 1 n

n

X

i=1

E(Xi) = 1

nnE(X1) = θ Czyli estymator ˆθ jest nieobciążony, więc jego obciążenie wynosi 0.

V ar(ˆθ) = V ar(

Pn i=1X_i

n ) = 1 n²V ar(

n

X

i=1

X_i) = 1

n²nV ar(X₁) = θ n

E[(θ −θ)ˆ²] = E[θ²− 2θ ˆθ + θ²] = E[θ²] − 2E[θ ˆθ] + E[ˆθ²] =

= E[1] − 2E[ˆθ] + V ar[ˆθ] + (E[ˆθ])² = 1 − 2 + θ

n + 1² = θ n = 1

n 1

n < 0.01 ⇔ n > 100

(10)

Zadanie 5:

Niech X1, ..., X_n będzie próbą prostą z rozkładu Pareto o parametrach a > 0, θ > 0 o gęstości fθ,a =

θa^θ

x^θ+11(x > a)

Znajdź ˆθ oraz ˆa estymatory największej wiarogodności parametrów θ oraz a.

Rozwiązanie:

Konstruujemy funkcję wiarygodności i po zlogarytmowaniu jej szukamy jej ekstremum. Będzie ona niezerowa tylko dla wszystkich Xi > a, a największą wartość będzie przyjmowała dla największego a (jest ono w liczniku funkcji gęstości), więc estymowane:

ˆ

a = min

i=1,...,n(Xi) .

L(X1, ...Xn, ˆa, θ) =

n

Y

i=1

θa^θ X_i^θ+1

l = ln(L) = n ln θ + nθ ln ˆa − (θ + 1)

n

X

i=1

ln X_i

∂l

∂θ = n

θ + n ln ˆa −

n

X

i=1

ln Xi = 0 Wyliczamy stąd:

θ =ˆ n

Pn

i=1ln Xi− n ln(min_i=1,...,n(Xi)) Sprawdzamy jeszcze warunek drugiego rzędu:

∂²l

∂θ² = −n θ² < 0

Widać więc, że dla wyliczonych estymatorów osiągane jest maksimum. Są to estymatory największej wiary- godności.

(11)

Zadanie 6:

Niech X1, ..., X_n będzie próba prostą z rozkładu Log-normalnego o parametrach µ, σ² > 0, o gęstości f_µ,σ2 = 1

x√

2πσ exp(−(ln(x) − µ)² 2σ² )

• Znajdź ˆµ, ˆσ² Estymatory Największej Wiarogodności parametrów µ, σ²,

• Oblicz obciążenie oraz wariancje estymatora ˆµ uzyskanego w poprzednim podpunkcie,

• Jak duże powinno być n, żeby błąd średniokwadratowy dla µ = 0, MSE(0), był mniejszy niż 0.01, gdzie MSE(µ) = Eθ(µ − ˆµ)².

Rozwiązanie:

Ad.(A):

L(µ, σ²) =

n

Y

i=1

1 xi

√1

2πσexp(−(ln(x) − µ)² 2σ² )

l(µ, σ²) = ln(L(µ, σ²)) =

n

X

i=1

(−(ln(x_i) − µ)²

2σ² − ln(x_i) − ln(

√ 2πσ))

= − 1 2σ²

n

X

i=1

ln²(x_i) + µ 2σ²

n

X

i=1

ln(x_i) + n µ² 2σ² −

n

X

i=1

ln(x_i) − n ln(√ 2πσ) Obliczymy pochodne, by znaleźć ekstrema:

∂

∂µl(µ, σ) = 1 σ²

n

X

i=1

ln(xi) − µ σ²n = 0 Skąd ˆµ = ¹_nPn

i=1ln(xi)

∂

∂σl(µ, σ²) = 1 σ³

n

X

i=1

ln²(xi) −2µ σ³

n

X

i=1

ln(xi) +µ² σ³n −n

σ = 0 skąd wyliczamy:

ˆ σ² =

Pn

i=1ln²(x_i) − 2µPn

i=1ln⁽x_i) + nµ²

n =

Pn

i=1ln²(xi) −_n²(Pn

i=1ln(xi))²+¹_n(Pn

i=1ln(xi))² n

= Pn

i=1ln(xi) −_n¹(Pn

i=1ln(xi))2

n

Formalnie powinniśmy sprawdzić, czy znalezione rozwiązanie to faktycznie maksimum.

Ad. (B):

b(ˆµ) = E(µ − ˆµ) = 1 n

n

X

i=1

E ln(xi) − µ = 1

nnµ − µ = 0 var(ˆµ) = var(1

n

X

i=1

ln(xi)) = 1 n²

n

X

i=1

var(ln(xi)) = 1

n²nσ² = σ² n Ad. (C): µ = 0 oraz MSE(0) < 0.01

M SE(µ) = E(µ − ˆµ)² = Var(µ − ˆµ) + (E(µ − ˆmu))² = Var(µ − ˆµ) = Var(ˆµ) = σ² n

Otrzymujemy więc kolejno MSE(0) = ^σ_n² < 0.01, czyli n > 100σ² = 100^{P ln}_n²^(xⁱ⁾, skąd ostatecznie n > 10

q

P ln²(xi).

(12)

Zadanie 7:

Niech X1, ..., X_n będzie próba prostą z rozkładu normalnego o parametrach µ, σ²> 0.

• Znajdź ˆµ, ˆσ² Estymatory Największej Wiarogodności parametrów µ, σ²,

• Oblicz obciążenie oraz wariancję estymatora ˆµ uzyskanego w poprzednim podpunkcie,

• Jak duże powinno być n, żeby błąd średniokwadratowy dla µ = 0, MSE(0), był mniejszy niż 0.01, gdzie MSE(µ) = Eθ(µ − ˆµ)².

Rozwiązanie:

(a) Każda z obserwacji pochodzi z rozkładu normalnego o parametrach µ oraz σ² > 0. Jest to rozkład ciągly więc opisywany jest funkcją gestości. Ma ona postać:

f (x) = 1 σ ·√

2πexp(−(X − µ)² 2σ² )

(b) Funkcja wiarogodności. Przemnażamy wartości prawdopodobieństw dla każdej obserwacji z próby:

L(X₁, X₂, ..., X_n, p) = 1 σ ·√

2πexp(−(X₁− µ)² 2σ² )· 1

σ ·√

2πexp(−(X₂− µ)²

2σ² )... 1 σ ·√

2πexp(−(X_n− µ)² 2σ² )

= ( 1 σ ·√

2π)ⁿ·

n

Y

i=1

exp(−(Xn− µ)² 2σ² )

(c) Zlogarytmowanie funkcji wiarogodności i obliczenie pochodnych cząstkowych po parametrach:

l(X1, X2, ..., Xn, p) = ln L = −n ln σ −n

2ln 2π − 1 2σ²(

n

X

i=1

(Xi− µ)²)

∂l

∂µ = − 1 2σ²

n

X

i=1

(2µ − 2Xi)

∂l

∂σ² = 1 2σ⁴(

n

X

i=1

(Xi− µ)²) − n 2σ² bo

∂

∂xln√ x = 1

2x

(d) Przyrównanie pochodnych cząstkowych do zera (zakładamy p ∈ (0, 1) bo oba parametry rozkładu normalnego są >0) :

∂l

∂µ = 0 ⇔

n

X

i=1

(2µ − 2X_i) = 0 więc

µ =e 1 n ·

n

X

i=1

Xi

(13)

∂l

∂σ² = 0 ⇔ 1 σ²(

n

X

i=1

(Xi− µ)²) = n

więc

fσ²= 1 n·

n

X

i=1

(X_i− µ)² .

(e) Sprawdzenie, czy faktycznie uzyskaliśmy maksimum w punkcie (eµ, fσ²). W tym przypadku jest to oczy- wiste, bo badana funkcja logarytmu funkcji wiarogodności jest wklęsla, a więc znalezione ekstremum to maksimum.

(f) Obliczenie obciążenia estymatoraµe Najpierw liczymy E[eµ]

E[µ] = E[e 1 n·

n

X

i=1

Xi] = 1 nE[

n

X

i=1

Xi] = 1 n

n

X

i=1

E[Xi] = 1

n· nµ = µ

bo wartością oczekiwaną średniej dla rozkładu normalnego jest parametru µ stąd obciążenie estymatora µe to:

b(µ) = µ −e 1 n·

n

X

i=1

X_i = 0 Stąd (eµ) to estymator nieobciążony.

(g) Obliczenie wariancji estymatora µe

D²[µ] = De ²[1 n·

n

X

i=1

X_i] = 1 n²D²[

n

X

i=1

X_i] = 1

n² · nσ²= σ² n (h) Oszacowanie błędu średniokwadratowego:

Błąd średniokwadratowy estymatora można obliczyć jako sumę wariancji estymatora i jego obciążenia pod- niesionego do kwadratu. W tym przypadku będzie on wynosił zatem

M SE(µ) =e σ²

n + 0² = σ² n wówczas MSE < 0.01 wtw, gdy n > _0.01^σ²

(14)

Zadanie 8:

Liczba wypadków samochodowych zgłoszonych do towarzystwa ubezpieczeniowego w k-tym miesiącu jest zmienną losową Wk o rozkładzie Poissona z parametrem λzk, gdzie zk jest liczbą samochodów zgłoszonych do ubezpieczenia w tym miesiącu, zaś λ jest nieznanym parametrem. Zmienne losowe Wk są niezależne.

• Wyznaczyć estymator Metodą Największej Wiarogodności parametru λ na podstawie próby W1, . . . , W₁₂.

• Sprawdzić, czy ten estymator jest nieobciążony.

• Wyznaczyć ryzyko (średni błąd kwadratowy, MSE) dla uzyskanego estymatora.

Rozwiązanie: Wiemy, że

P (W_k= i) = (λz_k)ⁱ i! e^−λz^k oraz Wk są niezależne.

Rozpiszmy funkcję wiarogodności.

L(w₁, ...w₁₂, λ) = (λz₁)^w¹

w₁! e^−λz¹· ... · (λz₁₂)^w¹²

w₁₂! e^−λz¹² = exp

− λ

12

X

k=1

z_k

·

12

Y

k=1

(λz_k)^w^k w_k! L i ln(L) =: l przyjmują maksimum dla tego samego λ.

l(w₁, ...w₁₂, λ) = −λ

12

X

k=1

z_k+

12

X

k=1

w_kln(λz_k) −

12

X

k=1

ln(w_k)

∂l

∂λ(w₁, ...w₁₂, λ) = −

12

X

k=1

z_k+

12

X

k=1

w_k· z_k λzk

=

12

X

k=1

w_k λ −

12

X

k=1

z_k

Zatem:

∂l

∂λ(w1, ...w12, λ) = 0 ⇐⇒ λ = P12

k=1wk

P12 k=1z_k Sprawdźmy, czy l ma maksimum w wyznaczonym

P12 k=1w_k P12

k=1z_k =: λ0.

∂²l

∂²λ(w₁, ...w₁₂, λ) = − 1 λ²

12

X

k=1

w_k< 0 dla każdego λ, w tym dla λ0.

Wobec tego l rzeczywiście przyjmuje tam maksimum.

Sprawdźmy, czy estymator λ0 jest nieobciążony.

(15)

E(λ0) = E

P12 k=1W_k P12

k=1z_k

= λP12 k=1z_k P12

k=1z_k = λ Stąd jest to estymator nieobciążony.

Policzmy jego średni błąd kwadratowy (ryzyko).

M SE(λ₀) = E

P12 k=1W_k P12

k=1zk

−λ

2

= 1

P12

k=1z_k

2E

12

X

k=1

W_k

2

−2λ

12

X

k=1

W_k

12

X

k=1

z_k+λ²

12

X

k=1

z_k

2

=

= 1

P12

k=1z_k

2E

12

X

k=1

W_k

2

− 1

P12

k=1z_k

2·2λ²

12

X

k=1

z_k

2

+ 1

P12

k=1z_k

2·λ²

12

X

k=1

z_k

2

= E

(P12

k=1W_k)²

P12

k=1z_k

2 −λ²=

=











W_k - zmienne niezależne ⇒

E(W_kW_j) = E(W_k)E(W_j) dla i 6= j oraz

E(W_k²) = V ar(Wk) + (E(Wk))² V ar(W_k) = λz_k











= P12

k=1

(λzk)²+ λzk

+ 2λ²P

1≤j<k≤12zjzk

P12

k=1z_k

2 −λ²=

= P12

k=1λz_k+ λ²

P12

k=1z_k

2

P12

k=1zk

2 − λ² = λ

P12 k=1z_k