• Nie Znaleziono Wyników

Praca domowa #1 z SAD – przykładowe rozwiązania

N/A
N/A
Protected

Academic year: 2021

Share "Praca domowa #1 z SAD – przykładowe rozwiązania"

Copied!
15
0
0

Pełen tekst

(1)

Praca domowa #1 z SAD – przykładowe rozwiązania

Zadanie 1:

Obserwujemy dwie niezależne próby losowe (X1, . . . , Xn), (Y1, . . . , Ym). Wiadomo, że Xi∼ N (2µ, 1) oraz Yi∼ N (µ, 1).

• Wyznaczyć Metodą Największej Wiarogodności estymator parametru µ (korzystając z obydwu prób).

Czy otrzymany estymator jest nieobciążony?

• Wyznaczyć ryzyko (średni błąd kwadratowy – MSE) uzyskanego estymatora.

Rozwiązanie: Gęstość zmiennej losowej X ma postać 1 · exp(−12(x − 2µ)2), a gęstość zmiennej Y:

1

· exp(−12(y − µ)2).

Zapiszmy funkcję wiarogodności:

L(x1, . . . , xn, y1, . . . , ym, µ) =

 1

√2π

n+m

exp



−1 2

n

X

i=1

(xi− 2µ)2

 exp



−1 2

m

X

i=1

(yi− µ)2



Znajdźmy µ, dla którego otrzymane wyniki są najbardziej prawdopodobne. Funkcja L przyjmuje maksimum w tym samym punkcie co ln(L) =: l.

l(x1, . . . , xn, y1, . . . , ym, µ) = −n + m

2 ln(2π) − 1 2

n

X

i=1

(xi− 2µ)2−1 2

m

X

i=1

(yi− µ)2

Policzmy pochodną l po µ i znajdźmy µ, dla którego się ona zeruje.

∂l

∂µ(x1, . . . , xn, y1, . . . , ym, µ) = −1 2

n

X

i=1

2(xi− 2µ) · (−2) −1 2

m

X

i=1

2(yi− µ) · (−1) =

=

n

X

i=1

2 xi− 2µ +

m

X

i=1

yi− µ =

n

X

i=1

2xi+

m

X

i=1

yi− µ · (4n + m) Zatem:

∂l

∂µ(x1, . . . , xn, y1, . . . , ym, µ) = 0 ⇐⇒ µ = 1 4n + m

 n

X

i=1

2xi+

m

X

i=1

yi



Dostajemy więc wzór estymatora parametru µ:

1 4n + m

 n

X

i=1

2xi+

m

X

i=1

yi



=: ˆµ.

Czy l ma maksimum w ˆµ (czyli czy ˆµ = MLE(µ))? Tak, bo:

2l

2µ(x1, . . . , xn, y1, . . . , ym, µ) = −(4n + m) < 0dla każdego µ, w tym dla ˆµ.

(2)

Czy jest on nieobciążony? Tak, bo:

E(ˆµ) = 1 4n + mE

 2

n

X

i=1

Xi+

m

X

i=1

Yi



= 2n · 2µ + m · µ

4n + m = 4n + m 4n + mµ = µ.

Wyznaczmy ryzyko estymatora ˆµ.

M SE(ˆµ) = E

 1

4n + m(

n

X

i=1

2Xi+

m

X

i=1

Yi) − µ

2

=

= E

 1

(4n + m)2

 n

X

i=1

2Xi+

m

X

i=1

Yi

2

− 2µ 4n + m

 n

X

i=1

2Xi+

m

X

i=1

Yi

 + µ2



=

= µ2− 2µ 4n + mE

 n X

i=1

2Xi+

m

X

i=1

Yi



+ 1

(4n + m)2E

 4

 n X

i=1

Xi

2

+ 4

n

X

i=1

Xi m

X

i=1

Yi+

 m X

i=1

Yi

2

=

=





X, Y niezależne ⇒

E(XiYj) = E(Xi)E(Yj) ∀i,j

podobnie dla i 6= j E(XiXj) = E(Xi)E(Xj)





=

= µ2−2µ2(4n + m)

4n + m +4 · 2µ2nm

(4n + m)2+4 · (2µ)2n(n − 1) + µ2m(m − 1

(4n + m)2 + 1

(4n + m)2

 4E

 n

X

i=1

Xi2

 +E

 m

X

i=1

Yi2



=

= µ2



1−8n + 2m

4n + m + 8nm

(4n + m)2+16n2− 16n + m2− m (4n + m)2



+ 1

(4n + m)2



4n(V ar(X)+(2µ)2)+m(V ar(Y )+µ2)



=

= µ2



1 −8n + 2m

4n + m +16n2− 16n + 8nm + m2− m + 16n + m (4n + m)2



+ 4n + m (4n + m)2 =

= µ2



1 −8n + 2m

4n + m +(4n + m)2 (4n + m)2



+ 4n + m

(4n + m)2 = 1 4n + m

(3)

Zadanie 2:

Niech (X1, . . . , Xn) będą niezależnymi zmiennymi losowymi o takim samym rozkładzie o gęstości postaci:

fλ(x) = 1

3x2exλ, x > 0, λ > 0 .

• Wyznacz estymator Metodą Największej Wiarogodności nieznanego parametru λ.

• Wiedząc, że wartość oczekiwana wynosi EXi = 3λ, sprawdź, czy otrzymany estymator jest estyma- torem nieobciążonym.

• Wyznacz ryzyko (średni błąd kwadratowy, MSE) dla otrzymanego estymatora. Czy otrzymany esty- mator jest zgodny? (Obserwacja: dla estymatorów zgodnych limn→∞M SE(θ) → 0)

Rozwiązanie:

część 1, wartość estymatora:

Funkcja wiarogodności to iloczyn gęstości prawdopodobieństw:

L(X1, ..., Xn, λ) = 1

3X12eX1λ · ... · 1

3Xn2eXnλ = (1)

= 1

(2λ3)n· X12· ... · Xn2· eX1λ · ... · eXnλ = (2)

= 1

(2λ3)n· X12· ... · Xn2· eX1λ −...−Xnλ (3) Jako, że funkcja wiarogodności jest ściśle dodatnia oraz funkcja logarytm jest monotoniczna, rosnąca, okre- ślona na wartościach dodatnich, to aby znaleźć maksimum funkcji wiarogodności można znaleźć maksimum jej logarytmu:

ln L(X1, ..., Xn, λ) = −n ln(2λ3) + 2 ln X1+ ... + 2 ln Xn−X1+ ... + Xn

λ = (4)

ln L(X1, ..., Xn, λ) = −3n ln λ − n ln 2 + 2 ln X1+ ... + 2 ln Xn−X1+ ... + Xn

λ (5)

Ekstremum funkcja gładka osiąga tam, gdzie pochodna się zeruje więc obliczmy pierwszą pochodną loga- rytmu naturalnego L po λ:

∂ ln L

∂λ = −3n1

λ− 0 + 0 + ... + 0 − (X1+ ... + Xn)(−λ−2) = (6)

= −3n

λ +X1+ ... + Xn

λ2 (7)

i przyrównajmy tę pochodną do 0:

X1+ ... + Xn λ2 − 3n

λ = 0 (8)

(4)

X1+ ... + Xn

λ2 − 3nλ

λ2 = 0 (9)

X1+ ... + Xn− 3nλ

λ2 = 0 (10)

X1+ ... + Xn− 3nλ = 0 (11)

X1+ ... + Xn= 3nλ (12)

X1+ ... + Xn

3n = λ (13)

Czyli nasz kandydat na estymator to:

λn= X1+ ... + Xn

3n (14)

Teraz musimy sprawdzić, czy dla tej wartości druga pochodna logarytmu jest ujemna:

2ln L

∂λ2 = ∂

∂λ((X1+ ... + Xn−2− 3nλ−1) = (15)

= (X1+ ... + Xn)(−2)λ−3− 3n(−1)λ−2= (16)

=



−2(X1+ ... + Xn)1 λ+ 3n

 1

λ2 = (17)

=



3n − 2(X1+ ... + Xn) 3n X1+ ... + Xn

 (3n)2

(X1+ ... + Xn)2 = (18)

= (3n − 6n) (3n)2

(X1+ ... + Xn)2 = (19)

= −3n (3n)2

(X1+ ... + Xn)2 = (20)

= − (3n)3

(X1+ ... + Xn)2 (21)

n jest liczbą naturalną dodatnią więc (3n)3 jest dodatnie, mianownik to liczba rzeczywista podniesiona do kwadratu, czyli również jest dodatnia (X1, ..., Xn są dodatnie, czyli ich suma też). Jako, że licznik i mianownik są dodatnie a przed całością jest minus to druga pochodna rzeczywiście jest ujemna, czyli dla λnfunkcja wiarogodności przyjmuje maksimum.

(5)

część 2, obciążenie estymatora:

Chcemy wyznaczyć obciążenie estymatora, to znaczy różnicę pomiędzy wartością oczekiwaną estymatora Eλn a wartością estymowaną λ:

b(λn) = Eλn− λ = (22)

= E X1+ ... + Xn

3n



− λ = (23)

= EX1+ ... + EXn

3n − λ = (24)

=

n

z }| {

3λ + ... + 3λ

3n − λ = (25)

= 3nλ

3n − λ = λ − λ = 0 (26)

czyli obciążenie naszego estymatora wynosi 0, to znaczy ten estymator jest nieobciążony.

część 3, średni błąd kwadratowy:

Średni błąd kwadratowy to wartość oczekiwana kwadratu różnicy między estymatorem a wartością estymo- waną:

MSE(λn) = E(λn− λ)2 = (27)

= E(λ2n− 2λnλ + λ2) = (28)

= Eλ2n− 2E(λnλ) + Eλ2 = (29)

= Eλ2n− 2EλnEλ + Eλ2 = (30)

= Eλ2n− 2λ2+ λ2= (31)

= Eλ2n− λ2= (32)

= E X1+ ... + Xn 3n

2

− λ2 = (33)

(6)

= 1

(3n)2E (X1+ ... + Xn)2− λ2 = (34)

= 1

(3n)2 nEXi2+ n(n − 1)E(XiXj) − λ2= (35)

= nEXi2

(3n)2 +n(n − 1)E(XiXj)

(3n)2 − λ2 (36)

Teraz w ramach rachunków pomocniczych obliczmy wartość oczekiwaną Xi2:

EXi2= Z

0

x2 1

3x2exλdx (37)

oraz możemy przy okazji obliczyć wartość oczekiwaną Xi:

EXi = Z

0

x 1

3x2eλxdx (38)

Wykonajmy najpierw dodatkowe rachunki ogólne:

I(a, λ, m, n) = Z

0

a 1

λmxnexλdx = (39)

= Z

0

a 1 λmxn

−λeλx0

dx = (40)

=



−a 1

λm−1xnexλ

 0

− Z

0

an 1

λmxn−1

−λexλ

dx = (41)

= [0 − 0] + Z

0

an 1

λm−1xn−1eλxdx = (42)

= Z

0

an 1

λm−1xn−1exλdx = I(an, λ, m − 1, n − 1) (43) Oprócz tego musimy jeszcze obliczyć:

I(a, λ, m, 0) = Z

0

a 1

λmexλdx = (44)

= a λm

h

−λeλxi

0 = a

λm−1[0 − (−1)] = a

λm−1 = a · λ1−m (45)

Wracając do naszych wartości oczekiwanych:

EXi = Z

0

1

3x3exλdx = I 1 2, λ, 3, 3



= (46)

= I 3 2, λ, 2, 2



= I 3 · 2 2 , λ, 1, 1



= I 3 · 2 · 1 2 , λ, 0, 0



= 3λ1= 3λ (47)

(7)

co jest zgodne z treścią zadania, teraz pora na:

EXi2= Z

0

1

3x4exλdx = I 1 2, λ, 3, 4



= (48)

= I 4 2, λ, 2, 3



= I (2, λ, 2, 3) = I (2 · 3, λ, 1, 2) = (49)

= I (2 · 3 · 2, λ, 0, 1) = I (2 · 3 · 2 · 1, λ, −1, 0) = I (12, λ, −1, 0) = (50)

= 12λ1−(−1) = 12λ2 (51)

Teraz możemy wrócić do obliczania średniego błędu kwadratowego:

MSE(λn) = nEXi2

(3n)2 +n(n − 1)E(XiXj)

(3n)2 − λ2 = (52)

= EXi2

9n +(n − 1)EXiEXj)

9n − λ2 = (53)

= 12λ2

9n + (n − 1)3λ3λ

9n − λ2 = (54)

= 4λ2

3n +(n − 1)λ2

n − λ2 = (55)

= 4λ2 3n +nλ2

n −λ2

n − λ2 = (56)

= 4λ2

3n + λ2−3λ2

3n − λ2 = (57)

= 4λ2 3n −3λ2

3n = (58)

= MSE(λn) = 4λ2− 3λ2 3n = λ2

3n (59)

Znamy już średni błąd kwadratowy estymatora największej wiarogodności, pozostaje pytanie czy jest on zgodny? Sprawdźmy granicę tak jak w poleceniu:

n→∞lim MSE(λn) = lim

n→∞

λ2

3n = 0 (60)

czyli rzeczywiście ten estymator jest zgodny.

(8)

Zadanie 3:

Mamy sześciościenną kostkę do gry, przy czym nie znamy prawdopodobieństwa wypadnięcia 6, oznaczo- nego przez p. W celu oszacowania p rzucamy kostką dopóki nie wypadnie 6 i przez Y oznaczamy liczbę wykonanych rzutów. Jednak jeśli w pierwszych k rzutach nie wypadła 6 to przerywamy eksperyment i Y = k + 1.

• Na podstawie n niezależych powtórzeń powyższego eksperymenty wyznacz estymator Metodą Naj- większej Wiarogodności parametru p.

• Sprawdź, czy podany estymator jest estymatorem nieobciążonym

• Wyznacz ryzyko (średni błąd kwadratowy, MSE) dla otrzymanego estymatora. Czy otrzymany esty- mator jest zgodny? (Obserwacja: dla estymatorów zgodnych limn→∞M SE(θ) → 0)

Rozwiązanie: W dalszej części zadania będe używał, że p ∈ (0, 1), tzn kiedy pisze nierówność na p mam na myśli w dziedzinie określoności.

Z treści zadania wiemy że Y ma następujący rozkład:

P (Y = s) = p(1 − p)s−1 dla s ∈ {1, ..., k}.

P (Y = k + 1) = 1 −Pk

i=1p(1 − p)i = (1 − p)k. Stad nasza funkcja wiarygodności ma postać:

L(Y1, ..., Yn, p) = P (Y1= y1, ..., Yn= yn) =(z niezależności) = P (Y1= y1) ∗ ... ∗ P (Yn= yn) = A.

Nasze zmienne losowe mają wyszczególnione prawdopodobieństwo dla k + 1, stąd załóżmy, że ten wynik uzyskaliśmy w (BSO 0 ≤ w ≤ n) ”w” ostatnich próbach. Wiedząc to podstawiamy i otrzymujemy:

A = p(1 − p)y1−1∗ ... ∗ p(1 − p)yn−w−1∗ ((1 − p)k)w.

Niech G(p) = Ln(L(Y1, ..., Yn, p)). Oczywiście, ponieważ logarytm jest funkcja ściśle rosnącą to G(p) przyjmuje maksimum w p0 ⇐⇒ funkcja L(Y1, ..., Yn, p) przyjmuje maksimum w p0.

Podstawiając do definicji funkcji G dane otrzymujemy:

G(P ) = (n − w)ln(p) + (Pn−w

i=1 (yi− 1))ln(1 − p) + (kw)ln(1 − p). Teraz liczymy pochodną funkcji G.

∂G

∂p = n−wp(

Pn−w

i=1 (yi−1))+kw

Chcemy policzyć maksimum stąd z lematu Fermata pochodna, (o ile funkcja jest różniczkowalna jak w1−p

naszym przypadku), zeruje się w punkcie przyjmowania maksimum. Po przyrównaniu do 0 dostajemy:

∂G

∂p = 0 ⇐⇒ p = n−w

kw+Pn−w i=1 (yi).

Pozostaje sprawdzić czy jest to maksimum. Zauważmy, że:

∂G

∂p > 0 ⇐⇒ p < n−w

kw+Pn−w i=1 (yi)

∂G

∂p < 0 ⇐⇒ p > n−w

kw+Pn−w i=1 (yi)

Czyli pochodna zmienia znak z czego wnioskujemy że punkt p = kw+Pn−wn−w

i=1 (yi) jest maksimum. Stąd nasze wyliczone p jest dokładnie szukanym parametrem największej wiarygodnosci.

(9)

Zadanie 4:

Niech X1, ..., Xn będzie próbą prostą z rozkładu Poissona o intensywności θ P (Xi= x) = θx

x!e−θ

• Znajdź ˆθ estymator Metodą Największej Wiarogodności parametru θ.

• Oblicz obciążenie oraz wariancję estymatora ˆθ, uzyskanego w poprzednim podpunkcie.

• Jak duże powinno być n, żeby błąd średniokwadratowy dla θ = 1 był mniejszy niż 0, 01, gdzie M SE(θ) = Eθ[(θ − ˆθ)2].

Rozwiązanie:

Zmiennne losowe X1, ..., Xn są niezależne bo pochodzą z próby prostej, więc L(X1, ..., Xn, θ) =

n

Y

i=1

P (Xi|θ) =

n

Y

i=1

θXi

Xi!e−θ = θPni=1Xi Qn

i=1Xi!e−θn log(L(X1, ..., Xn, θ)) = log(θ)

n

X

i=1

Xi − θn −

n

X

i=1

log(Xi) Teraz jeszcze pochodna dla znalezienia ekstremum:

∂l(X1, ..., Xn, θ)

∂θ =

Pn i=1Xi

θ − n = 0

⇔ θ = Pn

i=1Xi

n = X

Czy to maksimum?

2l(X1, ..., Xn, θ)

∂θ2 = −

Pn i=1Xi

θ2 < 0 Więc ˆθ = X

Zmiennne losowe X1, ..., Xnmają rozkład Poissona z parametrem θ więc E(Xi) = θ i V ar(Xi) = θ dla każdego i

E(θ) = E(ˆ Pn

i=1Xi n ) = 1

nE(

n

X

i=1

Xi) = 1 n

n

X

i=1

E(Xi) = 1

nnE(X1) = θ Czyli estymator ˆθ jest nieobciążony, więc jego obciążenie wynosi 0.

V ar(ˆθ) = V ar(

Pn i=1Xi

n ) = 1 n2V ar(

n

X

i=1

Xi) = 1

n2nV ar(X1) = θ n

E[(θ −θ)ˆ2] = E[θ2− 2θ ˆθ + θ2] = E[θ2] − 2E[θ ˆθ] + E[ˆθ2] =

= E[1] − 2E[ˆθ] + V ar[ˆθ] + (E[ˆθ])2 = 1 − 2 + θ

n + 12 = θ n = 1

n 1

n < 0.01 ⇔ n > 100

(10)

Zadanie 5:

Niech X1, ..., Xn będzie próbą prostą z rozkładu Pareto o parametrach a > 0, θ > 0 o gęstości fθ,a =

θaθ

xθ+11(x > a)

Znajdź ˆθ oraz ˆa estymatory największej wiarogodności parametrów θ oraz a.

Rozwiązanie:

Konstruujemy funkcję wiarygodności i po zlogarytmowaniu jej szukamy jej ekstremum. Będzie ona niezerowa tylko dla wszystkich Xi > a, a największą wartość będzie przyjmowała dla największego a (jest ono w liczniku funkcji gęstości), więc estymowane:

ˆ

a = min

i=1,...,n(Xi) .

L(X1, ...Xn, ˆa, θ) =

n

Y

i=1

θaθ Xiθ+1

l = ln(L) = n ln θ + nθ ln ˆa − (θ + 1)

n

X

i=1

ln Xi

∂l

∂θ = n

θ + n ln ˆa −

n

X

i=1

ln Xi = 0 Wyliczamy stąd:

θ =ˆ n

Pn

i=1ln Xi− n ln(mini=1,...,n(Xi)) Sprawdzamy jeszcze warunek drugiego rzędu:

2l

∂θ2 = −n θ2 < 0

Widać więc, że dla wyliczonych estymatorów osiągane jest maksimum. Są to estymatory największej wiary- godności.

(11)

Zadanie 6:

Niech X1, ..., Xn będzie próba prostą z rozkładu Log-normalnego o parametrach µ, σ2 > 0, o gęstości fµ,σ2 = 1

x√

2πσ exp(−(ln(x) − µ)22 )

• Znajdź ˆµ, ˆσ2 Estymatory Największej Wiarogodności parametrów µ, σ2,

• Oblicz obciążenie oraz wariancje estymatora ˆµ uzyskanego w poprzednim podpunkcie,

• Jak duże powinno być n, żeby błąd średniokwadratowy dla µ = 0, MSE(0), był mniejszy niż 0.01, gdzie MSE(µ) = Eθ(µ − ˆµ)2.

Rozwiązanie:

Ad.(A):

L(µ, σ2) =

n

Y

i=1

1 xi

√1

2πσexp(−(ln(x) − µ)22 )

l(µ, σ2) = ln(L(µ, σ2)) =

n

X

i=1

(−(ln(xi) − µ)2

2 − ln(xi) − ln(

√ 2πσ))

= − 1 2σ2

n

X

i=1

ln2(xi) + µ 2σ2

n

X

i=1

ln(xi) + n µ22

n

X

i=1

ln(xi) − n ln(√ 2πσ) Obliczymy pochodne, by znaleźć ekstrema:

∂µl(µ, σ) = 1 σ2

n

X

i=1

ln(xi) − µ σ2n = 0 Skąd ˆµ = 1nPn

i=1ln(xi)

∂σl(µ, σ2) = 1 σ3

n

X

i=1

ln2(xi) −2µ σ3

n

X

i=1

ln(xi) +µ2 σ3n −n

σ = 0 skąd wyliczamy:

ˆ σ2 =

Pn

i=1ln2(xi) − 2µPn

i=1ln(xi) + nµ2

n =

Pn

i=1ln2(xi) −n2(Pn

i=1ln(xi))2+1n(Pn

i=1ln(xi))2 n

= Pn

i=1ln(xi) −n1(Pn

i=1ln(xi))2

n

Formalnie powinniśmy sprawdzić, czy znalezione rozwiązanie to faktycznie maksimum.

Ad. (B):

b(ˆµ) = E(µ − ˆµ) = 1 n

n

X

i=1

E ln(xi) − µ = 1

nnµ − µ = 0 var(ˆµ) = var(1

n

n

X

i=1

ln(xi)) = 1 n2

n

X

i=1

var(ln(xi)) = 1

n22 = σ2 n Ad. (C): µ = 0 oraz MSE(0) < 0.01

M SE(µ) = E(µ − ˆµ)2 = Var(µ − ˆµ) + (E(µ − ˆmu))2 = Var(µ − ˆµ) = Var(ˆµ) = σ2 n

Otrzymujemy więc kolejno MSE(0) = σn2 < 0.01, czyli n > 100σ2 = 100P lnn2(xi), skąd ostatecznie n > 10

q

P ln2(xi).

(12)

Zadanie 7:

Niech X1, ..., Xn będzie próba prostą z rozkładu normalnego o parametrach µ, σ2> 0.

• Znajdź ˆµ, ˆσ2 Estymatory Największej Wiarogodności parametrów µ, σ2,

• Oblicz obciążenie oraz wariancję estymatora ˆµ uzyskanego w poprzednim podpunkcie,

• Jak duże powinno być n, żeby błąd średniokwadratowy dla µ = 0, MSE(0), był mniejszy niż 0.01, gdzie MSE(µ) = Eθ(µ − ˆµ)2.

Rozwiązanie:

(a) Każda z obserwacji pochodzi z rozkładu normalnego o parametrach µ oraz σ2 > 0. Jest to rozkład ciągly więc opisywany jest funkcją gestości. Ma ona postać:

f (x) = 1 σ ·√

2πexp(−(X − µ)22 )

(b) Funkcja wiarogodności. Przemnażamy wartości prawdopodobieństw dla każdej obserwacji z próby:

L(X1, X2, ..., Xn, p) = 1 σ ·√

2πexp(−(X1− µ)22 )· 1

σ ·√

2πexp(−(X2− µ)2

2 )... 1 σ ·√

2πexp(−(Xn− µ)22 )

= ( 1 σ ·√

2π)n·

n

Y

i=1

exp(−(Xn− µ)22 )

(c) Zlogarytmowanie funkcji wiarogodności i obliczenie pochodnych cząstkowych po parametrach:

l(X1, X2, ..., Xn, p) = ln L = −n ln σ −n

2ln 2π − 1 2σ2(

n

X

i=1

(Xi− µ)2)

∂l

∂µ = − 1 2σ2

n

X

i=1

(2µ − 2Xi)

∂l

∂σ2 = 1 2σ4(

n

X

i=1

(Xi− µ)2) − n 2σ2 bo

∂xln√ x = 1

2x

(d) Przyrównanie pochodnych cząstkowych do zera (zakładamy p ∈ (0, 1) bo oba parametry rozkładu normalnego są >0) :

∂l

∂µ = 0 ⇔

n

X

i=1

(2µ − 2Xi) = 0 więc

µ =e 1 n ·

n

X

i=1

Xi

(13)

∂l

∂σ2 = 0 ⇔ 1 σ2(

n

X

i=1

(Xi− µ)2) = n

więc

2= 1 n·

n

X

i=1

(Xi− µ)2 .

(e) Sprawdzenie, czy faktycznie uzyskaliśmy maksimum w punkcie (eµ, fσ2). W tym przypadku jest to oczy- wiste, bo badana funkcja logarytmu funkcji wiarogodności jest wklęsla, a więc znalezione ekstremum to maksimum.

(f) Obliczenie obciążenia estymatoraµe Najpierw liczymy E[eµ]

E[µ] = E[e 1 n·

n

X

i=1

Xi] = 1 nE[

n

X

i=1

Xi] = 1 n

n

X

i=1

E[Xi] = 1

n· nµ = µ

bo wartością oczekiwaną średniej dla rozkładu normalnego jest parametru µ stąd obciążenie estymatora µe to:

b(µ) = µ −e 1 n·

n

X

i=1

Xi = 0 Stąd (eµ) to estymator nieobciążony.

(g) Obliczenie wariancji estymatora µe

D2[µ] = De 2[1 n·

n

X

i=1

Xi] = 1 n2D2[

n

X

i=1

Xi] = 1

n2 · nσ2= σ2 n (h) Oszacowanie błędu średniokwadratowego:

Błąd średniokwadratowy estymatora można obliczyć jako sumę wariancji estymatora i jego obciążenia pod- niesionego do kwadratu. W tym przypadku będzie on wynosił zatem

M SE(µ) =e σ2

n + 02 = σ2 n wówczas MSE < 0.01 wtw, gdy n > 0.01σ2

(14)

Zadanie 8:

Liczba wypadków samochodowych zgłoszonych do towarzystwa ubezpieczeniowego w k-tym miesiącu jest zmienną losową Wk o rozkładzie Poissona z parametrem λzk, gdzie zk jest liczbą samochodów zgłoszonych do ubezpieczenia w tym miesiącu, zaś λ jest nieznanym parametrem. Zmienne losowe Wk są niezależne.

• Wyznaczyć estymator Metodą Największej Wiarogodności parametru λ na podstawie próby W1, . . . , W12.

• Sprawdzić, czy ten estymator jest nieobciążony.

• Wyznaczyć ryzyko (średni błąd kwadratowy, MSE) dla uzyskanego estymatora.

Rozwiązanie: Wiemy, że

P (Wk= i) = (λzk)i i! e−λzk oraz Wk są niezależne.

Rozpiszmy funkcję wiarogodności.

L(w1, ...w12, λ) = (λz1)w1

w1! e−λz1· ... · (λz12)w12

w12! e−λz12 = exp



− λ

12

X

k=1

zk



·

12

Y

k=1

(λzk)wk wk! L i ln(L) =: l przyjmują maksimum dla tego samego λ.

l(w1, ...w12, λ) = −λ

12

X

k=1

zk+

12

X

k=1

wkln(λzk) −

12

X

k=1

ln(wk)

∂l

∂λ(w1, ...w12, λ) = −

12

X

k=1

zk+

12

X

k=1

wk· zk λzk

=

12

X

k=1

wk λ −

12

X

k=1

zk

Zatem:

∂l

∂λ(w1, ...w12, λ) = 0 ⇐⇒ λ = P12

k=1wk

P12 k=1zk Sprawdźmy, czy l ma maksimum w wyznaczonym

P12 k=1wk P12

k=1zk =: λ0.

2l

2λ(w1, ...w12, λ) = − 1 λ2

12

X

k=1

wk< 0 dla każdego λ, w tym dla λ0.

Wobec tego l rzeczywiście przyjmuje tam maksimum.

Sprawdźmy, czy estymator λ0 jest nieobciążony.

(15)

E(λ0) = E

 P12 k=1Wk P12

k=1zk



= λP12 k=1zk P12

k=1zk = λ Stąd jest to estymator nieobciążony.

Policzmy jego średni błąd kwadratowy (ryzyko).

M SE(λ0) = E

 P12 k=1Wk P12

k=1zk

−λ

2

= 1

 P12

k=1zk

2E

 12

X

k=1

Wk

2

−2λ

12

X

k=1

Wk

12

X

k=1

zk2

 12

X

k=1

zk

2

=

= 1

 P12

k=1zk

2E

 12

X

k=1

Wk

2

− 1

 P12

k=1zk

2·2λ2

 12

X

k=1

zk

2

+ 1

 P12

k=1zk

2·λ2

 12

X

k=1

zk

2

= E

 (P12

k=1Wk)2



 P12

k=1zk

2 −λ2=

=









Wk - zmienne niezależne ⇒

E(WkWj) = E(Wk)E(Wj) dla i 6= j oraz

E(Wk2) = V ar(Wk) + (E(Wk))2 V ar(Wk) = λzk









= P12

k=1



(λzk)2+ λzk



+ 2λ2P

1≤j<k≤12zjzk

 P12

k=1zk

2 −λ2=

= P12

k=1λzk+ λ2

 P12

k=1zk

2

 P12

k=1zk

2 − λ2 = λ

P12 k=1zk

Cytaty

Powiązane dokumenty

Oznacza to, że pochodna jako funkcja maleje monotonicznie w otoczeniu maksimum, czyli druga pochodna jest ujemna w punkcie, w którym wypada minimum funkcji f(x).. Gdy mamy

Jedynym punktem przegięcia z tej trójki może być x=1, pozostałe są wykluczone z dziedziny, ale te punkty uwzględniamy przy analizie znaków pochodnej... Rozgraniczenia w tych

Uprzedzam, że mogły się tutaj znaleźć (niezamierzone) błędy – proszę je zgłaszać, to może wszystkim uprościć

Albo wykorzystujemy wynik z ćwiczeń, albo wyprowadzamy postać estymatora, pamiętając, że w modelu pojawia się stała (pierwsza kolumna macierzy X to jedynki).. Korzystamy

(d) (1 pkt) Dla wybranej na podstawie kryterium liczby skupień obejrzyj statystyki opisowe (niewystanda- ryzowanych) zmiennych (lub ich transformacji, jeśli uznasz to za potrzebne)

Wykazać, że jeśli H oraz G/H sˇs grupami cyklicznymi, to grupa G jest generowana przez

Wykazać, że kula jednostkowa w dowolnej normie jest

Wykazać, że kula jednostkowa w dowolnej normie jest zbiorem wypukłym..