estymatorów metody najmniejszych kwadratów

(1)

Asymptotyczne własności

estymatorów metody najmniejszych kwadratów

Definicja 1. Ciąg zmiennych losowych {Zn} określonych na tej samej przestrzeni probabilistycznej jest zbieżny z prawdopodobieństwem 1 (inaczej: zbieżny prawie na pewno) do zmiennej losowej Z, gdy P (limn→∞Zn= Z) = P ({ω ∈ Ω : limn→∞Zn(ω) = Z(ω)}) = 1, co oznaczamy: Zn

−−−−→P 1 n→∞ Z.

Definicja 2. Ciąg macierzy losowych {Z_n}, gdzie Zn = Z_n^i,j, 1 ≤ i ≤ k, 1 ≤ j ≤ m określonych na tej samej przestrzeni probabilistycznej jest zbieżny z prawdopodobieństwem 1 (inaczej: zbieżny prawie na pewno) do macierzy losowej Z, gdzie Z = Z^i,j, 1 ≤ i ≤ k, 1 ≤ j ≤ m, gdy

∀ i ∈ {1, 2, . . . , k} ∀ j ∈ {1, 2, . . . , m} Z_n^i,j−−−−→^{P 1}

n→∞ Z^i,j, co oznaczamy: Zn

−−−−→P 1 n→∞ Z.

Zbieżny ciąg deterministyczny jest zbieżny z prawdopodobieństwem 1 do swojej granicy. Należy też zwrócić uwagę, że granicą ciągu zbieżnego z prawdopodobieństwem 1 może być wielkość deterministyczna (liczba, wektor deterministyczny, macierz deterministyczna).

Twierdzenie 1. (Mocne prawo wielkich liczb Kołmogorowa) Niech {Z_n} będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie takim że E|Z₁| < ∞. Wówczas

1 n

n

X

i=1

Z_i−−−−→^{P 1}

n→∞ EZ₁. Lemat 1. Jeśli P (A) = P (B) = 1, to P (A ∩ B) = 1.

Dowód. P (A ∩ B) = P (A) + P (B) − P (A ∪ B) = 1 + 1 − P (A ∪ B) ≥ 1 + 1 − 1 = 1

Twierdzenie 2. Niech {Z_n} będzie ciągiem wektorów losowych o wartościach w R^k takim że Z_n −−−−→^{P 1}

n→∞ Z.

Niech {A_n} będzie ciągiem macierzy losowych rozmiaru m × k takim że A_n −−−−→^{P 1}

n→∞ A. Niech {b_n} będzie ciągiem wektorów losowych o wartościach w R^k takim że b_n −−−−→^{P 1}

n→∞ b Zakładamy również, że ciągi {Z_n}, {An} i {bn} są określone na tej samej przestrzeni probabilistycznej. Wówczas AnZ_n+ b_n−−−−→^{P 1}

n→∞ AZ + b.

Dowód. Niech ΩA = {ω ∈ Ω : limn→∞An(ω) = A(ω)}, ΩZ = {ω ∈ Ω : limn→∞Zn(ω) = Z(ω)} i Ω_b= {ω ∈ Ω : lim_n→∞b_n(ω) = b(ω)}. Z lematu 1 wynika, ze P (Ω_A∩ ΩZ∩ Ωb) = 1. Niech ω ∈ Ω_A∩ Ω_Z∩ Ωb. Wówczas lim_n→∞(A_n(ω)Z_n(ω) + b_n(ω)) = lim_n→∞A_n(ω) · lim_n→∞Z_n(ω) + lim_n→∞b_n(ω)) = A(ω)Z(ω) + b(ω). W takim razie AnZn+ bn

−−−−→P 1

n→∞ AZ + b.

Twierdzenie 3. Niech {Z_n} będzie ciągiem wektorów losowych o wartościach w R^k. Niech dana będzie funkcja g : D → R^l, gdzie D ⊆ R^k i P (Zn ∈ D) = 1, n ∈ N. Jeśli Zn

−−−−→P 1

n→∞ z, gdzie z ∈ D (ustalona liczba) jest punktem ciągłości funkcji g, to g(Zn)−−−−→^D

n→∞ g(z).

Dowód. Ze względu na ciągłość funkcji g w punkcie z mamy

∀ ω ∈ Ω lim

n→∞Zn(ω) = z ⇒ lim

n→∞g(Zn(ω)) = g(z).

Oznacza to, że {ω ∈ Ω : limn→∞Zn(ω) = z} ⊆ {ω ∈ Ω : limn→∞g(Zn(ω)) = g(z)}. W takim razie 1 = P ({ω ∈ Ω : lim_n→∞Z_n(ω) = z}) ≤ P ({ω ∈ Ω : lim_n→∞g(Z_n(ω)) = g(z)}) a zatem g(Z_n) −−−−→^D

n→∞

g(z).

Definicja 3. Ciąg zmiennych losowych {Z_n} o dystrybuantach odpowiednio F1, F₂, . . . jest zbieżny według rozkładu do zmiennej losowej Z o dystrybuancie F wtedy, gdy lim_n→∞F_n(t) = F (t) dla każdego t ∈ R, które jest punktem ciągłość funkcji F , co oznaczamy: Zn

−−−−→D

n→∞ Z

1

(2)

Definicja 4. Ciąg wektorów losowych {Z_n} o wartościach w R^k jest zbieżny według rozkładu do wektora losowego Z o wartościach w R^k, gdy dla każdego a ∈ R^k zachodzi zbieżność: a⁰Zn

−−−−→D n→∞ a⁰Z.

Twierdzenie 4. Niech {Zn} będzie ciągiem wektorów losowych o wartościach w R^k. Jeśli Zn

−−−−→P 1 n→∞ Z, to Zn

−−−−→D n→∞ Z.

Należy zwrócić uwagę, że granicą ciągu zbieżnego według rozkładu może być deterministyczna (liczba, wektor deterministyczny, macierz deterministyczna).

Twierdzenie 5. (Centralne twierdzenie graniczne dla ciągów niezależnych zmiennych losowych o jedna- kowym rozkładzie) Niech dany będzie ciąg niezależnych zmiennych losowych {Zn} o tym samym rozkła- dzie, przy czym EZ₁²< ∞. Niech EZ1= µ i V ar(Z1) = σ²> 0. Wówczas

√1 n

n

X

i=1

Zn− nµ

!

−−−−→D

n→∞ N (0, σ²).

Twierdzenie 6. (Centralne twierdzenie graniczne dla ciągów niezależnych wektorów losowych o jedna- kowym rozkładzie) Niech dany będzie ciąg {Zn} niezależnych wektorów losowych o tym samym rozkładzie o wartościach w R^k, przy czym Zn = (Z_n¹, Z_n², . . . , Z_n^k)⁰ i E|Z₁ⁱZ₁^j| < ∞, 1 ≤ i, j ≤ k. Niech EZ1= µ i Cov(Z1) = Σ, przy czym zakładamy, że macierz Σ jest ściśle dodatnio określona. Wówczas

√1 n

n

X

i=1

Zn− nµ

!

−−−−→D

n→∞ N (0, Σ).

Twierdzenie 7. (Słuckiego) Niech {Zn} będzie ciągiem wektorów losowych o wartościach w R^k takim że Z_n−−−−→^D

n→∞ Z. Niech {A_n} będzie ciągiem macierzy losowych rozmiaru m × k takim że An

−−−−→D

n→∞ A, przy czym A jest macierzą deterministyczną. Niech {bn} będzie ciągiem wektorów losowych o wartościach w R^k takim że b_n −−−−→^D

n→∞ b, przy czym b jest wektorem deterministycznym. Wówczas A_nZ_n+b_n−−−−→^D

n→∞ AZ+b.

Definicja 5. Niech {Zn}, gdzie Zn∈ R^l, będzie ciągiem obserwacji. Estymator ˆθn= ˆθn(Z1, Z2, . . . , Zn) ∈ R^k parametru θ ∈ R^k nazywamy mocno zgodnym, gdy ˆθn

−−−−→P 1 n→∞ θ.

Niech dany będzie ciąg modeli liniowych postaci:

Yn= Xnβ + n, gdzie

Yn =





 Y1

Y2

... Y_n







, Xn =







X10 X11 . . . X1,k−1

X20 X21 . . . X2,k−1

. . . . Xn0 Xn1 . . . Xn,k−1





 , β =





 β0

β1

... β_k−1







, n=





 ε1

ε2

... ε_n





 .

Niech ˆβ_n oznacza estymator metody najmniejszych kwadratów parametru β wyznaczony w modelu Y_n = X_nβ + _n, przy czym zakładamy, że estymator ten jest wyznaczony jednoznacznie, a zatem βˆ_n= (X⁰_nX_n)⁻¹X⁰_nY_n.

Ponadto niech Xi=





 X_i0 Xi1

... Xi,k−1





 .

2

(3)

Twierdzenie 8. Jeśli

(i) {X_i} jest ciągiem niezależnych wektorów losowych o jednakowym rozkładzie, (ii) E|X1iX1j| < ∞ dla 0 ≤ i, j ≤ k − 1,

(iii) EX1X₁⁰ jest macierzą nieosobliwą,

(iv) {εi} jest niezależnym od {Xi} ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, (v) Eε1= 0 i Eε²₁= σ², 0 < σ²< ∞,

to ˆβn jest mocno zgodnym estymatorem parametru β i √

n( ˆβn− β)−−−−→^D

n→∞ N (0, σ²(EX1X₁⁰)⁻¹).

Dowód. Mamy

βˆ_n = (X⁰_nX_n)⁻¹X⁰_nY_n= (X⁰_nX_n)⁻¹X⁰_n(X_nβ + _n) =

= (X⁰_nXn)⁻¹X⁰_nXnβ + (X⁰_nXn)⁻¹X⁰_nn= β + (X⁰_nXn)⁻¹X⁰_nn =

= β + 1 nX⁰_nXn

−1

· 1 nX⁰_nn.

1

nX⁰_nXn= 1 n







X₁₀ X₂₀ . . . X_n0 X11 X21 . . . Xn1

. . . . X1,k−1 X2,k−1 . . . Xn,k−1













X₁₀ X₁₁ . . . X_1,k−1 X20 X21 . . . X2,k−1

. . . . Xn0 Xn1 . . . Xn,k−1







=

= 1 n





 Pn

l=1X_l0X_l0 Pn

l=1X_l0X_l1 . . . Pn

l=1X_l0X_l,k−1 Pn

l=1X_l1X_l0 Pn

l=1X_l1X_l1 . . . Pn

l=1X_l1X_l,k−1

. . . .

Pn

l=1Xl,k−1Xl0 Pn

l=1Xl,k−1Xl1 . . . Pn

l=1Xl,k−1Xl,k−1







=







1 n

Pn

l=1X_l0X_l0 _n¹Pn

l=1X_l0X_l1 . . . _n¹Pn

l=1X_l0X_l,k−1

1 n

Pn

l=1X_l1X_l0 _n¹Pn

l=1X_l1X_l1 . . . _n¹Pn

l=1X_l1X_l,k−1

. . . .

1 n

Pn

l=1Xl,k−1Xl0 1 n

Pn

l=1Xl,k−1Xl1 . . . _n¹Pn

l=1Xl,k−1Xl,k−1







−−−−→P 1 z tw. 1

−−−−→P 1 n→∞







EX₁₀X₁₀ EX₁₀X₁₁ . . . EX₁₀X_1,k−1 EX₁₁X₁₀ EX₁₁X₁₁ . . . EX₁₁X_1,k−1

. . . . EX1,k−1X10 EX1,k−1X11 . . . EX1,k−1X1,k−1







=

= E







X₁₀X₁₀ X₁₀X₁₁ . . . X₁₀X_1,k−1 X₁₁X₁₀ X₁₁X₁₁ . . . X₁₁X_1,k−1

. . . . X1,k−1X10 X1,k−1X11 . . . X1,k−1X1,k−1







= E





 X₁₀ X₁₁ ... X1,k−1







X10X11 . . . X1,k−1

= EX1X₁⁰

1

nX⁰_n_n= 1 n







X10 X20 . . . Xn0

X₁₁ X₂₁ . . . X_n1 . . . . X_1,k−1 X_2,k−1 . . . X_n,k−1











 ε1

ε2

... εn







= 1 n





 Pn

l=1εlXl0

Pn l=1εlXl1

... Pn

l=1εlXl,k−1







=

3

(4)

=







1 n

Pn l=1ε_lX_l0

1 n

Pn l=1ε_lX_l1

...

1 n

Pn

l=1εlXl,k−1







−−−−→P 1 z tw. 1







Eε₁X₁₀ Eε₁X₁₁

... Eε1X1,k−1







=







Eε₁· EX₁₀ Eε₁· EX₁₁

... Eε1· EX1,k−1







=







0 · EX₁₀ 0 · EX₁₁

... 0 · EX1,k−1







= 0

Skoro _n¹X⁰_nX_n−−−−→^{P 1}

n→∞ EX₁X₁⁰ i EX₁X₁⁰ jest macierzą nieosobliwą, to dla dostatecznie dużego n macierz ¹_nX⁰_nXn jest również nieosobliwa z prawdopodobieństwem 1. Macierz nieosobliwa jest punktem cią- głości operacji odwracania macierzy, a zatem z twierdzenia 3 wynika, że (_n¹X⁰_nXn)⁻¹−−−−→^{P 1}

n→∞ (EX1X₁⁰)⁻¹. Wobec tego na mocy twierdzenia 2 mamy:

βˆn= β + 1 nX⁰_nXn

⁻¹

· 1 nX⁰_nn

−−−−→P 1

n→∞ β + (EX1X₁⁰) · 0 = β.

Ponieważ Eε1X1= Eε1· EX1= 0 · EX1= 0, więc

√1

nX⁰_nn= 1

√n







X10 X20 . . . Xn0

X11 X21 . . . Xn1

. . . . X1,k−1 X2,k−1 . . . Xn,k−1











 ε1

ε2

... ε_n







= 1

√n





 Pn

l=1εlXl0

Pn l=1εlXl1

... Pn

l=1ε_lX_l,k−1







=

= 1

√n

n

X

l=1

εlXl= 1

√n

n

X

l=1

εlXl− nEε1X1

!

−−−−→D

z tw. 6 N (0, Σ), gdzie

Σ = Cov(ε₁X₁) = E(ε₁X₁)(ε₁X₁)⁰− E(ε₁X₁)E(ε₁X₁)⁰ = E(ε₁X₁)(ε₁X₁)⁰=

= E(ε²₁X1X₁⁰) = E(ε²₁) · EX1X₁⁰ = (Eε²₁− (Eε1)²) · EX1X₁⁰ = σ²EX1X₁⁰. W takim razie

√n( ˆβn− β) = 1 nX⁰_nXn

−1

· 1

√nX⁰_nn

−−−−−−→D

z tw. 4 i 7 (EX1X₁⁰)⁻¹· N (0, σ²EX1X₁⁰) =

= N ((EX1X₁⁰)⁻¹· 0, (EX1X₁⁰)⁻¹· σ²EX1X₁⁰ · ((EX1X₁⁰)⁻¹)⁰) =

= N (0, σ²(EX1X₁⁰)⁻¹· EX1X₁⁰ · (EX1X₁⁰)⁻¹) = N (0, σ²(EX1X₁⁰)⁻¹).

4