Modelowanie i identyﬁkacja Wykład 5: Metoda zmiennych instrumentalnych Gniewomir Sarbicki

(1)

Modelowanie i identyfikacja

Wykład 5: Metoda zmiennych instrumentalnych

Gniewomir Sarbicki

(2)

Dla ustalonego wektora parametrów rozkładu θ znamy funkcję f_θ(~y_N) gęstości prawdopodobieństwa otrzymania wyjścia ~yN. Ze wzoru na prawdopodobieństwo warunkowe otrzymujemy rozkład prawdopodobieństwa wektora parametrów θ:

f (θ|~xN) = f_θ(~xN|θ)g(θ)/f (~xN), gdzie f (~xN) = Z

θ

f_θ(~xN)g(θ)dθ (1) Rozkład g(θ) jest rozkładem a priori parametrów układu. Wartość ˆθ, która

maksymalizuje (1) nazywamy estymatorem maksymalnego prawdopodobieństwa.

(3)

Prawdopodobieństwo sukcesu w jednym losowaniu wynosi p. Prawdopodobieństwo n sukcesów w N próbach wynosi:

P (n|p) = N n

!

pⁿ(1 − p)^{N −n} (2)

Za rozkład apriori parametru p należy wziąć rozkład jednostajny na odcinku [0, 1] (maksymalizujący entropię). Jeżeli w N próbach otrzymaliśmy n sukcesów, pry nieznanym parametrze p, jego rozkład prawdopodobieństwa wynosi:

P (p|n) =

N n

pⁿ(1 − p)^{N −n} R1

0 N

n

pⁿ(1 − p)^{N −n}dp = (N + 1) N n

!

pⁿ(1 − p)^{N −n} (3)

Powyższy rozkład osiąga wartość maksymalną dla wartości _Nⁿ. Jest to estymator maksymalnego prawdopodobieństwa dla p.

(4)

P (n|p) = N n

!

pⁿ(1 − p)^{N −n} (2)

Za rozkład apriori parametru p należy wziąć rozkład jednostajny na odcinku [0, 1]

(maksymalizujący entropię). Jeżeli w N próbach otrzymaliśmy n sukcesów, pry nieznanym parametrze p, jego rozkład prawdopodobieństwa wynosi:

P (p|n) =

N n

pⁿ(1 − p)^{N −n} R1

0 N

n

pⁿ(1 − p)^{N −n}dp = (N + 1) N n

!

pⁿ(1 − p)^{N −n} (3)

(5)

P (n|p) = N n

!

pⁿ(1 − p)^{N −n} (2)

Za rozkład apriori parametru p należy wziąć rozkład jednostajny na odcinku [0, 1]

(maksymalizujący entropię). Jeżeli w N próbach otrzymaliśmy n sukcesów, pry nieznanym parametrze p, jego rozkład prawdopodobieństwa wynosi:

P (p|n) =

N n

pⁿ(1 − p)^{N −n} R1

0 N

n

pⁿ(1 − p)^{N −n}dp = (N + 1) N n

!

pⁿ(1 − p)^{N −n} (3)

(6)

Załóżmy, że prawdziwą wartością p jest ¹₃ i otrzymaliśmy w dziesięciu próbach wyniki:

[0, 1, 1, 0, 1, 0, 0, 0, 1, 1]. rozkład prawdopodobieństwa p zmienia się w następujący sposób:

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0 1 2

p

P(p|n)

N = 0, n = 0 N = 2, n = 1 N = 4, n = 2 N = 6, n = 3 N = 8, n = 3 N = 10, n = 5

(7)

Estymator ˆpN = n/N jest:

nieobciążony: E(ˆp_N) = E(ˆn)/N = p

asymptotycznie nieobciążony: lim_{N →∞}E( ˆp_N) = p

(8)

Załóżmy, że wyjście układu w modelu jest obarczone szumem V0:

Y (N ) = ~~ Φ^T(N )~θ0+ ~V0(N ) (4)

Asymptotycznym obciążeniem estymatora będzie: lim

N →∞

~ˆ

θ_N − ~θ₀ = lim

N →∞R(N )⁻¹ lim

N →∞

1

NΦ(N )V₀(N )

= lim

N →∞R(N )⁻¹ lim

N →∞

1 N

N

X

t=1

φ(t)v~ 0(t) (5)

Obciążenie to będzie równe 0, jeżeli v0 jest nieskorelowany z wierszami Φ, czyli z wektorem wartości wyjściowych.

Jeżeli v₀ nie jest szumem białym, jest na ogół skorelowany z wyjściem.

(9)

Y (N ) = ~~ Φ^T(N )~θ0+ ~V0(N ) (4)

Asymptotycznym obciążeniem estymatora będzie:

lim

N →∞

~ˆ

θ_N − ~θ₀ = lim

N →∞R(N )⁻¹ lim

N →∞

1

NΦ(N )V₀(N )

= lim

N →∞R(N )⁻¹ lim

N →∞

1 N

N

X

t=1

φ(t)v~ 0(t) (5)

(10)

Y (N ) = ~~ Φ^T(N )~θ0+ ~V0(N ) (4)

lim

N →∞

~ˆ

θ_N − ~θ₀ = lim

N →∞R(N )⁻¹ lim

N →∞

1

NΦ(N )V₀(N )

= lim

N →∞R(N )⁻¹ lim

N →∞

1 N

N

X

t=1

φ(t)v~ 0(t) (5)

(11)

Y (N ) = ~~ Φ^T(N )~θ0+ ~V0(N ) (4)

lim

N →∞

~ˆ

θ_N − ~θ₀ = lim

N →∞R(N )⁻¹ lim

N →∞

1

NΦ(N )V₀(N )

= lim

N →∞R(N )⁻¹ lim

N →∞

1 N

N

X

t=1

φ(t)v~ 0(t) (5)

(12)

W takiej sytuacji w równaniu na estymator metody najlepszych kwadratów:

1 N

N

X

t=1

φ(t)~

y(t) − ~φ(t)^T~θˆ_N

= 0 (6)

Zastąpimy wektor ~φ(t) pewną jego funkcją ~ζ(t):

1 N

N

X

t=1

~ζ(t)

y(t) − ~φ(t)^T~θˆ_N

= 0, (7)

od której będziemy wymagać, by była nieskorelowana z v₀: E

~ζ(t)v₀(t)= ~0 (8)

det 1 N

X

t

~ζ(t)~φ^T(t) 6= 0 (9)

Składowe wektora ~ζ(t) nazywamy zmiennymi instrumentalnymi (IV - instrumental variables).

(13)

W takiej sytuacji w równaniu na estymator metody najlepszych kwadratów:

1 N

N

X

t=1

φ(t)~

y(t) − ~φ(t)^T~θˆ_N

= 0 (6)

Zastąpimy wektor ~φ(t) pewną jego funkcją ~ζ(t):

1 N

N

X

t=1

~ζ(t)

y(t) − ~φ(t)^T~θˆ_N

= 0, (7)

od której będziemy wymagać, by była nieskorelowana z v₀: E

~ζ(t)v₀(t)= ~0 (8)

det 1 N

X

t

~ζ(t)~φ^T(t) 6= 0 (9)

Składowe wektora ~ζ(t) nazywamy zmiennymi instrumentalnymi (IV - instrumental variables).

(14)

Macierz, której kolumnami są ~ζ(t) w kolejnych chwilach czasu, będzemy oznaczać jako Z.

Rozwiązaniem równania (6) jest:

~ˆ