Prognozowanie i symulacje 2010/2011
1
Średni błąd prognozy (predykcji)
Prawdziwa wartość zmiennej prognozowanej (1) Yv = XvTα+εv
Prognoza
(2) Yˆv = XvTa Błąd prognozy
v
v Y
Y Q= ˆ −
Wartość średnia błędu prognozy jest równa zero.
(3) − =
[
− − v]
=T v v
v Y E x a
Y
E(ˆ ) ( α) ε
= XvTE(a−α) − E(εv)=0 E(a)−E(α) 0 α α
0 Wariancja błędu prognozy
2 2
2(Q) E(Q E(Q)) E(Q)
D = − =
(4) 2( )= (ˆ − )2 =
{ ( ( − )− v)
2}
=
T v v
v Y E X
Y E Q
D α α ε
= +
−
−
−
−
=E(XvT(a α)(a α)TXv 2XvT(a α) εv2)
= +
−
−
−
−
= XvTE(a α)(a α)T Xv 2XvTE(a α) E(εv2) 0 σε2
) 2
)(
( −α −α +σε
= XvTE a a T Xv σv2(XTX)
Wyrażenie E(a−
α
)(a−α
)T jest macierzą wariancji i kowariancji estymatorów σv2(XTX). A zatem) 1 )
( ( )
( )
( 2 1 2 2 1
2 Q = XvT − Xv + = XvT − Xv +
D σε XTX σε σε XTX
Nie znamy wariancji składnika losowego σε2, znamy natomiast jej nieobciążony estymator, czyli wariancję resztową ~2
Se . Więc oszacowanie wariancji błędu prognozy
(5) ~ ( ( ) 1)
)
( 2 1
2 Q =Se XvT − Xv +
S XTX
Pierwiastek z (5) nazywany jest średnim błędem predykcji
(6) ~ ( ( ) 1)
)
(Q =Se XvT −1Xv +
S XTX
Mówi nam on o tym o ile średnio błąd prognozy różni się od zera.
Prognozowanie i symulacje 2010/2011
2
Prognoza przedziałowa
Statystyka
) ( ˆ ) (
) (
Q S
Y Y Q
S Q E
Q v − v
− = ma rozkład t-Studenta.
Poszukujemy jej wartości w przedziale (−tγ,tγ), gdzie γ jest poziomem istotności (wartość (tγ) odczytujemy z tablic rozkładu t-Strudenta przy poziomie istotności γ i n −k stopniach swobody)
tγ
Q S
Y Yv v
− ≤ ) ( ˆ
co jest równoważne zapisowi
γ
γ t
Q S
Y t Yv− v ≤
≤
− ( )
ˆ
Po przekształceniach otrzymujemy przedział )
ˆ ( )
ˆ t S(Q Y Y t S Q
Yv − γ ≤ γ ≤ v + γ ,
który z prawdopodobieństwem 1−γ pokryje prawdziwą wartość zmiennej prognozowanej.
Czyli
{
Yˆ −tγS(Q)≤Yγ ≤Yˆ +tγS(Q)}
=1−γP v v