• Nie Znaleziono Wyników

4. OCENA MODELU ORAZ DOPUSZCZALNOŚCI

4.1. Ocena dopasowania modelu

Po oszacowaniu parametrów potencjalnych postaci modeli analitycz-nych konieczna jest ocena ich dopasowania do daanalitycz-nych empiryczanalitycz-nych.

Ocena ta ma na celu sprawdzenie, czy skonstruowany model przy zało-żeniach przyjętych przez prognostę (patrz: rozdz. 1) spełnia stawiane wymagania jakościowe. Kluczowym miernikiem informującym o jako-ści doboru modelu do wartojako-ści rzeczywistych jest współczynnik deter-minacji R2. Punktem wyjścia do zbudowania tej miary jest badanie sumy kwadratów odchyleń poszczególnych obserwacji od średniej. Na ry-sunku 4.1 przedstawiono graficzną ilustrację idei oceny dopasowania modelu do wartości empirycznych prognozowanej zmiennej z wykorzy-staniem R2.

Yi

Y

Nieobjaśniona część odchylenia (Yi - iYˆ )

Objaśniona część odchylenia (Yˆ -i Y ) i

Odchylenie całkowite (Yi - Y ) i Yt

t Wartości empiryczne

(zaobserwowane) Wartość średnia Yt

Rys. 4.1. Graficzna ilustracja oceny dopasowania modelu do wartości empirycznych Źródło: opracowanie własne.

Ocena dopasowania modelu do wartości rzeczywistych z wykorzy-staniem współczynnika determinacji polega na sprawdzeniu, jaką część całkowitej zmienności zmiennej prognozowanej Y (odchylenia całkowi-tego) stanowi jej objaśniona część zmienności (objaśniona część odchy-lenia). Stwierdzenie to można przedstawić w postaci podanego poniżej prostego równania:

YiY

=

YiYˆi

+

YˆiY

.

  

odchylenie całkowite

odchylenie nieobjaśnione

odchylenie objaśnione

Jeżeli przyjmiemy, że miarą reprezentującą ww. odchylenie jest wa-riancja, to powyższe równanie można sprowadzić do następującej postaci:

 

YiY 2 = 

 ˆ

2

i

i Y

Y +

YˆiY

2.

  

wariancja całkowita

wariancja nieobjaśniona

wariancja objaśniona

Korzystając z powyższego równania, można sformułować podstawą zależność prezentującą ideę współczynnika determinacji R2:

 

 

,

ˆ

1

2 1

2 2

 

 

n

t t

n

t t

y y

y y

R (4.1)

gdzie:

yt – wartość zmiennej prognozowanej w okresie/momencie t,

t – teoretyczna wartość zmiennej prognozowanej w okresie / momencie t wynikająca z modelu,

y – średnia wartość zmiennej prognozowanej Y w szeregu czasowym o długości n.

Współczynnik determinacji R2 jest opisową miarą dopasowania li-niowego modelu do danych rzeczywistych i przyjmuje wartości z prze-działu 0; 1:

W sytuacji, gdy model objaśni całkowite odchylenie zmiennej, współczynnik R2 przyjmie wartość równą 1. W celu ułatwienia interpre-tacji wartości R2 uzyskaną wartość mnoży się razy 100% i interpretuje jako procentowy udział całkowitej zmienności zmiennej, który został ob-jaśniony przez model. Generalizując, można stwierdzić, że współczyn-nik determinacji wskazuje, w ilu procentach zbudowany przez prognostę model objaśnia zmienną prognozowaną. Zatem im wyższą wartość przyjmuje R2 tym oceniany model jest lepiej dopasowany do wartości rzeczywistych58. Wykorzystanie symbolu R2 do oznaczenia współczyn-nika determinacji wywspółczyn-nika z tego, że w modelu liniowym współczynnik ten jest równy kwadratowi współczynnika korelacji r.

Alternatywnym miernikiem oceny jakości modelu i jego dopasowa-nia do wartości rzeczywistych jest współczynnik interdeterminacji 2:

2 1

2 2 1

) (

ˆ ) (

 

 

n

t t t

n

t t t

y y

y

y . (4.3)

Współczynnik interdeterminacji 2, określany także w literaturze jako współczynnik zbieżności, wskazuje, jaką część odchylenia całko-witego stanowi odchylenie nieobjaśnione. Analogicznie, w celu ułatwie-nia interpretacji wartości 2, uzyskaną wartość mnoży się razy 100%

i interpretuje jako procentowy udział całkowitej zmienności zmiennej, który nie został objaśniony przez model. Suma wartości współczynni-ków determinacji oraz interdeterminacji jest równa jedności:

.

2 1

2 

R (4.4)

Współczynnik determinacji można wykorzystać do oceny dopaso-wania modeli nieliniowych do wartości empirycznych pod warunkiem ich sprowadzalności do postaci liniowej. Wyznaczany jest wówczas dla postaci zlinearyzowanej. Może on jednak przyjąć wartość spoza ww.

przedziału, co uniemożliwia jego interpretację, a ponadto porównanie

58 D.T. Larose, Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, Warszawa 2016, s. 42-46.

potencjalnych modeli. W takich sytuacjach należy wykorzystać skory-gowany współczynnik determinacji R~2:

2

2 1

1 1 1

~ R

m n

R n

 

 , (4.5)

gdzie:

n – liczba obserwacji w szeregu czasowym,

m – liczba zmiennych objaśniających (bez zmiennej stojącej przy wyra-zie wolnym).

Stosując współczynnik determinacji do oceny dopasowania modeli do wartości empirycznych, należy zwrócić szczególną uwagę w trakcie jego dekompozycji na występowanie w analizowanym szeregu czaso-wym tzw. obserwacji nietypowych, punktów odstających (oddalonych).

Wówczas gdy model istotnie zmienia się w zależności od ich występo-wania lub nieobecności w szeregu czasowym, obserwacja ta może być tzw. obserwacją wpływową. Zwykle cechą charakteryzującą taką obser-wację jest duża wartość reszty z modelu. Niewyeliminowanie takich ob-serwacji na etapie gromadzenia i analizy danych59 lub nieuwzględnienie ich wpływu na dobór modelu do wartości rzeczywistych może doprowa-dzić do sformułowania mylnych wniosków i rekomendacji.60

Do oceny dopasowania modelu do wartości rzeczywistych można wykorzystać także odchylenie standardowe reszt modelu s:

, ˆ) 1 (

1 2

1

y m y

s n n

tt

 

 

(4.6)

gdzie:

y

t – wartość zmiennej prognozowanej w okresie/momencie t,

t – teoretyczna wartość zmiennej prognozowanej w okresie/momencie t, n – liczba obserwacji w szeregu czasowym,

m –liczba zmiennych objaśniających (bez zmiennej stojącej przy wy-razie wolnym).

59 J. Nazarko (red.), Prognozowanie w zarządzaniu przedsiębiorstwem. Cz. II., op. cit.

Wartość odchylenia standardowego reszt modelu informuje o prze-ciętnych odchyleniach wartości rzeczywistych prognozowanej zmiennej od wartości teoretycznej uzyskanej z wykorzystaniem zbudowanego przez prognostę modelu. Miara ta jest wyrażona w tych samych jednost-kach co zmienna prognozowana. Im mniejszą wartość przyjmuje odchy-lenie standardowe reszt modelu, tym jest on lepiej dopasowany do war-tości empirycznych, a co za tym idzie – jest on wyższej jakości.

Komplementarną miarą oceny dopasowania modelu do wartości rzeczywistych jest współczynnik wyrazistości61:

100

y

w s . (4.7)

Współczynnik ten ułatwia interpretację wartości odchylenia stan-dardowego reszt modelu, informując, jaką część średniej wartości zmiennej prognozowanej stanowi to odchylenie. Podobnie jak poprzed-nio, im mniejsza jest wartość współczynnika wyrazistości, tym model lepiej odzwierciedla zmiany zmiennej prognozowanej.

Jeżeli wyniki oceny dopasowania modelu nie spełniają stawianych mu przez odbiorcę prognozy wymagań jakościowych, należy zbudować nowy model bądź rekomendować model alternatywny i poddać go dal-szej weryfikacji. Na ocenę końcową modelu mają wpływ oceny istotno-ści parametrów modelu oraz oceny estymatorów (patrz rozdz. 1).