• Nie Znaleziono Wyników

ANALIZA I PROGNOZOWANIE SZEREGÓW CZASOWYCH Z PROGRAMEM SAS

N/A
N/A
Protected

Academic year: 2021

Share "ANALIZA I PROGNOZOWANIE SZEREGÓW CZASOWYCH Z PROGRAMEM SAS"

Copied!
187
0
0

Pełen tekst

(1)

ANALIZA

I PROGNOZOWANIE SZEREGÓW

CZASOWYCH

Z PROGRAMEM SAS

(2)
(3)

OFICYNA WYDAWNICZA SZKOŁA GŁÓWNA HANDLOWA W WARSZAWIE WARSZAWA 2015

ANALIZA

I PROGNOZOWANIE SZEREGÓW

CZASOWYCH

Z PROGRAMEM SAS

STANISŁAW ŁOBEJKO KAROLINA MASŁOWSKA RAFAŁ WOJDAN

redakcja naukowa

STANISŁAW ŁOBEJKO

(4)

Rafał Wojdan – rozdziały: 2, 3, 6, 7, 8

Recenzent Joanicjusz Nazarko

Redaktor

Danuta Dąbowska

© Copyright by Stanisław Łobejko, Karolina Masłowska, Rafał Wojdan

& Szkoła Główna Handlowa w Warszawie, Warszawa 2014

Wszelkie prawa zastrzeżone. Kopiowanie, przedrukowywanie i rozpowszechnianie całości lub fragmentów niniejszej publikacji bez zgody wydawcy zabronione.

Wydanie I

ISBN 978-83-7378-958-6

Szkoła Główna Handlowa w Warszawie – Oficyna Wydawnicza 02-554 Warszawa, al. Niepodległości 162

tel. +48 22 564 94 77, 22 564 95 46 www.wydawnictwo.sgh.waw.pl e-mail: wydawnictwo@sgh.waw.pl

Projekt i wykonanie okładki Monika Trypuz

Skład i łamanie Gemma

Druk i oprawa QUICK-DRUK s.c.

tel. +48 42 639 52 92 e-mail: quick@druk.pdi.pl

Zamówienie 10/I/15

(5)

do Spisu treści

Spis treści

Wstęp . . . 9

Rozdział 1 Wprowadzenie do analizy szeregów czasowych . . . 11

1 .1 . Dane i informacje w szeregach czasowych . . . 11

1 .2 . Dane i biblioteki w programie SAS 9 .3 . . . 15

Rozdział 2 Dekompozycja szeregu czasowego . . . 19

2 .1 . Składowe szeregu czasowego . . . 19

2 .2 . Wyodrębnianie składowych szeregu czasowego . . . 21

2 .3 . Modele szeregów czasowych . . . 22

2 .4 . Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu . . . 25

Rozdział 3 Tendencja rozwojowa . . . 37

3 .1 . Pojęcie trendu . . . 37

3 .2 . Trend deterministyczny . . . 38

3 .3 . Trend stochastyczny . . . 44

3 .4 . Analiza szeregu czasowego z użyciem programu SAS – tendencja rozwojowa . . . 48

Rozdział 4 Wyrównywanie szeregów czasowych . . . 61

4 .1 . Średnie ruchome . . . 61

4 .2 . Wyrównywanie wykładnicze . . . 64

4 .3 . Analiza szeregu czasowego z użyciem programu SAS – wyrównywanie szeregów czasowych . . . 68

(6)

Rozdział 5

Zjawisko sezonowości w szeregach czasowych . . . 81

5 .1 . Pojęcie sezonowości . . . 81

5 .2 . Wstęp do modelowania sezonowości . . . 84

5 .3 . Wskaźniki wahań sezonowych . . . 85

5 .4 . Wahania okresowe . . . 87

5 .5 . Analiza szeregu czasowego z użyciem programu SAS – zjawisko sezonowości . . . 88

Rozdział 6 Stacjonarność szeregów czasowych . . . 101

6 .1 . Definicja stacjonarności szeregu czasowego . . . 101

6 .2 . Metody przekształcania szeregu czasowego niestacjonarnego w stacjonarny . . . 103

6 .3 . Analiza stacjonarności na podstawie funkcji autokorelacji . . . 106

6 .4 . Test Dickeya ‑Fullera . . . 108

6 .5 . Analiza szeregu czasowego z użyciem programu SAS – stacjonarność szeregów czasowych . . . 110

Rozdział 7 Modele ARMA . . . 117

7 .1 . Proces autoregresyjny AR(p) . . . 118

7 .2 . Proces średniej ruchomej MA(q) . . . 123

7 .3 . Dualność AR(p) i MA(q) . . . 126

7 .4 . Twierdzenie Wolda o dekompozycji . . . 129

7 .5 . Klasa modeli ARMA . . . 130

7 .5 .1 . Proces ARMA . . . 131

7 .5 .2 . Proces ARIMA . . . 132

7 .5 .3 . Proces SARIMA . . . 134

7 .6 . Stacjonarność i sezonowość w modelach ARMA . . . 136

7 .7 . Procedura ARIMA . . . 138

7 .8 . Identyfikacja modelu ARMA przy pomocy modułu Time Series Forecasting System . . . 140

Rozdział 8 Procedura STATESPACE . . . 151

8 .1 . Charakterystyka modeli State Space . . . 152

8 .2 . Działanie procedury STATESPACE . . . 154

8 .3 . Podsumowanie procedury wyboru wektora stanu . . . 158

8 .4 . Procedura STATESPACE w programie SAS . . . 159

8 .5 . Analiza szeregów czasowych z użyciem procedury STATESPACE . . . 160

(7)

7

Spis treści

Rozdział 9

Prognozowanie szeregów czasowych . . . 171

9 .1 . Istota prognozowania . . . 171

9 .2 . Rodzaje prognoz . . . 172

9 .3 . Podstawowe zasady prognozowania . . . 174

9 .4 . Błędy prognozy . . . 176

9 .5 . Prognozowanie w systemie SAS 9 .3 . . . 178

Wybrane strony internetowe . . . 181

Bibliografia . . . 181

Spis rysunków . . . 184

Spis tabel . . . 187

(8)
(9)

9

Wstęp

Wstęp

Książka powstała w odpowiedzi na zgłaszaną przez studentów studiów dziennych oraz podyplomowych potrzebę posiadania pomocy dydaktycznej do laboratorium z Analizy i prognozowania szeregów czasowych z systemem SAS . Przedmiot ten jest realizowany w systemie wykład plus laboratorium komputerowe . W ramach zajęć słuchacze są zobowiązani do wykonania kilku projektów, które podlegają ocenie i są warunkiem uzyskania zaliczenia . Projekty zawierają nie tylko analizy statystyczne wykonane za pomocą programu komputerowego SAS 9 .3, ale również część teore‑

tyczną oraz interpretacje uzyskiwanych rezultatów i wnioski . Analizy były prowadzone za pomocą interfejsu okienkowego, a także z wykorzystaniem procedur programu SAS 9 .3 . Dzięki temu słuchacze poznawali zarówno teorię szeregów czasowych i prognozowania, jak również mieli możliwość wykorzystania zdobytej wiedzy teo‑

retycznej do zastosowań praktycznych polegających na analizie wybranego szeregu czasowego . W ten sposób następowało łączenie teorii z praktyką .

Taki sposób podejścia do nauczania przedmiotu z dziedziny statystyki w obecnej rzeczywistości, w której istnieje stosunkowo łatwy dostęp do wielu baz danych, wydaje się jak najbardziej uzasadniony, ponieważ umożliwia zdobycie nowych kompeten‑

cji analitycznych w zakresie analiz i prognozowania szeregów czasowych . Istnieje wiele publikacji poświęconych szeregom czasowym, ale w większości są to prace prezentujące teorię, w niektórych wypadkach wzbogaconą przykładami . Korzysta‑

nie z wiedzy teoretycznej zawartej w podręcznikach do analizy szeregów czasowych i prognozowania w trakcie zajęć laboratoryjnych z programem SAS 9 .3 sprawiało słuchaczom pewne trudności . Dlatego też stworzony został podręcznik, który łączy

(10)

w sobie część teoretyczną z zakresu przedmiotu analizy i prognozowania szeregów czasowych z częścią aplikacyjną interfejsu okienkowego oraz zestawem procedur oferowanych przez SAS 9 .2 . W celu ułatwienia przyswajania sobie wiedzy teoretycznej oraz nabywania praktycznych umiejętności wykorzystania oprogramowania SAS 9 .3 do analizy i prognozowania, część aplikacyjna została oparta na przykładowym szeregu czasowym z biblioteki Sashelp, a więc dostępnym dla każdego użytkownika programu . W ten sposób podręcznik może być użyteczny dla każdego, kto będzie chciał poznać teorię szeregów czasowych oraz nauczyć się metod i sposobów analizy i prognozowania szeregów czasowych za pomocą programu SAS 9 .3 .

(11)

11

1.1. Dane i informacje w szeregach czasowych

Rozdział 1

Wprowadzenie do analizy szeregów czasowych

1.1. Dane i informacje w szeregach czasowych

We współczesnych przedsiębiorstwach istnieje duże zapotrzebowanie na informa‑

cje gospodarcze o sytuacji na rynku, trendach w gospodarce czy wreszcie możliwych zmianach strukturalnych . Różny jest zakres informacji wymaganych w procesach decyzyjnych poszczególnych szczebli zarządzania . Niezależnie od szczebla zarzą‑

dzania każdy menedżer w procesie podejmowania decyzji powinien dysponować szczegółowymi analizami zjawisk charakteryzujących dziedzinę, której decyzje będą dotyczyły . Rozwój technologii informacyjno ‑komunikacyjnych sprawia, że przedsię‑

biorstwa gromadzą w formie elektronicznej wiele danych dotyczących działalności ich samych oraz ich klientów, a także parametrów charakteryzujących gospodarkę . Informacje te najczęściej są indeksowane czasem (zjawiska dzieją się w czasie), więc tworzą zbiory danych (ciągi danych) nazywane szeregami czasowymi . Dane właściwie przetworzone oraz poddane pogłębionym analizom mogą być bogatym źródłem in‑

formacji, w szczególności informacji zarządczych . Dzięki nim łatwiej jest podejmować decyzje obarczone mniejszym ryzykiem, a przedsiębiorstwo może odnosić sukcesy rynkowe . Pomaga w tym zastosowanie nowoczesnych komputerowych narzędzi do gromadzenia, przetwarzania oraz analizowania danych . Dodatkowo niektóre pro‑

gramy statystyczne, jak na przykład SAS, umożliwiają także prognozowanie przyszłych poziomów zjawiska na podstawie danych historycznych . Podstawowym materiałem

(12)

do analiz statystycznych są dane . Dane to surowe fakty, liczby lub inne szczegóły dotyczące pewnych zdarzeń . Najczęściej są zapisywane i przechowywane w postaci sformalizowanych zapisów na nośniku danych . Na podstawie danych tworzone są informacje . Informacja powstaje na bazie danych, którymi są liczby i fakty opisujące obiektywnie istniejącą rzeczywistość . Dane poddane analizie (przetworzeniu) stają się informacją . Informacja to dane umieszczone w określonym kontekście nadającym im znaczenie . Informacje, które mogą być pomocne w procesie zarządzania firmą tworzą informację zarządczą, która daje podstawę do efektywnego podejmowania decyzji .

Zależności pomiędzy surowymi danymi i informacją w procesie podejmowania decyzji można przedstawić graficznie:

Dane Informacja

Informacja zarządcza

Decyzje działania i

Rysunek 1. Informacja w procesie decyzyjnym

Źródło: opracowanie własne na podstawie J . Stoner, Ch . Wankel, Kierowanie, PWE, Warszawa 1992 .

(13)

13

1.1. Dane i informacje w szeregach czasowych

Aby efektywnie wykorzystywać możliwości, jakie oferują nam nowoczesne techniki analizy danych, należy mieć dostęp do najnowszych danych . Dane w przed‑

siębiorstwie mogą być pozyskiwane z różnych źródeł, które najogólniej można podzielić na:

wewnętrzne,

• zewnętrzne, oraz•

pierwotne,

• wtórne .

• Szczegółową charakterystykę różnych rodzajów źródeł informacji przedstawia tabela 1 .

Tabela 1. Typowa klasyfikacja źródeł danych

Kryterium Rodzaj Przykład

Granice organizacyjne przedsiębiorstwa

wewnętrzne raporty sprzedażowe, finansowe, bilans, budżet, raporty roczne, wewnętrzne gazetki, szkolenia, zebrania

zewnętrzne prasa ogólna i specjalistyczna, publikacje instytucji badawczych, rządowych i samorządowych

Cel gromadzenia informacji

wtórne raporty powstające dla innych celów niż rozwiązanie danego problemu badawczego firmy

pierwotne raporty powstałe dla innych celów niż rozwiązanie danego problemu

Etap procesu decyzyjnego

analityczne raporty dotyczące analizy sprzedaży według poszczególnych produktów, rynków, klientów, oceny wizerunku, pozycji progno styczne prognozy dotyczące potencjału danego rynku, możliwości wejścia

lub wyjścia konkurentów

kontrolne raporty dotyczące skuteczności i efektywności promocji, rentowności kanałów dystrybucji

Kraj pochodzenia

krajowe opracowania statystyczne, raporty krajowych urzędów, ministerstw, organizacji i instytutów branżowych zagraniczne opracowania statystyczne urzędów poszczególnych krajów oraz

organizacji, czasopisma zagraniczne

Źródło: E . Frąckiewicz, Informacyjne uwarunkowania podejmowania decyzji marketingowych, „Przegląd Organizacji” 2006, nr 3, s . 41 .

Dane pochodzące z różnych źródeł mogą być też różnej jakości . Należy oceniać je pod kątem ich1:

prawdziwości,

jednoznaczności,

1 P . Dittman, Metody prognozowania sprzedaży w przedsiębiorstwie, Wyd . AE im . O . Langego, Wro‑

cław 2000, s . 38 .

(14)

identyfikowalności zjawiska przez zmienną/zmienne,

• kompletności,

• aktualności w przyszłości, kosztu zbierania i opracowywania,

• porównywalności .

• Dane charakteryzujące rozwój zjawisk gospodarczych lub społecznych są odno‑

towywane i gromadzone wraz z upływem czasu, tworząc ciągi liczbowe określane mianem szeregów czasowych .

Szereg czasowy to uporządkowany zbiór obserwacji statystycznych (zbiór stanów zmiennych), charakteryzujących zmiany poziomu określonego zjawiska w czasie2 .

Szereg czasowy momentów przedstawia dane charakteryzujące zjawisko (stan obiektu) w określonych momentach czasu, którymi są najmniejsze (dalej niepodzielne) jednostki czasu, jak np . kurs euro na zakończenie sesji dla kolejnych dni miesiąca .

Szereg czasowy okresów przedstawia dane charakteryzujące zjawisko (stan obiektu) w określonych okresach czasu . Okres czasu to pewien odcinek, np . dzień, tydzień, miesiąc czy rok . Taki szereg czasowy okresów tworzy na przykład średni kurs euro dla kolejnych dni miesiąca . W tym wypadku każda wartość szeregu jest średnią z poziomów kursów odnotowanych w danym dniu w trakcie trwającej zwy‑

kle kilka godzin sesji giełdowej, a więc wartość ta jest uśrednionym poziomem dla całego (kilkugodzinnego) odcinka czasu w danym dniu notowań .

Jednowymiarowy szereg czasowy jest to zbiór stanów jednej zmiennej Y, upo‑

rządkowanych według wartości zmiennej czasowej t (t = 1, 2, . . . n), charakteryzujących zjawisko (stan obiektu), np . kurs jednej waluty dla kolejnych dni miesiąca .

Wielowymiarowy szereg czasowy jest to zbiór stanów m zmiennych Y1, Y2, . . . ., Ym, uporządkowanych według wartości zmiennej czasowej t (t = 1, 2, . . . n), charakteryzu‑

jących zjawisko (stan obiektu), np . kurs kilku walut dla kolejnych dni miesiąca . Szeregi przekrojowe

Jednowymiarowy szereg przekrojowy jest to zbiór stanów jednej zmiennej Y, z których każdy odnosi się do tego samego momentu lub okresu t i do innego j‑tego obiektu (j = 1, 2, . . ., k), np . kurs jednej waluty w kilku bankach .

Wielowymiarowy szereg przekrojowy jest to zbiór stanów m zmiennych Y1, Y2, . . . ., Ym, z których każdy odnosi się do tego samego momentu lub okresu t i do innego j‑tego obiektu (j = 1, 2, . . ., k), charakteryzujących zjawisko (stan obiektu), np . kurs kilku walut w kilku bankach .

Rodzaje szeregów czasowych przedstawia rysunek 2 .

2 A . Frenkiel, G . Kildiszew, Analiza szeregów czasowych i prognozowanie, PWE, Warszawa 1976, s . 13 .

(15)

15

1.2. Dane i biblioteki w programie SAS 9.3

Szeregi czasowe momentów

Szeregi czasowe okresów

Wielowymiarowe szeregi czasowe Jednowymiarowe szeregi czasowe

Rysunek 2. Rodzaje szeregów czasowych

Źródło: Prognozowanie w zarządzaniu przedsiębiorstwem, t . 2, Prognozowanie na podstawie szeregów czasowych, red . J . Nazarko, Wyd . Politechniki Białostockiej, Białystok 2004, s . 20 .

1.2. Dane i biblioteki w programie SAS 9.3

Program SAS 9 .3 to rozbudowane narzędzie analityczne umożliwiające przepro‑

wadzanie zaawansowanych analiz statystycznych i ekonometrycznych .

SAS 9.3

Analiza szeregów

czasowych Prognozowanie na bazie

szeregów czasowych Budowa modeli ekonometrycznych Rysunek 3. Możliwości programu SAS 9.3

Źródło: opracowanie własne na podstawie dokumentacji programu SAS .

(16)

Program SAS umożliwia realizację wielu funkcji, wśród których najważniejsze to:

ekstrapolacja trendów, wygładzanie wykładnicze (metoda Holta ‑Wintersa, modele

• bez trendu, trend liniowy, wykładniczy, sezonowość addytywna lub multiplika‑

tywna),

modele strukturalne szeregów czasowych oraz modele ze składnikiem nieobser‑

wowalnym (unobserved components model),

regresja dynamiczna i modele funkcji transferowych,

prognozowanie wielowymiarowych szeregów czasowych za pomocą wektorowej

autoregresji (modele VAR) oraz ogólnych modeli przestrzeni stanów fazowych (state space models),

automatyczne wykrywanie obserwacji odstających i zmian strukturalnych szeregu,

• dekompozycja szeregów czasowych oraz korekcja ze względu na sezonowość,

• analiza spektralna oraz analiza widma mieszanego w celu wyszukiwania okreso‑

• wości lub cyklicznych wzorów w danych .

Program SAS 9 .3 zawiera wiele procedur umożliwiających m .in .:

analizę szeregów czasowych,

prognozowanie na podstawie szeregów czasowych,

• modelowanie i symulację systemów,

• badanie sezonowości,

• przeprowadzanie analiz ekonometrycznych,

• analizy i raportowanie finansowe,

• dostęp do danych ekonometrycznych i finansowych,

• zarządzanie danymi .

• Dodatkowo program SAS 9 .3 posiada dołączony interaktywny interfejs użyt‑

kownika – Time Series Forecasting System (TSFS), który umożliwia posługiwanie się procedurami bez konieczności znajomości tych procedur i języka 4GL (4th Generation Language) . Niezależnie od zaimplementowanych i dostępnych poprzez komputerowy (okienkowy) interfejs procedur, posługując się językiem 4GL można tworzyć własne procedury, umożliwiające wykonywanie operacji na całych zbiorach danych . Język 4GL posiada dwa typy bloków programowych:

DATA‑Step

• – bloki przekształcające zbiory z danymi (wczytywanie danych z plików tekstowych, tworzenie plików tekstowych, scalanie zbiorów, wpisywanie i usuwanie zmiennych i obserwacji),

PROC‑Step

• – bloki wykonujące wyspecjalizowane procedury (sortowanie danych, transpozycje zbiorów, analiza statystyczna, tworzenie wykresów i map oraz wiele innych) .

Elementami języka są słowa kluczowe, nazwy procedur, nazwy zmiennych, stałe i znaki specjalne . Nazwa zmiennej może składać się z od jednego do ośmiu znaków

(17)

17

1.2. Dane i biblioteki w programie SAS 9.3

alfanumerycznych i znaku _ . Małe i duże litery w nazwie nie są rozróżniane . Nazwa musi zaczynać się od litery lub znaku _ .

Instrukcje w języku 4GL kończą się średnikiem . Instrukcje można rozpoczynać w dowolnej kolumnie i mogą zajmować jedną lub kilka linii .

Komentarze mogą mieć postać instrukcji, zaczynającej się od *, a kończącej się średnikiem:

* to jest komentarz;

lub znajdować się między znakami /* i */:

/* to też jest komentarz */

W SAS‑ie są tylko dwa rodzaje zmiennych i stałych:

znakowe – mogą mieć długość do 200 znaków, przykład instrukcji podstawienia stałej znakowej do zmiennej znakowej: zm_znak = „ AAAaaaBBBbbbCCCccc”;

numeryczne – mogą zajmować od 3 do 8 bajtów (domyślnie 8 bajtów) i są zapamię‑

tywane zawsze w postaci zmiennoprzecinkowej, przykład instrukcji podstawienia stałej do zmiennej numerycznej: zm_numer = 3 .14;

Stałe numeryczne można zapisywać także w notacji wykładniczej np .: 2 .456E+10 . Daty przechowywane są w postaci numerycznej jako liczba dni, które minęły od 1 stycznia 1960 r . (dla dni wcześniejszych będzie to liczba ujemna) . Możliwe jest też przechowywanie łączne daty i czasu jako liczby sekund, które upłynęły od godziny 0:00 1 stycznia 1960 roku .

Dane, na których operuje SAS, przechowywane są w zbiorach o specjalnym for‑

macie, możliwym do odczytania tylko z poziomu systemu SAS . Dla użytkownika są to tabele dwuwymiarowe . Kolumny takiej tabeli nazywane są zmiennymi, a wiersze obserwacjami . Do zbiorów odwołujemy się, podając ich nazwy .

Nazwa biblioteki jest dwuczłonowa: nazwabiblioteki.nazwa zbioru, gdzie pierw‑

szy człon to nazwa biblioteki SAS zawierającej plik, a drugi człon to nazwa zbioru . Tworzenie biblioteki

1 . Kliknąć Widok → Explorator 2 . Kliknąć Plik → Nowy

3 . W oknie Nowa biblioteka dokonać jej specyfikacji . Chcąc, aby biblioteka była tworzona za każdym uruchomieniem komputera, włączyć opcję Włącz po uru‑

chomieniu . 4 . Kliknąć Ok.

<Nazwa biblioteki> to nazwa biblioteki SAS‑a . Jest to jedna z nazw standardo‑

wych lub nazwa podana wcześniej przez użytkownika poleceniem:

libname aa ‘/położenie pliku w drzewie katalogów systemu plikowego komputera/;

(18)

Polecenie to musi być wpisane w oknie PROGRAM i podane do wykonania klikaniem Locals → Submit .

Listę bibliotek standardowych, które są wcześniej predefiniowane, możemy zobaczyć w oknie LIBNAME wyświetlającym wszystkie aktywne biblioteki . Okno LIBNAME pojawi się po naciśnięciu Globals → Access → Display Libraries w oknie PROGRAM . Wśród bibliotek standardowych mamy zdefiniowaną bibliotekę WORK do przechowywania zbiorów tymczasowych . Jej zawartość jest kasowana po wyjściu z systemu SAS .

(19)

19

2.1. Składowe szeregu czasowego

Rozdział 2

Dekompozycja szeregu czasowego

2.1. Składowe szeregu czasowego

Szereg czasowy to ciąg danych uporządkowanych chronologicznie w czasie, przy czym pomiar danych wykonywany jest z dokładnym i stałym krokiem cza‑

sowym . Wyróżniamy dwa rodzaje szeregów czasowych ze względu na okres, który obejmują dane: szereg czasowy momentów i okresów . Szereg czasowy momentów obrazuje dane charakteryzujące zjawisko (stan obiektu) w określonych momentach czasu, np . kurs euro na zakończenie sesji dla kolejnych dni miesiąca . Natomiast szereg czasowy okresów przedstawia dane charakteryzujące zjawisko (stan obiektu) w określonych okresach czasu, np . średni kurs euro dla kolejnych dni miesiąca . W wypadku szeregu czasowego momentów wartości badanego zjawiska mają cha‑

rakter zasobów . W szeregach czasowych okresów wartości badanego zjawiska mają charakter strumieni .

Do składowych części szeregu czasowego zaliczamy składniki systematyczne oraz przypadkowe, zwane inaczej składnikami losowymi lub wahaniami przypadkowymi . Składowe systematyczne są efektem oddziaływania na zmienną prognozowaną sta‑

łego zestawu czynników i mogą występować w postaci tendencji rozwojowej, wahań okresowych (sezonowych lub cyklicznych) albo mogą mieć stały przeciętny poziom . Składowa systematyczna określa procesy deterministyczne, podczas gdy składowa losowa – proces stochastyczny . Część resztowa szeregu nie podlega objaśnieniu i zawiera przypadkowe wahania szeregu wokół części systematycznej .

(20)

W klasycznej analizie rozwoju zjawiska w czasie zakłada się, że poziom badanego zjawiska (Yt) jest funkcją następujących składników:

Tt – trendu,

Ct – wahań cyklicznych, St – wahań sezonowych, It – wahań przypadkowych .

Składowe te mogą mieć charakter zjawiska systematycznego lub ich występowanie może być dziełem przypadku . Dlatego też składowe szeregu czasowego dzielimy na dwie podstawowe grupy: składowe o charakterze systematycznym oraz składowe przypadkowe . Składowe o charakterze systematycznym to: trend, stały poziom oraz składowe okresowe, które mogą mieć charakter sezonowy lub cykliczny . Składowe przypadkowe charakteryzują działanie czynników o charakterze losowym i są nie‑

przewidywalne co do siły oraz kierunku .

Składowe szeregu czasowego przedstawia rysunek 4 .

Składowa przypadkowa Składowe szeregu czasowego

Stały poziom Trend

Wahania cykliczne Wahania

sezonowe Składowa

okresowa Składowa systematyczna

Rysunek 4. Składowe szeregu czasowego

Źródło: P . Dittmann, Prognozowanie w przedsiębiorstwie, Ofi cyna Ekonomiczna, Kraków 2008, s . 51 .

W szeregach czasowych mogą występować obserwacje istotnie odbiegające od pozo‑

stałych obserwacji w szeregu . Są to wartości nietypowe dla danego zjawiska, spowodowane różnego rodzaju zaburzeniami w jego przebiegu . Występowanie obserwacji nietypowych

(21)

21

2.2. Wyodrębnianie składowych szeregu czasowego

może prowadzić do zniekształcenia wyników analizy szeregu czasowego, dlatego też na‑

leży je zastąpić np . średnią arytmetyczną obserwacji sąsiednich . Należy jednak zwrócić uwagę na przyczyny występowania wartości odstających w szeregu, ponieważ mogą one obrazować ważne wydarzenia ekonomiczne mające znaczący wpływ w przebiegu całego szeregu czasowego . Tak więc fakt występowania wartości odstających powinien być dokładnie zbadany jeszcze przed rozpoczęciem analizy statystycznej . Podczas analizy wykresu szeregu czasowego można również dostrzec punkty zwrotne, w których następuje zmiana kierunku trendu lub zmiana tempa zmian wartości zmiennej .

2.2. Wyodrębnianie składowych szeregu czasowego

W celu wyodrębnienia składowych szeregu należy przeprowadzić jego dekom‑

pozycję . Dekompozycja szeregu czasowego jest metodą statystyczną umożliwiającą wyodrębnienie poszczególnych składowych w modelu szeregu czasowego . Wstępna identyfikacja poszczególnych składowych możliwa jest również za pomocą analizy kształtu i przebiegu wykresu szeregu .

Rysunek 5. Szeregi czasowe z różnymi rodzajami składowych

Źródło: M . Cieślak, Prognozowanie gospodarcze. Metody i zastosowania, PWN, Warszawa 2005 .

(22)

W szeregu czasowym nie wszystkie składniki muszą występować równocześnie . Istnieją szeregi czasowe, w których nie występuje sezonowość ani cykliczność . Dla takiego szeregu budujemy model dwuskładnikowy .

Yt = Tt + It

W modelu dwuskładnikowym dekompozycję szeregu czasowego przeprowadza się w dwóch etapach:

1 . wyodrębnienie trendu, określenie jego siły i kierunku;

2 . pomiar wahań przypadkowych .

Jeśli w szeregu czasowym występują wahania sezonowe, a nie występują cykliczne, to dla takiego szeregu budujemy model trójskładnikowy .

Yt = Tt + St + It

W modelu trójskładnikowym dodatkowo określa się siłę i kierunek wahań . W praktyce bardzo często mamy do czynienia z szeregami o dwóch lub trzech składnikach . Szeregi, w których występuje cykliczność zwykle dotyczą zjawisk eko‑

nomicznych badanych w długich, ponaddziesięcioletnich okresach .

2.3. Modele szeregów czasowych

Szeregi czasowe można podzielić na dwa podstawowe typy w zależności od relacji zachodzących pomiędzy poszczególnymi składnikami modelu: szereg addytywny oraz multiplikatywny . Typ szeregu zależy od wzajemnych relacji skła‑

dowych szeregu, a więc także od sposobu, w jaki wpływają one na prognozowaną zmienną .

Model addytywny dotyczy szeregu czasowego, w którym obserwowane wartości zmiennej prognozowanej stanowią sumę składowych szeregu, a więc wartość trendu jest pomniejszana lub powiększana o stałe wartości czynnika sezonowości . Skła‑

dowe w szeregu addytywnym są niezależne i nie zachodzą między nimi interakcje . Wahania addytywne charakteryzują się stałą amplitudą wahań i nie są zależne od poziomu zjawiska w czasie . Każdy z elementów w modelu addytywnym wyrażony jest w tych samych jednostkach . Podczas przeprowadzania dekompozycji szeregu czasowego wahania sezonowe, jak i przypadkowe, stanowią odchylenie od trendu lub od przeciętnego poziomu zmiennej prognozowanej .

(23)

23

2.3. Modele szeregów czasowych

Model addytywny: Yt = Tt + Ct + St + It

Rysunek 6. Model addytywny szeregu czasowego z trendem

Źródło: opracowanie własne .

W wypadku modelu multiplikatywnego oryginalny szereg czasowy wyrażony jest jako iloczyn jego części składowych . Oznacza to, że wartość trendu jest pomniejszana lub powiększana proporcjonalnie przez odpowiednią miarę sezonowości . Wartość oczekiwana składnika losowego w modelu multiplikatywnym wynosi 1 . Wahania multiplikatywne mają zmienną amplitudę, a ich siła oddziaływania zależy od zmian zjawiska w czasie .

Model multiplikatywny: Yt = Tt * Ct * St * It

Rysunek 7. Model multiplikatywny szeregu czasowego z trendem

Źródło: opracowanie własne .

Wahania multiplikatywne wyrażane są w ujęciu względnym, relatywnym lub w wartościach procentowych . Wahania addytywne przedstawiane są natomiast w ujęciu absolutnym lub w jednostkach, w których mierzona jest badana cecha .

Ponieważ model multiplikatywny nie może być wykorzystywany w wypadku szeregów czasowych o niewielkiej liczbie rekordów, jak również szeregów czasowych,

(24)

które przyjmują bardzo małe wartości lub równe zeru, poza dekompozycją kla‑

syczną (addytywną i multiplikatywną) wyróżniamy również pseudo ‑addytywną i log‑addytywną dekompozycję .

W dekompozycji pseudo ‑addytywnej wahania sezonowe oraz składowe szeregu czasowego połączone są związkiem addytywno ‑multiplikatywnym . W modelu tym zarówno wahania sezonowe jak i wahania przypadkowe są zależne od poziomu trendu, ale jednocześnie nie są uzależnione od siebie nawzajem . Szereg oryginalny może być przedstawiony w następujący sposób:

Model pseudo ‑addytywny Yt = Tt + Tt * (St – 1) + Tt * (It – 1) = Tt * (St + It – 1)

Rysunek 8. Model pseudo ‑addytywny z trendem bocznym

Źródło: opracowanie własne .

Dekompozycja log‑addytywna pod względem budowy jest taka sama jak addy‑

tywna, jednak opisuje zmienną logYt, zamiast Yt . Model log‑addytywny logYt = Tt + Ct + St + It

lub

Rysunek 9. Modele log‑addytywne szeregów czasowych

Źródło: opracowanie własne .

Ponieważ uznaje się, że ten rodzaj dekompozycji może być stosowany do szere‑

gów, w których amplituda wahań sezonowych rośnie lub maleje proporcjonalnie do

(25)

25

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

wartości szeregu, często traktowana jest ona jako dekompozycja multiplikatywna, co jest błędem . Różnice są widoczne po zastosowaniu procedury X‑11, która daje możliwość zarówno dekompozycji log‑addytywnej, jak i multiplikatywnej . Estymatory trendu po dekompozycji log‑addytywnej wymagają korekty błędu, ponieważ średnie arytmetyczne użyte do wyrównywania są większe od średnich geopatycznych . Do‑

datkowo przy dekompozycji log‑addytywnej do wartości odstających wymagane jest użycie innych wartości odstających niż przy dekompozycji multiplikatywnej3 . Według wytycznych Eurostatu dekompozycję log‑addytywną powinno się stosować do sze‑

regu z trendem zarówno w średniej, jak i w wariancji, natomiast multiplikatywną do szeregów z trendem tylko w średniej . Uznaje się również, że ten rodzaj dekompozycji ma dobre zastosowanie dla danych charakteryzujących się rozkładem Poissona .

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

Analizę szeregów czasowych przeprowadzamy z użyciem metod i narzędzi sta‑

tystycznych zaimplementowanych do programu SAS 9 .3 . znajdujących się w dwóch modułach noszących nazwy: Time Series Viewer oraz Times Series Forecasting System (rysunek 10) .

Rysunek 10. Okno wyboru modułów programu SAS 9.3

Źródło: opracowanie własne na podstawie programu SAS .

3 E . Ghysels, D .R . Osborn, The econometric analysis of seasonal time series, Cambridge University Press, Cambridge 2001 .

(26)

Narzędzia oraz opcje, jakie posiadają oba moduły będą stopniowo opisywane w każdym kolejnym kroku analizy . Analizy prezentowane w podręczniku będą prze‑

prowadzane na szeregu danych o nazwie AIR znajdującym się w bibliotece Sashelp . Szereg ten przedstawia liczbę pasażerów linii lotniczych . Analizę szeregu czasowego AIR rozpoczniemy od dokonania jego dekompozycji, do czego użyjemy modułu Time Series Viewer . Po uruchomieniu programu SAS, otwieramy, tak jak to zostało pokazane na rysunku powyżej, pasek Rozwiązania, następnie wybieramy zakładkę Analiza i z rozwiniętej listy wybieramy moduł Time Series Viewer . W kolejnym kroku dokonujemy wyboru szeregu czasowego, na którym będziemy pracować, wykonując następujące czynności:

1 . wybór biblioteki, w której znajduje się szereg czasowy, 2 . wybór szeregu czasowego,

3 . wybór zmiennej czasowej,

4 . wybór zmiennej opisującej zjawisko, którego zmiany w czasie zaobserwowali‑

śmy .

2

4

3 1

5

Rysunek 11. Okno wyboru szeregu czasowego

Źródło: opracowanie własne na podstawie programu SAS .

Kroki 1, 2 i 4 wykonujemy poprzez zaznaczenie odpowiednich parametrów, przy czym po wyborze zmiennej w kroku 4 musi się ona wyświetlić w oknie Variable . Wyboru zmiennej czasowej dokonujemy, wskazując właściwą zmienną w oknie Time ID Variable Specifi cation .

(27)

27

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

Rysunek 12. Okno identyfikacji zmiennej czasowej

Źródło: opracowanie własne na podstawie programu SAS .

W powyższym oknie należy wybrać spośród dostępnych zmiennych tę, która opisuje czas . Możliwa jest również zmiana specyfikacji okresów w czasie, w którym obserwowane jest dane zjawisko . Po wyborze zmiennej czasowej i zatwierdzeniu jej poprzez użycie przycisku OK, nazwa tej zmiennej wyświetli się w oknie Time ID . Następnie wybieramy przycisk Graph, co zostało zaznaczone jako krok 5 . W wyniku powyższych działań otrzymujemy nowe menu do analizy szeregu czasowego, jak również wykres naszego szeregu czasowego . W tle widzimy natomiast podstawowe okna programu SAS, czyli Wynik, Log i Edytor .

(28)

Rysunek 13. Okno modułu Time Series Viewer

Źródło: opracowanie własne na podstawie programu SAS .

Narzędzia zawarte w module Time Series Viewer dają możliwość zwiększenia lub pomniejszenia fragmentu wykresu poprzez jego zaznaczenie, zlogaryt‑

mizowania szeregu czasowego , zróżnicowania szeregu czasowego w stopniu pierwszym , zróżnicowania szeregu sezonowo , powrotu do menu wyboru szeregu czasowego , zablokowania pracy w danym momencie tylko na jednym szeregu czasowym , wyświetlenia szeregu w postaci wykresu , wyświetlenia szeregu w postaci tabeli z danymi , wyświetlenia wykresów obrazujących testy na pierwiastki jednostkowe, sezonowe pierwiastki jednostkowe, występowanie bia‑

łego szumu oraz wykresy autokorelacji, częściowej autokorelacji i odwrotnej autokorelacji , a także transformacji szeregu czasowego .

(29)

29

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

Korzystając z wyżej wymienionych narzędzi, przeprowadzamy wstępną analizę wykresu szeregu czasowego . Analiza jego kształtu i przebiegu dostarcza nam wielu ważnych informacji . Po pierwsze, możemy stwierdzić, że jednym ze składników tego szeregu czasowego jest trend i że jest on rosnący, ponieważ wartości obserwowanego zjawiska rosną z roku na rok . Gdyby trend nie był składnikiem tego szeregu czaso‑

wego, to wykres byłby poziomy, a wartości w danych okresach ciągle wahałyby się wokół jednej stałej wartości .

Trend rosnący

Trend malejący Brak trendu

Rysunek 14. Graficzna prezentacja szeregu czasowego AIR

Źródło: opracowanie własne na podstawie programu SAS .

Widoczne są również wahania wartości, które najprawdopodobniej są wahaniami sezonowymi . Jako że pierwsza część wykresu do roku 1955 nie wskazuje jednoznacznie na wahania sezonowe, warto jest podzielić ten wykres na dwie części do 1955 i po 1955 roku oraz powiększyć . Można tego dokonać, używając przycisku powiększenia i zaznaczając wybrany obszar .

Rysunek 15. Wykresy fragmentów szeregu czasowego

Źródło: opracowanie własne na podstawie programu SAS .

(30)

Analiza powyższych wykresów wskazuje już jednoznacznie, że kolejnym składni‑

kiem tego szeregu czasowego są wahania sezonowe, ponieważ co roku w tych samych okresach obserwujemy wzrosty lub spadki zjawiska .

Dzięki dotychczasowej analizie znamy już dwa składniki naszego szeregu czasowego, które będą miały w późniejszej fazie wpływ na wybór odpowiedniego modelu dla tego szeregu czasowego . Znamy także kierunek trendu . Są to wstępne informacje na temat składników, jakie mogą występować w analizowanym szeregu czasowym oraz cechu‑

jącej ten szereg zmienności badanego zjawiska . Informacje te posłużą jako materiał pomocniczy przy budowie modelu szeregu czasowego . W celu ich głębszego poznania należy wykonać pełną analizę . Dlatego do dalszej analizy tego zjawiska pod kątem jego dekompozycji wykorzystamy funkcję transformacji szeregu czasowego . Po wybraniu funkcji transformacji ukazuje się okno zatytułowane Series Viewer Transformation .

Rysunek 16. Opcje modułu do przeprowadzania klasycznej dekompozycji

Źródło: opracowanie własne na podstawie programu SAS .

U dołu okna widzimy blok zatytułowany Classical Decomposition, który umożliwia dokonanie klasycznej dekompozycji szeregu czasowego polegającej na wyodrębnieniu jego podstawowych składowych . Przed rozpoczęciem dekompozycji musimy dokonać wyboru typu modelu szeregu czasowego, zaznaczając w oknie odpowiednią pozycję . W celu określenia, z jakim typem szeregu czasowego mamy do czynienia: addytywnym czy multiplikatywnym, wykorzystujemy informacje uzyskane z wcześniejszej analizy kształtu wykresu . Przeprowadzona wcześniej analiza pokazała, że jest to szereg, w któ‑

rym występują wahania okresowe, a ich amplituda ma charakter rosnący w czasie, co wskazuje na jego multiplikatywny charakter . Gdyby amplituda wahań w czasie była stała (constans), to wskazywałoby to na addytywny charakter szeregu czasowego .

(31)

31

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

Linie rozchodzące się = szereg multiplikatywny

Linie równoległe= szereg addytywny

Rysunek 17. Amplitudy wahań dla szeregu addytywnego i multiplikatywnego

Źródło: opracowanie własne na podstawie programu SAS .

Po określeniu charakteru naszego szeregu czasowego w dolnej części okna Series Viewer Transformation uaktywnia się okienko noszące nazwę Classical Decom‑

position, umożliwiające wybór następujących opcji:

Seasonal Adjusted Series

¾ – wyświetla wykres szeregu czasowego bez sezonowości, Trend ‑cycle Component

¾ – wyświetla wykres wyłącznie trendu wyodrębnionego z szeregu czasowego,

Seasonal Component

¾ – wyświetla wykres wyłącznie składnika sezonowego wyodrębnionego z szeregu czasowego,

Irregular Component

¾ – wyświetla wykres wyłącznie wahań przypadkowych wyodrębnionych z szeregu czasowego .

Po zaznaczeniu opcji Seasonal Adjusted Series pojawia się następujący wykres:

Rysunek 18. Krzywa trendocykliczna dla szeregu AIR

Źródło: opracowanie własne na podstawie programu SAS .

(32)

Wykres trendu potwierdza wstępne wnioski wskazujące na to, że jest on istotnym składnikiem tego szeregu czasowego . Trend ten jest rosnący i mógłby być opisany funkcją liniową nachyloną pod kątem ok . 40 stopni do osi odciętych . Mimo wy‑

stąpienia dwóch krótkich okresów, w których trend ulega lekkiemu spowolnieniu, w pozostałych okresach obserwacji zjawiska cechuje się on stałym i stosunkowo silnym wzrostem .

Rysunek 19. Składnik sezonowy występujący w szeregu AIR

Źródło: opracowanie własne na podstawie programu SAS .

Wykres składnika sezonowego wskazuje na potrzebę uwzględnienia tej składo‑

wej w ogólnym wzorze opisującym badany szereg czasowy . Wahania sezonowe są stałe w czasie . Widoczne są stosunkowo duże wzrosty wartości szeregu czasowego w miesiącach letnich, co można łatwo wytłumaczyć wzrostem zainteresowania lo‑

tami w okresie wakacyjnym . Mimo że wahania sezonowe są umiarkowane i stabilne, to w połączeniu z trendem skutkują coraz większymi wahaniami okresowymi (z roku na rok) proporcjonalnie do skali zjawiska .

(33)

33

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

Rysunek 20. Składnik resztowy występujący w szeregu AIR

Źródło: opracowanie własne na podstawie programu SAS .

Wykres wahań przypadkowych daje podstawę do stwierdzenia, że wahania wy‑

stępujące w szeregu wywierają wpływ na obserwowane zjawisko . Szczególnie w latach 1949–1954 zakres wahań przypadkowych jest bardzo duży . Oprócz stwierdzenia faktu występowania wahań przypadkowych, należy także ustalić, czy ich wpływ na zaobserwowane wartości zjawiska opisanego przez szereg czasowy jest istotny sta‑

tystycznie . W dalszych analizach znajdziemy odpowiedź na to pytanie .

Rysunek 21. Szereg AIR wygładzony sezonowo

Źródło: opracowanie własne na podstawie programu SAS .

(34)

Wykres trendu razem ze składnikiem losowym, a więc po usunięciu wahań sezonowych (Seasonally Adjusted Series), wskazuje na to, iż wahania przypadkowe zaburzają linię trendu, szczególnie pod koniec obserwowanego okresu, co z kolei sugeruje, że komponent losowy może być istotny statystycznie . Jak widać na prze‑

strzeni badanego okresu, wpływ składnika losowego na poziomy wartości zjawiska jest zmienny . Wpływ ten jest stosunkowo słaby w początkowym okresie, bardzo słaby w środkowym oraz silny w okresie końcowym .

Dotychczasowa analiza szeregu czasowego AIR pokazała rosnącą wariancję oraz stosunkowo duże wahania przypadkowe . W celu zniwelowania niekorzystnego wpływu tych dwóch czynników warto zastosować transformację logarytmiczną, która pozwoli nam ustabilizować wariancję i zniwelować siłę wartości odstających . Taka transformacja jest również sugerowana w dokumentacji SAS do szeregów multiplikatywnych .

Rysunek 22. Szereg AIR po dokonaniu transformacji logarytmicznej

Źródło: opracowanie własne na podstawie programu SAS .

Z powyższego wykresu wynika, że rzeczywiście transformacja logarytmiczna sta‑

bilizuje wariancję . Wskutek tego zabiegu wykres szeregu czasowego AIR przypomina model addytywny, który jest łatwiejszy do analizy i prognozowania .

Analizując wykres pozbawiony składnika sezonowego, po zastosowaniu trans‑

formacji logarytmicznej, możemy zauważyć pozytywne zmiany dotyczące wielkości wahań przypadkowych . Obecny wykres dużo bardziej przypomina liniowy wy‑

kres trendu . Natomiast wykresy wahań sezonowych, jak i wahań przypadkowych, nie różnią się znacznie od wykresów tych elementów, w których transformacja

(35)

35

2.4. Analiza szeregu czasowego z użyciem programu SAS – dekompozycja szeregu

logarytmiczna nie została zastosowana . Warto jednak zwrócić uwagę na wartości, w których mieszczą się wahania obu tych składników szeregu . W porównaniu do wcześniejszych wykresów widełki tych wahań są znacznie mniejsze .

Rysunek 23. Szereg AIR wygładzony sezonowo po zastosowaniu transformacji logarytmicznej

Źródło: opracowanie własne na podstawie programu SAS .

Składnik sezonowy

Przedział wahań po transformacji 0,961,04 w porównaniu do 0,8 1,3 przed transformacją

Rysunek 24. Składnik sezonowy szeregu AIR po zastosowaniu transformacji logarytmicznej

Źródło: opracowanie własne na podstawie programu SAS .

Składnik resztowy

Przedział wahań po transformacji 0,981,02 w porównaniu do 0,8751,100 przed transformacją

Rysunek 25. Składnik losowy szeregu AIR po zastosowaniu transformacji logarytmicznej

Źródło: opracowanie własne na podstawie programu SAS .

(36)

Wnioski:

Analizowany szereg czasowy AIR jest trójskładnikowy i składa się z trendu, wahań sezonowych i przypadkowych . Po analizie graficznej możemy uznać, że zarówno sezo‑

nowość, jak i składnik losowy są istotne statystycznie . W dalszej analizie sprawdzimy słuszność powyższego stwierdzenia, jak również użycia transformacji logarytmicznej . Postać ogólna wzoru dla tego szeregu czasowego wygląda następująco:

logYt = Tt * Ct * St * It

Warto przeczytać…

Time Series Transformation, Decomp Statement, Seasonal Decomposition, Classical Decomposition.

Uwaga

Należy pamiętać, że dekompozycja multiplikatywna i transformacje mogą być stosowane tylko dla szeregów ściśle dodatnich!!! Działania na szeregach, np . róż‑

nicowanie, które będą powodować utratę ścisłej dodatniości szeregu, spowodują pojawienie się komunikatu o błędzie .

(37)

37

3.1. Pojęcie trendu

Rozdział 3

Tendencja rozwojowa

3.1. Pojęcie trendu

Trendem, czyli tendencją rozwojową, nazywamy ogólny kierunek zmian zjawiska w czasie, który jest wywołany przez systematyczne, jednokierunkowe zmiany poziomu badanego zjawiska spowodowane działaniem stałego zestawu czynników . Jest to dłu‑

gookresowa skłonność do jednokierunkowych zmian (wzrostu lub spadku) wartości badanej zmiennej . Trend wyznaczany jest przez przyczyny główne, które działają stale i niezmiennie charakteryzują dane zjawisko w czasie . Znajomość przebiegu tendencji rozwojowej pozwala na analizę ogólnego obrazu rozwoju badanego zjawiska .

Wyróżniamy dwa główne kierunki trendu: trend rosnący, kiedy wzrasta wartość zmiennej w czasie, oraz trend malejący, kiedy wartość zmiennej spada . W wielu analizach występuje również trend boczny, w którym nie dostrzegamy wyraźnego trendu malejącego lub rosnącego . Ten typ trendu zauważalny jest szczególnie w ana‑

lizach giełdowych .

Trend możemy również podzielić pod względem elementów, które go definiują na trend deterministyczny i stochastyczny .

(38)

Zmienna losowa zawierająca trend stochastyczny (y1) oraz trend deterministyczny (y2)

Rysunek 26. Szereg czasowy z trendem stochastycznym i deterministycznym

Źródło: A . Welfe, Ekonometria. Metody i ich zastosowanie, PWE, Warszawa 2009, s . 362 .

3.2. Trend deterministyczny

Trend deterministyczny, inaczej nazywany trendem, w średniej oznacza nielosową funkcję zmiennej czasowej t, która opisuje zmienność w czasie wartości średniej pro‑

cesu . Zmiany w wartości średniej kojarzone są ze zmianami długookresowymi, które mają gładki i spokojny przebieg, dlatego funkcji opisującej trend deterministyczny przypisuje się te same atrybuty4 . Podstawowy wzór funkcji trendu deterministycznego wygląda następująco:

Tt = f(t) gdzie:

t – zmienna czasowa

4 M . Piłatowska, Alternatywne metody eliminacji trendu a interpretacja modelu ekonometrycznego, materiały na IV Ogólnopolskie Seminarium Naukowe, Katedra Ekonometrii i Statystyki UMK, Toruń 1997 .

(39)

39

3.2. Trend deterministyczny

W wypadku trendu deterministycznego wyróżniamy różne modele trendu:

Trend liniowy: Tt =β0 +β1t t – zmienna czasowa β0, β1 – parametry modelu

Rysunek 27. Trend liniowy

Źródło: M . Mazurkiewicz, Modele Szeregów Czasowych, http://www .ioz .pwr .wroc .pl/pracownicy/mazurkiewicz/

w3 .pdf

Trend wielomianowy: Tt = β𝟎 + β𝟏t + ... + βk t k k – ustalony stopień wielomianu

Rysunek 28. Trend wielomianowy

Źródło: M . Mazurkiewicz, Modele Szeregów Czasowych, http://www .ioz .pwr .wroc .pl/pracownicy/mazurkiewicz/

w3 .pdf

(40)

Trend wykładniczy: Tt = 𝜷𝟎 + 𝜷𝟏r t r – stała

Rysunek 29. Trend wykładniczy

Źródło: M . Mazurkiewicz, Modele Szeregów Czasowych, http://www .ioz .pwr .wroc .pl/pracownicy/mazurkiewicz/

w3 .pdf

Trend logistyczny: 𝑻𝒕 = 𝜷𝟎 ∗ (𝟏 + 𝜷𝟏 ∗ 𝐞𝐱𝐩(−  𝜷𝟐𝒕))− 𝟏 β0, β1, β2 > 0

Rysunek 30. Trend logistyczny

Źródło: M . Mazurkiewicz, Modele Szeregów Czasowych, http://www .ioz .pwr .wroc .pl/pracownicy/mazurkiewicz/

w3 .pdf

(41)

41

3.2. Trend deterministyczny

Trend Gompertza: 𝑻𝒕 = 𝜷𝟎 ∗ 𝐞𝐱𝐩(−  𝜷𝟏 ∗ 𝐞𝐱𝐩(−  𝜷𝟐𝒕)) β0 – punkt nasycenia, β0 , β1, β2 > 0

Rysunek 31. Trend Gompertza

Źródło: http://en .wikipedia .org/wiki/Gompertz_function

Trend ilorazowy:

Rysunek 32. Trend ilorazowy

Źródło: M . Mazurkiewicz, Modele Szeregów Czasowych, http://www .ioz .pwr .wroc .pl/pracownicy/mazurkiewicz/

w3 .pdf

(42)

Trend logarytmiczny: 𝑻𝒕 = 𝜷𝟎 + 𝜷𝟏 ∗ 𝒍𝒏  𝒕

Rysunek 33. Trend logarytmiczny

Źródło: M . Mazurkiewicz, Modele Szeregów Czasowych, http://www .ioz .pwr .wroc .pl/pracownicy/mazurkiewicz/

w3 .pdf

Trend trygonometryczny:

𝐴𝑖 = 𝑟𝑖𝑐𝑜𝑠(𝜃) gdzie:

ω – częstotliwość z okresem θ – zmiana fazy

ri – amplituda

Rysunek 34. Trend trygonometryczny

Źródło: http://bm2 .genes .nig .ac .jp/RGM2/R_current/library/mFilter/man/trfilter .html

(43)

43

3.2. Trend deterministyczny

Spośród wymienionych wyżej trendów warto zwrócić uwagę na trend logistyczny, Gompertza i trygonometryczny . Pierwsze dwa mają prawie identyczne wykresy i oba używane są do przewidywania rozwoju rynku . Należy jednak pamiętać, że wybór modelu trendu może mieć znaczący wpływ na prognozę, ponieważ proces Gom‑

pertza jest asymetryczny, podczas gdy proces logistyczny jest symetryczny . Badanie i opis dokonania poprawnego wyboru trendu logistycznego lub Gompertza zostały zawarte w pracy P .H . Fransesa A method to select between Gompertz and Logistic Trend Curves5 .

W wypadku trendu trygonometrycznego mamy do czynienia z rodziną tren‑

dów cyklicznych opartych na funkcji periodycznej lub quasi ‑periodycznej . Ten rodzaj trendu jest stosowany do szeregów czasowych, których zachowanie wyka‑

zuje periodyczność . Istotną rzeczą podczas korzystania z tego modelu trendu jest poprawne zdeterminowanie częstotliwości przy użyciu np . analizy harmonicznej lub spektralnej .

Podsumowując charakterystykę trendu deterministycznego, warto przytoczyć również fakt, że może być on traktowany jako specjalny rodzaj trendu stochastycz‑

nego . Można to udowodnić, przekształcając ogólny wzór na trend cykliczny, który przyjmuje następującą postać:

,

który po przekształceniach przyjmuje postać6: 𝑻𝒕 = 𝒇(𝒕,𝟏𝟐), gdzie:

f(t) – jest deterministyczną funkcją t oraz 12‑ okresową zmiennością trendu . W literaturze przedmiotu można napotkać opisy trendu deterministycznego poprzez składnik trendu i dodatkowo biały szum opisujący stochastyczny proces stacjonarny . Nie ma to dużego znaczenia dla samego zapisu, ponieważ biały szum jest dodawany do elementów opisujących trend, czyli każdy z powyższych wzorów posiadałby dodany na końcu równania składnik losowy . Jednak taki zapis należy ro‑

zumieć jako proces deterministyczny lub stochastyczny określony przez dany rodzaj

5 P .H . Franses, A method to select between Gompertz and Logistic Trend Curves, “Technological Forecasting and Social Change” 1994, no . 46, s . 45–49 .

6 Szczegółowy opis przekształceń można znaleźć w notatkach z wykładu, R . Tsay, Lecture 5: Seasonal Time Series, Trend Analysis & Component Model Bus 41910, “Time Series Analysis” .

(44)

trendu . Ponieważ biały szum jest zagadnieniem związanym ze stacjonarnością szeregu czasowego, zostanie szczegółowo omówiony w dalszej części pracy .

3.3. Trend stochastyczny

Trendem stochastycznym określamy proces, w którym zarówno poziom, jak i nachylenie trendu ulegają zmianom wraz z upływem czasu . Wpływ na zmiany w poziomie i nachyleniu trendu mają wszystkie zakłócenia występujące w danym okresie, które z równą siłą oddziałują na bieżącą wartość zmiennej, bez względu na to, jak odległe są w czasie7 . Za podstawowy model trendu stochastycznego można uznać poniższy wzór:

ξ = ΔTt – składnik losowy .

W literaturze przedmiotu powyższy rodzaj trendu wraz z wartością Y0 opisują proces stochastyczny określany jako ścieżka losowa lub błądzenie losowe (random walk) . Wzór tego procesu wygląda następująco:

Ścieżka losowa:

Jeżeli do powyższego wzoru dodamy trend deterministyczny, to uzyskamy sposób generowania danych (data generating process), który jest definiowany jako ścieżka losowa z dryfem (random walk with drift) . Poniższy wzór obrazuje postać tego procesu:

7 Źródło: A . Welfe, Ekonometria. Metody i ich zastosowanie, PWE, Warszawa 2009, s . 361 .

(45)

45

3.3. Trend stochastyczny Ścieżka losowa z dryfem:

Rysunek 35. Ścieżka losowa (y1) oraz ścieżka losowa z dryfem (y2)

Źródło: A . Welfe, Ekonometria. Metody i ich zastosowanie, PWE, Warszawa 2009, s . 362 .

Tak samo jak w wypadku trendu deterministycznego, mamy różne rodzaje trendu stochastycznego . Wśród nich wyróżniamy trend liniowy, kwadratowy i sezonowy . Stochastyczny trend liniowy: 𝑻𝒕 = 𝜷𝒕 + 𝜺𝒕

βt – nachylenie trendu, 𝛽𝑡 = 𝜇𝑡− 1 + νt νt – biały szum niezależny od εt εt – biały szum

Rysunek 36. Stochastyczny trend liniowy

Źródło: http://gieldowyracjonalista .blogspot .com/

(46)

Trend kwadratowy: 𝑻𝒕 = 𝜷𝒕 + 𝜺𝒕, gdzie (1 −  𝐵)2𝛽𝑡 = 𝜈𝑡

Rysunek 37. Trend kwadratowy

Źródło: http://tamino .wordpress .com/2010/07/26/summer‑ice/

Trend sezonowy: 𝑻𝒕  = 𝜷𝒕 + 𝜺𝒕

Rysunek 38. Trend sezonowy

Źródło: http://www .ncbi .nlm .nih .gov/bookshelf/br .fcgi?book=mmed&part=A643

W powyższych wzorach trend stochastyczny mógłby być zapisany dwuskładni‑

kowo i zdefiniowany tak jak poniżej, przez poziom i nachylenie trendu .

(47)

47

3.3. Trend stochastyczny

Poziom trendu: 𝑻𝒕 = 𝑻𝒕− 𝟏 + 𝜷𝒕− 𝟏 + 𝜼𝒕 Nachylenie trendu: 𝜷𝒕 = 𝜷𝒕− 𝟏 + 𝜹𝒕 gdzie:

δt, ηt – składniki losowe, zwane hiper ‑parametrami .

Gdyby wariancja δt i ηt była równa zero, czyli ani poziom, ani nachylenie trendu nie byłyby pod wpływem losowych szoków występujących w danym okresie, to mielibyśmy do czynienia z trendem deterministycznym, którego wzór wyglądałby następująco:

𝝁𝒕 = 𝝁𝟎 + 𝜷𝟎𝒕

Modelowanie za pomocą trendu stochastycznego jest obecnie dość nowatorską i mało popularną metodą . Jej główną zaletą w porównaniu do modelowania za pomocą trendu deterministycznego jest fakt, że adaptuje się do występujących załamań danego zjawiska, przez co daje możliwości prognozy o mniejszych błędach . Z drugiej jednak strony mode‑

lowanie stochastyczne wymaga wprowadzenia egzogenicznych złożonych strukturalnych testów załamań obserwowanego zjawiska, co jest wymagającym zadaniem8 .

Warto przeczytać…

C.A. Sims, Modeling Trends, Prepared for presentation at the American Statistical Association Meetings August 1989.

J. Caiado, N. Crato, Discrimination between deterministic trend and stochastic trend processes, Proceedings of the XIth International Conference on Applied Stochastic Models and Data Analysis, s. 1419–1424.

R.B. Bhaskara, Deterministic and stochastic trends in the time series models: A guide for the applied economist, “Applied Economics” 2010, vol. 42, no. 17, s. 2193–2202.

R. Tsay, Lecture 5: Seasonal Time Series, Trend Analysis & Component Model, Bus 41910, “Time Series Analysis”.

M. Piłatowska, Alternatywne metody eliminacji trendu a interpretacja modelu ekono- micznego, materiały na IV Ogólnopolskie Seminarium Naukowe w Toruniu, Katedra Ekonometrii i Statystyki UMK, Toruń 1997.

D.M. Meko, Detrending GEOS 585A, “Applied Time Series Analysis”, http://www.ltrr.arizona.edu/~dmeko/geos585a.html

8 Więcej na temat zalet i wad obu sposób modelowania można znaleźć w: R .B . Bhaskara, Determini‑

stic and stochastic trends inthe time series models: A guide for the applied economist, “Applied Economics”

2010, vol . 42, no . 17, s . 2193–2202 .

(48)

3.4. Analiza szeregu czasowego z użyciem programu SAS – tendencja rozwojowa

System SAS oferuje wiele różnych procedur, za pomocą których możemy ana‑

lizować szeregi czasowe . Procedury Timeseries, EXPAND, REG ARIMA, X11, X12 zostaną omówione w kolejnych rozdziałach, natomiast w tym rozdziale posłużymy się procedurą UCM .

Opis procedury

Procedura UCM opiera się na modelach składników nieobserwowalnych (Unob‑

served Components Model), które w literaturze traktującej o szeregach czasowych są nazywane modelami strukturalnymi . Modele strukturalne, w przeciwieństwie do modeli autoregresyjnych, opierają się na trendzie stochastycznym . Korzystając z tego modelu, traktujemy szereg jako ścieżkę losową, która składa się z trendu i zestawu binarnych zmiennych sezonowych . Takie podejście może okazać się nieadekwatne, dlatego określamy parametr, który stoi przy naszej zmiennej objaśniającej (regression coefficient), czyli przy trendzie, jako zmienną, której wartości wahają się w czasie . Uzyskujemy w ten sposób kolejną zmienną objaśniającą i nasz model jednorów‑

naniowy przypomina wtedy pod względem konstrukcji model wielorównaniowy . W sposób formalny opisane przekształcenia można przedstawić za pomocą nastę‑

pujących wzorów:

𝒀𝒕 = 𝑻𝒕 + 𝑺𝒕 + 𝑰𝒕 – wzór opisujący trójskładnikowy szereg czasowy 𝑻𝒕 = 𝜷𝟎 + 𝜷𝟏𝒕 – trend deterministyczny

W celu przejrzystości przekształceń, w dalszych rozważaniach β0 = α, natomiast β1 = β .

𝑻𝒕 = 𝑻𝒕− 𝟏 + 𝜷 – rekurencyjny wzór na trend deterministyczny

Ponieważ T0 = β0 = α, powyższe równanie możemy przedstawić za pomocą równania na trend stochastyczny:

𝑻𝒕 = 𝑻𝒕− 𝟏 + 𝜷𝒕− 𝟏 + 𝜼𝒕 – poziom trendu 𝜷𝒕 = 𝜷𝒕− 𝟏 + 𝜹𝒕 – nachylenie trendu

W taki sposób możemy przekształcić każdy z komponentów trendu, dzięki czemu możemy uchwycić tzw . ciche cechy (sailent features) szeregu czasowego, które mogą być przydatne zarówno do wyjaśnienia, jak również do prognozowania

Cytaty

Powiązane dokumenty

Okazuje się, że oceny widma mocy mogą być również wykorzystywane do rozwiązywania jednego z problemów taksonomicznych21, a mianowicie do grupowania obiektów jednocecho-

informacje o liczbie wierszy ewidencji sprzedaży, zakupu, w okresie którego dotyczy JPK_VAT, kwoty podatków na- leżnego i naliczonego (tabele: ZAKUP oraz SPRZEDAZ), a także

ƒ rozważając kursy walut jako multiułamkowe procesy ruchu Browna, można interpretować punktowe wykładniki Höldera jako lokalne miary ryzyka oraz ich wartości odczytywać

Mo˙zliwe jest dwojakie podej´scie do problemu ICA na danych fMRI: mo˙zemy poszukiwa´c składowych niezale˙znych przestrzennie lub składowych niezale˙znych czasowo..

[r]

Ponieważ determinizm układów chaotycznych wskazuje na możliwość ich prognozowania, w kolejnym kroku badań oszacowano największy wykładnik Lapunowa w celu identyfikacji chaosu

– liczba neuronów w warstwie wejściowej jest zdeterminowana przez wymiar wektora wejściowego – każdy model ma ten sam zbiór sygnałów wejściowych, – sieć typu MLP

Sprawdzić, że proces jest sss i znależć funkcję kowariancji tego procesu2. Skonstruować proces sss, dla którego funkcja kowariancji nie ma