• Nie Znaleziono Wyników

Zastosowanie samouczącego się trzypunktowego minimodelu do modelowania stopy bezrobocia w Polsce

N/A
N/A
Protected

Academic year: 2021

Share "Zastosowanie samouczącego się trzypunktowego minimodelu do modelowania stopy bezrobocia w Polsce"

Copied!
12
0
0

Pełen tekst

(1)

NR 643 STUDIA INFORMATICA NR 27 2011

ANDRZEJ PIEGAT

Zachodniopomorski Uniwersytet Technologiczny w Szczecinie BARBARA WĄSIKOWSKA

Uniwersytet Szczeciński MARCIN KORZEŃ

Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

ZASTOSOWANIE SAMOUCZĄCEGO SIĘ

TRZYPUNKTOWEGO MINIMODELU

DO MODELOWANIA STOPY BEZROBOCIA W POLSCE

Wprowadzenie

W gospodarce każdego kraju istnieje wiele funkcyjnych, wielowymiaro-wych zależności ekonomicznych typu y = f(x1, x2, ..., xn). W ostatnim dwudzie-stoleciu coraz częściej dokonuje się identyfi kacji zależności ekonomicznych z użyciem sztucznych sieci neuronowych1. Neuronowe modele zależności funk-cyjnych są modelami samouczącymi się, które potrafi ą dopasować powierzchnię neuronowego modelu do posiadanych próbek uczących – realizują więc proces 1 J. Morajda, Neural networks as predictive models in fi nancial futures trading, Fifth Confe-rence on Neural Networks and Soft Computing, Zakopane 2000; A. Pokropińska, R. Scherer,

Fi-nancial prediction with neuro-fuzzy systems, International Conference AISC 2008, Springer 2008;

I. Rejer, Metody modelowania wielkowymiarowego systemu z użyciem metod sztucznej

inteligen-cji na przykładzie bezrobocia w Polsce, Wydawnictwo Naukowe Uniwersytetu Szczecińskiego,

Szczecin 2003; B. Wąsikowska, Niestandardowe metody identyfi kacji czynników determinujących

produkcję sprzedaną przemysłu, Uniwersytet Szczeciński, Szczecin 2007 (rozprawa doktorska);

D. Witkowska, Application of econometric models an neural networks to consumer price index

(2)

samoadaptacji. I tak przykładowo, opracowano model neuronowy2 dla stopy bez-robocia w Polsce oraz neuronowy model3 dla produkcji sprzedanej przemysłu.

Cechą większości modeli ekonometrycznych, neuronowych i innych jest ich globalny charakter, to znaczy defi niują one wartości zmiennej wyjaśnianej y w całej przestrzeni rozważań, zwykle prostokątnej, zawartej między maksymal-nymi a minimalmaksymal-nymi wartościami poszczególnych zmiennych xi. Globalność modelu to na pewno korzystna jego cecha. W praktyce jednak pociąga ona za sobą wiele negatywów, strojenie modelu globalnego jest bowiem znacznie trud-niejsze niż „małego” modelu lokalnego. Dodatkowo średni błąd modelu glo-balnego może być akceptowalnie mały, jednak lokalnie model ten w niektórych podzakresach przestrzeni rozważań może wykazywać znacznie wyższe błędy (w innych znacznie niższe) niż średnio.

Dodatkowo, w miarę napływu nowych danych, globalny model – nastrojo-ny wcześniej posiadanastrojo-nym zestawem danastrojo-nych – dezaktualizuje się i wymaga ciągłego dostrajania, co może być kłopotliwe, jeśli jego użytkownicy, na przy-kład pracownicy fi rmy, nie potrafi ą tego zrobić. Stąd, ze względów praktycznych, w wielu wypadkach korzystne może być stosowanie szybkich, samouczących się modeli lokalnych. Modele te dostarczają odpowiedzi na interesujące nas zapy-tanie na podstawie lokalnego modelu. Model ten dokonuje ekstrakcji wiedzy potrzebnej do odpowiedzi na zapytanie na podstawie próbek (danych) okrążają-cych zapytanie. Jeżeli rozpatrywana jest pewna interesująca nas trójwymiarowa zależność y = f(x1, x2), to zapytanie i odpowiedź mają formę:

f(x1*, x 2*) = ? – zapytanie, y* = f(x 1*, x2*) – odpowiedź na zapytanie gdzie: y* – wartość liczbowa, x1*, x

2* – liczbowe wartości zmiennych X1, X2, y = f(x1, x2) – zależność,

PZ: {x1*, x

2*} – punkt zapytania.

Rysunek 1 ilustruje pojęcia związane z zapytaniem i odpowiedzią, jakiej oczekuje się od modelu lokalnego.

2 I. Rejer, Metody modelowania...

3 B. Wąsikowska, Niestandardowe metody identyfi kacji...

(3)

0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 X2 X1 Y PZ = (X1*, X2*) Y* = f(X1*, X2*) Próbki okrąĪające zapytanie

Rys. 1. Ilustracja pojęć związanych z zapytaniem do modelu Źródło: opracowanie własne.

Aby znaleźć odpowiedź na zapytanie, należy stworzyć mały, lokalny model o skończonym zakresie, obejmujący swym zasięgiem jedynie pobliskie próbki okrążające zapytanie. W dalszej części artykułu model taki nazywany będzie minimodelem (MM). Minimodele mogą mieć różne kształty geometryczne. W dalszym ciągu przedstawiona zostanie koncepcja minimodelu trójkątnego w przestrzeni 3D, któremu w przestrzeni nD, o wyższym wymiarze, odpowiadają różne ostrosłupy. W przypadku przestrzeni 4D minimodel jest czworościanem o trójkątnych ścianach, zwykle nierównobocznych.

1. Trójkątny, liniowy, ograniczony minimodel w przestrzeni 3D

Koncepcja minimodelu – oraz odpowiednie wzory – opracowana została przez A. Piegata. Oparta jest ona na kontekstowym, ograniczonym układzie współrzędnych α, β. Układ ten jest oparty na trzech punktach narożnych A, B, C (rysunki 2a i 2b).

(4)

a)

0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 0.4 0.5 0.6 0.7 0.8 0.9 1 X1 X2 Y B (X1B, X2B, YB) A (X1A, X2A, YA) C (X1C, X2C, YC)

b)

0 X1 C (X1C, X2C) Į = 1, ȕ = 1, Ȗ = 0 A (X1A, X2A), Į = 0, ȕ = 0, Ȗ = 0 B (X1B, X2B), Į = 1, ȕ = 0, Ȗ = 1 X2 Į Ȗ Ȗ ȕ ȕ Į ȕ = 1 Į = 1 ȕ = 0.7 Į = 0.4 Ȗ = 0.7 Z(X1*, X2*)

Rys. 2. Trójkątny układ kontekstowy {α, β, γ} – ilustracja wprowadzonych oznaczeń α ∈ [0, 1], β ∈ [0, 1], γ ∈ [0, 1], Z – przykładowy punkt zapytania

Źródło: opracowanie własne.

W kontekście minimodelu {A, B, C} rozpatrywane są tylko punkty {X1, X2} leżące w jego wnętrzu. Czy dany punkt {X1, X2} leży wewnątrz minimodelu łatwo sprawdzić, każdy taki punkt musi bowiem spełniać jednocześnie trzy warunki: α ∈ [0, 1], β ∈ [0, 1], γ ∈ [0, 1]. Wartości współrzędnych kontekstowych α, β,

(5)

γ można obliczyć ze wzorów (2) uzyskanych na zależnościach geometrycznych dla dowolnego punktu {X1, X2}:

Į = (x1, x2) = (( )()( )) (( )()( )), 1 1 2 2 2 2 1 1 1 1 2 2 2 2 1 1 B C A B B C A B B C A B C A x x x x x x x x x x x x x x x x           ȕ = (x1, x2) = (( )()( )) (( )()( )), 1 1 2 2 2 2 1 1 1 1 2 2 2 2 1 1 A B A C A B A C A B A A B A x x x x x x x x x x x x x x x x           Ȗ = (x1, x2) = (( )()( )) (( )()( )) 1 1 2 2 2 2 1 1 1 1 2 2 2 2 1 1 A C A B A C A B A C A A C A x x x x x x x x x x x x x x x x           (2)

Znając współrzędne wierzchołków minimodelu (MM), łatwo obliczyć war-tość zmiennej objaśnianej y dla punktu zapytania o współrzędnych konteksto-wych α, β:

y = yA + (yB – yA) α + (yC – yB) β (3)

2. Skrótowy opis algorytmu uczenia minimodelu

Celem działania minimodelu jest obliczenie odpowiedzi y* = f(x 1*, x2*) dla zadanego, interesującego nas punktu zapytania PZ: {x1*, x

2*}. Uczeniu podle-gają wszystkie współrzędne punktów narożnych A, B, C minimodelu.

Kroki algorytmu uczenia minimodelu Krok 1

Zainicjowanie startowych wartości wierzchołków A, B, C: (X1A, X2A, YA), (X1B, X2B, YB), (X1C, X2C, YC) tak, aby punkt zapytania PZ: {x1*, x

2*} znajdował się wewnątrz MM (warunek: α ∈ [0, 1], β ∈ [0, 1], γ ∈ [0, 1]). Sprawdzenie, czy liczba próbek uczących n wewnątrz minimodelu przewyższa minimalną liczbę nmin zależną od wymiarowości MM (tutaj 3) oraz błędu pomiarowego próbek. Przy bardzo małym błędzie próbek minimalna liczba próbek nmin = 3 lub 4, przy większych błędach pomiaru nmin należy zwiększyć. Jeżeli któryś z warunków wymaganych w kroku 1 nie jest spełniony, należy wygenerować nowe warto-ści startowe współrzędnych punktów A, B, C. Dla wszystkich m próbek

(6)

znaj-dujących się wewnątrz MM obliczany jest średni błąd bezwzględny Bś według wzoru (4):

¦

n  i i pi Ğ n y y B 1 | 1 (4)

gdzie:

Bś – średni błąd bezwzględny modelu, n – liczba próbek w zbiorze uczącym, ypi – współrzędna y próbki i,

yi – wartość y obliczona dla próbki i według MM.

Jeśli Bś ≥ Bś min, to następuje zakończenie procesu uczenia. Jeżeli nie, należy przejść do kroku drugiego.

Krok 2

Zmiana aktualnej pozycji punktów A, B, C minimodelu tak, aby zmniejszyła się liczba próbek m znajdujących się wewnątrz MM oraz zmniejszył się średni błąd bezwzględny Bś dla próbek objętych minimodelem przy jednoczesnym speł-nieniu warunku minimalnej liczby próbek m ≥ nmin. Następnie następuje spraw-dzenie minimalnego błędu MM. Jeżeli Bś < Bś min, to należy powtórzyć krok 2, a jeżeli Bś ≥ Bś min, to następuje zakończenie obliczeń.

3. Przykład użycia minimodelu do problemu bezrobocia w Polsce

Problem bezrobocia w Polsce badany był między innymi w pracy I. Rejer4. Badania wykazały, że najbardziej istotnymi czynnikami wyjaśniającymi wartość stopy bezrobocia w danym miesiącu w Polsce (y) w latach 1991–1999 (okres 96 miesięcy) były: X1 – podaż pieniądza (w danym miesiącu) oraz X2 – liczba ludności w Polsce (w danym miesiącu). Na rysunku 3 przedstawiony został rozkład wszystkich próbek uczących w przestrzeni X1*X2*Y (rysunek 3a) oraz X1*X2 (rysunek 3b).

(7)

0 0.2 0.4 0.6 0.8 1 0.2 0 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 Liczba ludnoħci Podaľ pieniædza Stop a b ezr ob ocia 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Podaľ pieniædza Li czba l udno ħci

Rys. 3. Rozkład rzeczywistych próbek w przestrzeni X1*X2*Y (rysunek 3a) oraz X1*X2 (rysunek 3b)

Źródło: opracowanie własne.

Jak widać na rysunku 3, próbki w małym stopniu pokrywają przestrzeń wejść X1 i X2. Stąd żaden model nie jest w stanie dać wiarygodną odpowiedź na dowolne zapytanie {x1*, x

2*}. Wiarygodną odpowiedź można uzyskać tylko wówczas, gdy punkt zapytania (PZ) leży w pobliżu próbek uczących. Spełnienie tego warunku umożliwiają właśnie minimodele, natomiast często nie spełniają go modele globalne. Na rysunku 4 pokazano położenie przykładowego punktu

a)

(8)

zapytania {x1*, x

2*} = {0,28, 0,86}, startowy (rysunek 4a) i końcowy (rysunek 4b) minimodel uzyskany w wyniku procesu uczenia.

0 0.2 0.4 0.6 0.8 1 0.4 0.2 0 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 Liczba ludnosci Podaz pieniadza S topa bez ro boc ia Y* 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Podaz pieniadza Li cz ba lu dn os ci PZ Liczba ludno Ğci Stopa bezrobocia PodaĪ pieniądza Liczba ludnoĞci PodaĪ pieniądza

Rys. 4. Punkt zapytania PZ: {0.28, 0.86}, startowa (rysunek 4a) forma minimodelu i końcowa (rysunek 4b) forma minimodelu uzyskana w procesie uczenia

Źródło: opracowanie własne.

a)

(9)

Na podstawie posiadanych próbek (dane statystyczne) minimodel ustalił odpo-wiedź (y*), biorąc pod uwagę zapytanie (PZ):

jeśli PZ:{x1*, x

2*} = {0,28, 0,86}, to {y*} = {0,621}.

Powstaje oczywiście kwestia dokładności odpowiedzi obliczeniowych udzielanych przez minimodel.

4. Testowanie dokładności wyników obliczeń minimodelu

Testowanie dokładności obliczeń realizowanych przez minimodel (MM) może być dokonane znaną metodą krzyżowej walidacji leave one out5, czyli „komplet minus jedna próbka”. W tym celu po kolei ze zbioru danych uczących zabierana jest jedna próbka o współrzędnych {x1i, x2i, yi}, po czym znajdowana jest z użyciem minimodelu odpowiedź na zapytanie: „Ile wynosi wartość zmien-nej yiMM obliczona przez minimodel dla punktu zapytania o współrzędnych próbki {x1i, x2i}?” Po znalezieniu predykcji yiMM obliczany jest błąd wyniku dostarczo-nego przez minimodel według wzoru 5:

| | | |ei yiyiMM (5) gdzie: | |e  – błąd bezwzględny modelu,i

yi – rzeczywiste wartości wyjściowe (i = 1, ..., n),

yiMM – wyznaczone przez minimodel wartości wyjściowe (i = 1, ..., n). Następnie obliczany jest średni błąd bezwzględny według wzoru 6:

,| | 1 1

¦

n  i iMM i Ğ n y y B (6) gdzie:

Bś – średni błąd bezwzględny modelu, n – liczba próbek w zbiorze uczącym,

yi – rzeczywiste wartości wyjściowe (i = 1, ..., n),

yiMM – wyznaczone przez minimodel wartości wyjściowe (i = 1, ..., n). 5 S. Geissler, Predictive inference, Chapman and Hall, New York 1993.

(10)

Testowanie dokładności obliczeń minimodelu dla problemu bezrobocia wykazało, że średni błąd bezwzględny obliczeń dla wszystkich posiadanych 96 próbek wyniósł 0,02729. Dla porównania, bardzo dokładny model neuronowy o charakterze globalnym miał średnią wartość błędu równą 0,037501.

Na rysunku 5 przedstawiono powierzchnię globalnego modelu neurono-wego oraz – dla porównania – przykładowy minimodel uzyskany w wyniku pro-cesu uczenia dla punktu zapytania PZ: {0,28, 0,86}.

0 0.2 0.4 0.6 0.8 1 0 0.5 1 0 0.2 0.4 0.6 0.8 1 Liczba ludnosci Podaz pieniadza S topa bez roboc ia Y* model globalny minimodel dla PZ Liczba ludnoĞci PodaĪ pieniądza

Rys. 5. Globalny model zależności y = f(x1, x2) uzyskany za pomocą sztucznej sieci neuronowej i przykładowy minimodel uzyskany dla zapytania PZ: {0,28, 0,86} Źródło: opracowanie własne.

Wnioski

W artykule przedstawiono koncepcję ograniczonego, lokalnego, trójkąt-nego minimodelu, którego celem jest udzielenie – na podstawie próbek zależ-ności y = f(x1, x2), jaką dysponujemy w bazie wiedzy – odpowiedzi na zapytania obliczeniowe. Badania wykazały, że dokładność obliczeń realizowanych przez minimodel jest wysoka, a czas obliczeń krótki. Uzyskana wysoka dokładność jest wynikiem lokalności minimodelu. Dalsze prace autorów idą w kierunku opraco-wania nieliniowych minimodeli o jeszcze wyższej dokładności obliczeń.

(11)

Literatura

Geissler S., Predictive inference, Chapman and Hall, New York 1993.

Morajda J., Neural networks as predictive models in fi nancial futures trading, Fith Con-ference on Neural Networks and Soft Computing, Zakopane 2000.

Pokropińska A., Scherer R., Financial prediction with neuro-fuzzy systems, International Conference AISC 2008, Springer 2008.

Rejer I., Metody modelowania wielkowymiarowego system z użyciem metod sztucznej

inteligencji na przykładzie bezrobocia w Polsce, Wydawnictwo Naukowe

Uniwer-sytetu Szczecińskiego, Szczecin 2003.

Wąsikowska B., Niestandardowe metody identyfi kacji czynników determinujących

pro-dukcję sprzedaną przemysłu, rozprawa doktorska, Wydział Nauk Ekonomicznych

i Zarządzania, Uniwersytet Szczeciński, Szczecin 2007.

Witkowska D., Application of econometric models an neural networks to consumer price

index prediction, Fith Conference on Neural Networks and Soft Computing,

Zako-pane 2000.

ANWENDUNG DES SELBSTLERNENDEN, 3-PUNKT- MINIMODELS ZUR MODELLIERUNG DER ARBEITSLOSENQUOTE IN POLEN

Zusammenfassung

Gegenstand des Artikels ist die Konstruktionsmethode des lokalen Minimodels das eine beträchtliche Lerngeschwindigkeit besitzt. Das Model dient hier zur Berechnung schneller Antworten an Anfragen bettreffens der Arbeitslosenquote aufgrund der Daten. Die Anzahl der Daten muss nicht konstant sein und kann mit der Zeit vergrößert werden, falls neue Daten gewonnen werden. Ein großer Vorteil des Minimodels ist seine Fähig-keit zur Interpolation in den Informationslücken in den Daten. Diese FähigFähig-keit unter-scheidet das vorgeschlagene Minimodel von der KNN-Methode (Methode der nahesten Nachbarn). Ausser dem Erklären der Minimodelsidee wurde in dem Artikel ein Beispiel der Anwendung zur Modellierung der Arbeitslosenquote aufgrund statistischer Daten gezeigt. Die Qualität des Minimodels wurde mit der bekannten „leave one out” Methode geprüft.

(12)

Cytaty

Powiązane dokumenty

Należy zmodyfikować tabelki kosztu algorytmów sortowania bąbelkowego, przez selekcję i wstawianie, jeśli wiadomo, że liczby sortowane są już posortowane rosnąco.. Czy

Dodaj w formularzu do dodawania nowych tytułów (Dodaj_tytuly_w_aplikacji) komponenty obsługujące wyświetlanie liczby tytułów, tak aby jednocześnie podczas wywołania formularza

Egzamin z Mechaniki

Punkty przyznaje się za każdą poprawną merytorycznie odpowiedź, nawet, jeśli nie została uwzględniona w schemacie (decyzję w tym zakresie ostatecznie podejmuje

Punkty przyznaje się za każdą poprawną merytorycznie odpowiedź, nawet, jeśli nie została uwzględniona w schemacie (decyzję w tym zakresie ostatecznie podejmuje

Punkty przyznaje się za każdą poprawną merytorycznie odpowiedź, nawet, jeśli nie została uwzględniona w schemacie (decyzję w tym zakresie ostatecznie podejmuje

b) Jakie jest prawdopodobieństwo, że średnie zużycie wody w losowo wybranym tygodniu jest zawarte między 95 hl i 105 hl? Przyjmiemy, że zużycie wody ma rozkład normalny i

4. Rozkład miesięcznych wydatków studentów I roku studiów dziennych SGH na zakup książek jest rozkładem nor- malnym z wartością oczekiwaną równą 20 PLN, natomiast w