MBTOOY LOŚCIOWE W BADANIACH EKONOMICZNYCH, VItr Mode]e ekonometryczne,2007, stł.253 - ż59
NIESTANDARDOWE METODY IDENTYFIKACJI CZYNNIKÓW DETERMINUJĄCYCH PRODUKCJĘ SPRZEDANĄ PRZEMYSŁU
Barbara Wąsikowska Instytut Informatyki w Zarządzaniu, WNEiZ Uniwersytetu Szczecińskiego e-mail: barbara.wasikowska@ wneiz.pl
Streszczenie:
w
artykule przedstawione zostały niestandardowe metody identyfikacji czynników ekonomicznych determinujących produkcję sprzedaną przemysłu takie jak:sztuczna sieć neuronowa RBF oraz algorytm genetyczny. Obecnie do identyfikacji czynników mających wpływ na dane zjawisko ekonomiczne stosuje się metody standardowe tj. metody statystyczne
i
ekonometryczne. Jednak metody te nie są w stanie w pełni odzwierciedlić otaczającą człowieka coraz bardziej złożonąrzeczywistośó ekonomiczną. W zwiąku z tym stale poszukuje się nowych metod identfikacji.Słowa kluczowe: identyfikacja, sztlJczla inteligencja, sieci neuronowe RBF, algorytmy genetyczne.
PROBLEM IDENTYFIKACJI ZMIENNYCH DO MODELU
Rozwój cywilizacji, postępu technicznego
i
gospodarki światowej prowadzi do powstawalia coraz bardziej skomplikowanej rzeczywistości ekonomicznej w otoczeniu człowieka. Zasadniczym celem pracy badacza-ekonomistyjest
więc poznaniei w możiwie
prostyi
najdokładniejszy sposób opisaniei
wyjaśnienie zjawisk ekonomicznych"Są
one jednak zazwyczaj zjawiskami nieliniowymi, cechującymi się dużą liczbą zmiennych, względnie małą liczbą danych pomia- rowych orazsilną
często nieliniową korelacją zmiennych.W
zjawiskach tych dziŃĄą różnorodne prawa ekonomiczne, zależI7e od warunków ekonomicznych ipolityki
gospodarczejpństwa. Bardzo
ważnym problememjest
równiez upĘwający czas. Model opisujący zjawisko ekonomiczne dla danej rzeczywistości może zupełnienie
odpowiadać stanowi przyszłemu, bowiem czynniki mające zasadniczy wpływ na to zjawisko w badanym okresie w innym czasie mogą nie mieć tak istotnego wpływu ]ub nawetw
ogóle nie występować. Wśród innychprzyczyn
powodujących ogromnetrudności w opisaniu
otaczającej nas rzeczywistości ekonomicznej mozna wymienić takie jak [Piegat A. 1999]:254 Barbara Wąsikowska
.
wpływ ludzi (rządów, ministrów, ekspertów itp.) na aktualne zależności ekonomiczne istniejące w kraju,r
istnienie wzajemnych, często bardzo skomplikowanychi
trudnych dozdefiniowani a powią.zań między czynnikami opi suj ącymi badane zj awi sko,
.
występowanie obok informacji precyzyjnej, również informacji jakościo- wej i rozmytej,o
możliwość występowania błędów lub luk w zebranym materiale statysty- czllym,o
brak możliwości zmjerzenia pewnych wielkości lub brak informacji na temat kształtowania się tych wielkościw
pewnych okresach wcześniej- szych,.
wystą)ienie procesów, które nie zostaĘ dotychczas zidentyfikowane.Dokonując przeglądu literatury można
zauwaĘć, że
najczęściej stosowanymi metodami słuącymi do identyfikacji czynników istotnie wpĘwających na badanezjawisko są metody klasyczne
w
postaci metod ilościowych-
statysĘcznych i ekonometrycznych. Uźywając pojęcia ,,metody klasyczne" autorka niniejszego artykułu ma na myśli metody wcześniej opracowane, częściej wykorzystywane niż inne, stosowanę przy często powtarzającychsię
zŃożeńach, Natomiast pojęcie ,,metody niestandardowe" odnosi się do metod nowych, rzadziej używanych do opisu zjawisk ekonomicznych-
metod sztucznej inteligencji.By
móc rzetelnie przedstawić możliwości stosowania tych metod do opisu problemów makroekono- micznych autorka niniejszego artykułu zdecydowała się zastosować je do budowy modelu produkcji sprzedanej przemysłu, która jest jednym z głównych problemówpolskiej
gospodarki,Poniżej
zaptezentowane zostałydwie
metody sztucznej inteligencji mogące sŁaĘć do identyfikacji czynników istotnie wpływających na produkcję sprzedaną przemysłu tj. sztuczną sieć neuronowąRBF
oraz algorytm genetyczny.BADANIA IDENTYFIKACYJNE
ZWYKORZYSTANIEM SZTUCZNEJ
SIECINEURONOWEJ RBF
Niezależnie od tego jaka metoda zostanie użyta do opisu badanego zjawiska
w
pierwszym kroku należy ustalić zbiór kandydatek na zmienne objaśniające.Główną
przesłanką decydującąo wyborze
zmiennych, powinnabyć
ichmerytoryczna wartość przy jednoczesnym uwzględnieniu celu badania [Nowak.
1984]. Często w doborze kandydatek na zmienne posfuguje się również metodą ekspercką
w
której wykorzystujesię
doświadczenta specjalistów (teoretyków i praktyków)z
dziedziny będącej przedmiotem modelowania [Hozeri
in. 2005].Jednak przede wszystkim, należy kierować się istniejącąteorią ekonomii.
Poszuk-ując zmiennych potencjalnie wpływających na wielkość produkcji sprzedąnej przemysłu
w
polsce, poza wskazaniami płynącymiz
ogólnych teoriiNiestandardowe metody identyfikacji,". 255
ekonomii, oparto się m.in. na wyrikach badań przeprowadzonych przez Instytut Badań nad Gospodarką Rynkową, wynikach przedstawionych w poszczególnych numerach
Monitora
EkonomicznegoPSE S.A., BiuleĘnu
Ekonomicznego Ministerstwa spraw zllgranicznych,Makro
Trendów wydawanych przezBGż
S.A., raportów umieszczonych na stronie internetowej eGospodarka.pl oraz napodstawie analiz
opracowywanychprzez Centrum Analiz
Społeczno- Ekonomicznycł. Wytypowanych zostało dwadzieścia jeden zmiennych potencjal- nie wpływających na produkcję sprzedaną przemysłu: eksport towarów ogółem,import
towarów ogółem,saldo
eksportimport,
przeciętne wynagrodzenie nominalne brutto, pracującyw
sektorze przedsiębiorstw ogółem, bezrobotni zarejestrowani ogółem, zasiłki dla bezrobotnych, podaż pieniądza ogółem, nakłady inwestycyjne, wpływy z podatku dochodowego od osób fizycznych, kurs dolara, przychody z całoksztńtu działalności, koszty uzyskania przychodów z całokształtu działalności, wynik budzetu pństwa, dochody budżetu pństwa, wydatki budzetu państwa, wskaźnik cen produkcji sprzedanej przemysłu, wskażrik cen transakcyj- nych eksportu, inflacja miesięczna, liczba ludności.Kolejnym krokiem
w
prowadzonych badaniachbyło
wybranie spośród kandydatek na zmienne objaśniające tych, które mają istotny wpływ na produkcjęoIaz
skonstruowaniemodeli produkcji
sprzedanej przemysłuprzy
uzyciu niestandardowych metod identyfikacji zmiennychjakimi są
metody sztucznej inteligencji.Jako pierwszy zostanie przedstawiony model neuronowy
RBF
sprawdzający wszystkiemożliwe
zestawy zmiennych objaśniających.Liczbę
wszystkich możliwych kombinacji zmiennych wyliczono na podstawie wzoru dwumianowego Newtona (z pominięciem oczywiście zbioru pustego,czyli
braku jakichkolwiek istotnej zmiennej objaśniającej):2" - l"
Zatęmliczba
wszystkich możliwychkomb_inacji, przy dwudziestu jeden kandydatkach na zmienne objaśniające, równa się: 221
-
I = 2 O91 I5L W trakcie budowy modelu pojawił się problem ustalenia odpowiedniejilości
neuronóww
warstwie ukrytej sieci neuronowej.W
celu wyjaśnienia jaka liczba neuronów byłaby odpowiednią postanowiono stworzyć po dziesięć modelidla sieci
zawierających od jednegodo
dwudziestu neuronów w warstwie ukrytej. Tak więc, skonstruowano dziesięć modeli dla sieci z jednym neuronemw
warstwie ukrytej, dziesięć modelidla
sieciz
dwoma neuronamiw warstwie ukrytej itd. W kolejnym kroku
kżda
z sieci była trenowanana zbiorzę próbek uczącychprzez l00
epok,a
następnie testowanana
zbiorze próbek walidujących. Spośród wszystkich otrzymanych modeli, wybranopo
jednym, najlepszym (najniższy błądMSE)
dla danego rodzaju sieci, Wybranych zostało więc 20 modeli. Dla kżdego z nich został policzony błąd uczący i błąd na zbiorze walidującym.Po
przeanalizowaniu błędów uczącychi
błędówla
zbiorzę walidującym stwierdzono,żę dla sieci
zawierajacychod 1 do 8
neuronóww warstwie ukrytej zarówno błąd uczący,
jak i
błądna
zbiorze walidującym gwałtownie spada. Powyżej jednak dziewięciu nauronów, wartości błędu na zbiorzę walidującym zaczynająsię ,,wńać", tzn. raz rosną a raz spadają co może256 Barbara riVą,sikowska świadczyó o przeuczeniu sieci.
By
uniknąć niedouczenia, jaki
przeuczenia sieci stwierdzono, że najodpowiedniejszą liczbąneuronów w warstwie ukrytej będzie liczba 8. parametry siecizostĄ
nastrojone automatycznie przez instrukcję newrb znajdująpąsię w programie Matlab.ostateczrrie do przeprowadzerria badania użyto
sieci zawieĄącej
osiem neuronóww
warstwie ukrytej.zńańęm sieci było
sprawdzenie wszystkich możliwych kombinacji oraz poliezenie błędu dla kazdegoz
otrzymanych modeli według wzoru:MSE
-_ltr,
t=I-j,\'
gdzie:
ny, - rzenzywista wartość zmiennej objaśnianej dla próbki l,
f,
- wartość zmiennej objaśnianej dla próbki, wyznaczona podstawie modelu rl - liczba obserwacji.a następnie, podanie najlepszej kombinacji wejść dla kżdego z typu modeli, czyli
dla
modelu zaulierającegojedno
wejście,dwa
wejściaitd., ń do
modelu zawierającego wszystkiemożiwe
zmienne objaśniająpe. Najlepszym modelem (tzn. modelemo
najmniejszym błędzie) okazŃ się model za,wierający dziesięć wejść:Xr, &,
Xs, Xs,Xtł,
Xró,Ę,
X13,Ąg, XĄ.
Wybrane spośńd wszystkichkandydatek zmierme są tymi czynnikami, które wywierają największy wpływ na
p ro dukcj ę sp rze daną p rzemy §u,
Błąd średniokwadratowy modelu produl<cji sprzedanej przemysłu, zbudowa- nego w oparciu o wybrane zmienne objaśniające, wyniósł: MSE = 0,0496. Poniżej przedstawiono równanie modelu.
- r,,)' ż6,'
) + rł0ogdzie
W1 - Wa§i,
xj - zmiennę objaśniająpe,
cli - punkt stanowiący centrum funkcji radialnej, d - szerokość funkcji.
aż,yta
w
badaniu metoda sztucznychsieci
neuronowychRBF
pozwoliła na zidentyfikowanie czynników w sposób istotny wpływających na badanąprodukcję- Niestety, poważrąwadątej metody jest jej bardzo duża czasochłonność.(1)
10,
'(",
j=I (2)y(x)=Ią
8"rp(-
Niestandardowe metody identyfikacji ... 257
BADANIA IDENTYFIKACYJNE
ZWYKORZYSTANIEM ALGORYTMU GENETYCZNEGO
Do budowy drugiego modelu produkcji
sprzedanej przemysłu postanowionolĘć
algorytmu genetycznego,cdyż obok
sztucznych sieci neuronowych,jest to
drugiepod
względem popularności narzędzie sztucznej inteligencji stosowanedo
różnego rodzajuanaliz
ekonomicznych. Badanie wykonane zostało przy pomocy instrukcji napisanej w programie Matlab. Poniżej przedstawiono opis słowny poszczegó|nych kroków zawartych w instrukcji:1. Ze
wszystkich mozliwych kombinacji zmiennych wygenerowano drogą losową populację początkową zawieraj ąca ż0 osobników"2.
Dla każdego osobnika stworzony został model RBF, na podstawie któregoobliczono wartość błędu
średniokwadratowego będącego funkcją dopasowaniaosobnika. Osobniki
posortowanorosnąco (tzn.
od ,,najlepszego"-
mającego najniższą wartość błędu, do ,,najgorszego"-
którego wartość błędu była najwyższa), po czym t/l najgorszych usunięto z populacji. W ten sposób przeprowadzono selekcję osobników. Pozostałe osobniki
wzięły udział w
kolejnymkroku
modelowaniajakim
jest reprodukcja.3.
Reprodukcję przeprowadzonopzy
użyciu operatora krzyżowańa. O tym, które osobniki mająbrać adziń w
krzyżowaniudecydowĄ
losowo stosowane funkcjeAND, OR i XOR.
Proces reprodukcji ulznawal7o za zakończony, gdy liczba osobników w populacji równa była20.4.
Otrzymanąma drodze
reprodukcji populację poddawano mutacji.Zpopalacji
losowano pewnąliczbę bitów, która ma ulec
mutacji.Procesowi mutacji
nie
ulegał jednak osobnik, któregobłąd
średnio- kwadratowy był najŃższy. Po wylosowaniu indeksów bitów (czyli miejsc, które mają ulec mutacji) następowała mutacja polegająca na zamianie 0 na1 i odwrotnie.
5.
Całąprocedurę (tzn. od selekcji) powtarzano 100 razy.6. Na końcu
generowano najlepszego osobnika zapisanegow
postacichromosomu oraz błąd otrzymanego modelu.
W wyniku działania algorytmu genetycznego otrzymano chromosom składający się z
2I
genów: 100l 101010010l1001010. Geny, których wartość jest równa jedności wskazują na to, które ze zmiennych objaśniających zostały wybrane do modelu produkcji sprzedanej pąemystui w
sposób istomyna nią
wpĘwają. Błądśredniokwadratowy otrzymanego modelu wyniósł: MSE = 0,0553 i był on większy tylko o 0,0057 od błędu modelu otrzymanego przy użyciu sieci RBF sprawdzającej wszystkie mozliwe kombinacje wejść, natomiast czas oczekiwania na wyniki uległ znacznęmu skróceniu.
258 Barbara Wąsikowska
WNIOSKI
ZPRZEPROWADZONYCH BADAN
Przedstawione w niniejszym artykule badania koncentrowĄ się na analizie stosowalności sztucznych sieci neuronowych
RBF
oraz algorytmów genetycznychdo identyfikacji czynników
ekonomicznych, wpływającychna
produkcjęsprrydanq przemysłu. poniżej zestawiono błędy obu skonstruowanych modeli oraz zestawy zmiennych wybranych
w
trakcie modelowaniaprzy
uzyciu poszcze- gólnych metod (Tabela 1).abela l, zestawienie wynikowe elektów i
łodzaj modelu Błąd modelu Wybrane zmienne
RBF 0,0496 Xr, Xą, Xs, Xs, Xro, Xrs, Xrq, Xzo, Ą2,X24
Alg. genetyczny + RBF 0,0553 Xr, Xą,
&,
&, Xs, Xro, Xro, Xrr, Xzo,Xz2 obliczenia własneNa
podstawie otrzymanych wyników można stwierdzić,że
zastosowanie metod sztucznej inteligencji pozwala na zidentyfikowanie czynników mających istotny wpływ na produkcję sprzedaną przemysłu. Metody sztucznej inteligencji mogąwięc być z
powodzeniem stosowane- obok
metod klasycznych do identyfikacji czynników mających wpływ na badane zjawisko ekonomiczne.LITERATURA
Arabas J., (2001) Wykłady
z
algorytmów ewolucyjnych, Wydawnictwo Naukowo- Techniczne, WarszawaGoldberg D. E., (1998) Algorltmy genetyczne
i
ich zastosowania, Wydawnictwo Naukowo-Techniczne, WarszawaHozer J.
i
in., (2005) Ekonometria stosowanaz
zadaniarri, Katedra Ekonometrii i Statystyki Uniwersytetu Szczecińskiego, SzczecinNowak E., (1984) Problemy doboru zmiennych do modelu ekonometrycznego, PWN, Warszawa
Osowski
S.,
(1996) Sieci neuronowew
ujęciu algory.tmicznym, Wydawnictwo Naukowo-Techniczne, WarszawaPiegat A., (1999) Modelowanie i sterowanie rozm}te, Akademicka Oficyna Wydawnicza EXIT, Warszawa
Rutkowski L., (2005) Metody i techniki sztucznej inteligencji, PTVN, Warszawa
Niestandardowe metody identńkacji
,..
259Non-standard Methods for Identification of Factors Determining Sold Production of Industry
Summary: The paper pfe§€nts non-standard methods for identification of economic factcns determining sold production af industry, such as: radial basis network (RBĘ and the genetic algońthm. Nowadays for identification of factors having influence on particular economic phenomenon there are used standmd methods, i.e. statistical and econometric methods.
However, these methods are not able to reflect fully more and more compound reality .or6rrnding the man. Therefore new methods of identification are constantly seeking, Key words: identification, artificial intelligence, radial basis networks, genetic algorithm§