• Nie Znaleziono Wyników

Zastosowanie metod sztucznej inteligencji do identyfikacji czynników ekonomicznych

N/A
N/A
Protected

Academic year: 2021

Share "Zastosowanie metod sztucznej inteligencji do identyfikacji czynników ekonomicznych"

Copied!
8
0
0

Pełen tekst

(1)

BARBARA W SIKOWSKA Uniwersytet Szczeciski

Streszczenie

W artykule przedstawiony został problem identyfikacji czynników majcych wpływ na okrelone zjawisko ekonomiczne przy zastosowaniu niestandardowych me-tod modelowania - meme-tod sztucznej inteligencji.

Słowa kluczowe: sieci neuronowe radialne, algorytmy genetyczne, teoria zbiorów przyblionych, identyfikacja czynników ekonomicznych

1. Wprowadzenie

W ostatnich latach wraz z dynamicznym rozwojem informatyki i dostarczanych przez ni co-raz wikszych mocy obliczeniowych obserwuje si ogromny wzrost zainteresowania metodami sztucznej inteligencji w takich dziedzinach jak: finanse, medycyna, zastosowania inynierskie, geologia czy fizyka. W dziedzinie ekonomii wymieni mona takie obszary zastosowa jak: pro-gnozowanie bankructw, kursów walut, notowa akcji, wskaników finansowo-ekonomicznych, klasyfikacji przedsibiorstw, wycena kontraktów terminowych, spółek, nieruchomoci, ocena wiarygodnoci kredytowej, identyfikacja klientów według przedstawianej oferty.1 Obecnie wiele znaczcych placówek naukowych i badawczych na całym wiecie zajmuje si zastosowaniami sztucznej inteligencji. Stopie zaawansowania prac pozwolił na wydzielenie kilku kierunków bada. Najwaniejszymi z nich s sieci neuronowe (neural networks), logika rozmyta (fuzzy lo-gic), algorytmy genetyczne (evolutionary algorithms) i teoria zbiorów przyblionych (rough sets). Metody te (w szczególnoci sieci neuronowe i algorytmy genetyczne) pozwalaj na zautomatyzo-wanie niektórych, bardziej uciliwych etapów procesu modelowania, co w duej mierze ułatwia budow modelu danego zjawiska ekonomicznego.

Rozwój cywilizacji, postpu technicznego i gospodarki wiatowej prowadzi do powstawania coraz bardziej skomplikowanej rzeczywistoci ekonomicznej w otoczeniu człowieka. Zasadni-czym celem pracy badacza-ekonomisty jest wic poznanie i w moliwie jak najprostszy sposób opisanie i wyjanienie zjawisk ekonomicznych. S one jednak zazwyczaj zjawiskami nieliniowy-mi, cechujcymi si du liczb zmiennych, wzgldnie mał liczb danych pomiarowych oraz siln, czsto nieliniow korelacj zmiennych. W zjawiskach tych działaj rónorodne prawa eko-nomiczne, zalene od warunków ekonomicznych i polityki gospodarczej pastwa. Bardzo wanym problemem jest równie upływajcy czas. Model opisujcy zjawisko ekonomiczne dla danej rze-czywistoci moe zupełnie nie odpowiada stanowi przyszłemu, bowiem czynniki majce zasadni-czy wpływ na to zjawisko w badanym okresie w innym czasie mog nie mie tak istotnego

(2)

wu lub nawet w ogóle nie wystpowa. Wród innych przyczyn powodujcych ogromne trudnoci w opisaniu otaczajcej nas rzeczywistoci ekonomicznej mona wymieni takie jak:2

istnienie wzajemnych, czsto bardzo skomplikowanych i trudnych do zdefiniowania powiza midzy czynnikami opisujcymi badane zjawisko,

wystpowanie obok informacji precyzyjnej, równie informacji jakociowej i rozmytej,

moliwo wystpowania błdów lub luk w zebranym materiale statystycznym,

brak moliwoci zmierzenia pewnych wielkoci lub brak informacji na temat

kształto-wania si tych wielkoci w pewnych okresach wczeniejszych,

wystpienie procesów, które nie zostały dotychczas zidentyfikowane.

Dodatkowym problemem, z którym musi zmierzy si badacz chccy opisa dane zjawisko ekonomiczne (zbudowa model), to problem doboru czynników najbardziej istotnych dla kształ-towania si tego zjawiska. Dokonujc przegldu literatury mona zauway, e najczciej stoso-wanymi metodami do opisu zjawisk wielkowymiarowych s metody statystycznej analizy wielo-wymiarowej (SAW), która jest działem statystyki teoretycznej i stosowanej.3 W zalenoci od tego, jakie podejcie zostało przyjte w badaniu statystycznym stosowane s metody oparte na podejciu stochastycznym lub metody oparte na podejciu opisowym. Inna klasyfikacja metod SAW opiera si na kryterium istnienia hipotez badawczych o rozwaanym zbiorze obserwacji. Hipotezy te z reguły wynikaj z wiedzy merytorycznej dotyczcej zjawisk złoonych, odnonie do których informacje s w wielowymiarowych obserwacjach. Ze wzgldu na to kryterium metody SAW dzieli si na: metody weryfikujce (potwierdzajce) hipotezy o badanych zjawiskach oraz na metody odkrywajce właciwoci badanych zjawisk. Naley przy tym zauway, e wikszo z tych metod opiera si na badaniu modeli jednoargumentowych. W przypadku jednak zjawisk wielkowymiarowych ich uyteczno jest ograniczona. Ograniczenie to zwizane jest z ogromn redukcj informacji towarzyszcej przejciu z przestrzeni wielkowymiarowej do przestrzeni dwu-wymiarowej.

Przesłank napisania niniejszego artykułu była wic potrzeba wypełnienia luki metodycznej w naukowym warsztacie badawczym dotyczcym modelowania systemów rzeczywistych. Stosowa-ne metody nie s w stanie w pełni odzwierciedli otaczajc nas złoon rzeczywisto ekono-miczn. Nie istnieje bowiem uniwersalna metoda, która pozwalałaby tworzy modele róno-rodnych zjawisk ekonomicznych z tak sam, zadowalajc dokładnoci (szczególnie dotyczy to identyfikacji nieliniowej). W zwizku z tym stale poszukuje si nowych metod, które z wiksz precyzj wyjaniałyby zjawiska makroekonomiczne. Odpowiedzi na to zapotrzebowanie, moe by próba zastosowania niestandardowych metod modelowania procesów makroekonomicz-nych – metod sztucznej inteligencji takich jak: sieci neuronowe, algorytmy genetyczne, teoria zbiorów przyblionych. Dokonujc przegldu literatury przedmiotu mona si przekona e pojcia „standardowe (klasyczne) metody” i „niestandardowe (nieklasyczne) metody”, s rónie interpretowane. W poniszym artykule słowo „standardowe” oznacza metody wczeniej opraco-wane, czciej wykorzystyopraco-wane, czy te stosowane przy czsto powtarzajcych si załoeniach. Natomiast pojcie „metody niestandardowe” odnosi si do metod nowych, rzadziej uywanych do opisu zjawisk ekonomicznych – metod sztucznej inteligencji.

2

Por. [7] oraz [9]. 3 Por. [4].

(3)

2. Metody identyfikacji czynników ekonomicznych

Istnieje szereg metod doboru zmiennych do modelu. W literaturze przedmiotu najczciej sto-sowanym kryterium podziału metod identyfikacji zmiennych jest rodzaj modelu jaki zamierza si uzyska tzn. liniowy czy nieliniowy (Rys. 1).

Rysunek 1. Klasyfikacja metod identyfikacji zmiennych ródło: opracowanie własne na podstawie [5]

W grupie metod słucych do identyfikacji zmiennych do modelu nieliniowego bardzo inten-sywnie rozwijaj si (w cigu ostatnich kilkunastu lat) metody sztucznej inteligencji. Celem pro-wadzonych przez autorów niniejszego artykułu bada jest analiza stosowalnoci niestandardowych

' ')&%. '&* "@##13 " 101-3  #.'3)A1 Metoda M. Kolupy  #.&.' 1  #.'-' &'%   #.-01'&*30A1; '&* ",-B-3 ' ')&%. '&* ## 13 ' ')&%. '&* # # 13 "$-1&. Metoda E. Nowaka "$1" 31  -)&% M Meettooddaakkrrzzyywwyycchhrroozzmmyyttyycchh ( (LLiinniiCCuunnnniinngghhaammaa)) 01;21 Sieci RBF &/&/ 1 J Jeeddnnookkiieerruunnkkoowweessiieeccii w wiieelloowwaarrssttwwoowwee

(4)

metod modelowania (sieci neuronowych, algorytmów genetycznych, teorii zbiorów przyblio-nych) do modelowania zjawisk ekonomicznych. Procedura badawcza została oparta na analizie systemowej – metodzie badawczej słucej do poszukiwania wskazówek do podjcia wanych decyzji gospodarczych. Przyjtym obszarem badawczym s uwarunkowania produkcji sprzedanej przemysłu w Polsce, w okresie od grudnia 1993 do stycznia 2000 roku. Sporód metod sztucznej inteligencji do budowy modeli zostały wybrane radialne sieci neuronowe, algorytmy genetyczne oraz zbiory przyblione.

3. Sieci neuronowe RBF T Teemmaattyykkaasszzttuucczznnyycchhssiieecciinneeuurroonnoowwyycchhnnaalleeyyddooiinntteerrddyyssccyypplliinnaarrnneejjddzziieeddzziinnyybbaaddaappoo- -w wiizzaanneejj zzmmaatteemmaattyykkssttoossoowwaann,,ssttaattyyssttyykk,,aauuttoommaattyykk,,bbiiooccyybbeerrnneettyykk,,eelleekkttrroonniikk,,aannaawweett m meeddyyccyynn..SSzzttuucczznneessiieecciinneeuurroonnoowweeppoowwssttaałłyynnaappooddssttaawwiieewwiieeddzzyyooddzziiaałłaanniiuussyysstteemmuunneerrwwoo- -w weeggoo iissttoott yywwyycchh ii ssttaannoowwiipprróóbb wwyykkoorrzzyyssttaanniiaazzjjaawwiisskk zzaacchhooddzzccyycchh wwssyysstteemmaacchh nneerrwwoo- -w wyycchhpprrzzyyppoosszzuukkiiwwaanniiuunnoowwyycchhrroozzwwiizzaa..SSiieecciinneeuurroonnoowweemmoonnaattrraakkttoowwaajjaakkoonnoowwoocczzeessnnee s syysstteemmyyoobblliicczzeenniioowwee,,kkttóórreepprrzzeettwwaarrzzaajjiinnffoorrmmaaccjjeewwzzoorruujjccssiinnaazzjjaawwiisskkaacchhzzaacchhooddzzccyycchhww m móózzgguucczzłłoowwiieekkaa..IInnffoorrmmaaccjjeetteemmaajjcchhaarraakktteerrddaannyycchhnnuummeerryycczznnyycchh,,nnaappooddssttaawwiieekkttóórryycchhssiiee n neeuurroonnoowwaammooeennaapprrzzyykkłłaaddppoossłłuuyyjjaakkoommooddeelloobbiieekkttuuoozzuuppeełłnniieenniieezznnaanneejjcchhaarraakktteerryyssttyyccee. .

Sieci RBF stanowi specjaln odmian sieci zawierajcej neurony o radialnej funkcji bazowej zazwyczaj typu gaussowskiego. Sie moe zawiera dowoln liczb N wej, okrelon liczb neuronów ukrytych o radialnej funkcji aktywacji oraz tyle neuronów wyjciowych, ile wynosi wymiar wektora zadanego d, wynikajcy ze specyfikacji problemu. Neurony wyjciowe s zwykle liniowe i kady z nich realizuje sum wagow sygnałów pochodzcych z neuronów radialnych warstwy ukrytej.

Sieci radialne umoliwiaj wystpienie symetrii kołowej wokół neuronu, co w niektórych przypadkach moe zasadniczo zredukowa liczb neuronów potrzebn sieci do poprawnego dzia-łania. W sieciach radialnych nie wystpuje potrzeba stosowania wielu warstw ukrytych. Typowa sie radialna składa si z warstwy wejciowej, ukrytej z neuronami radialnymi i wyjciowej, w której zadaniem neuronu jest tylko sumowanie wagowe sygnałów wychodzcych z neuronów ukrytych. Gaussowska posta funkcji radialnej z centrami ulokowanymi w ci (przy wartoci p równej liczbie danych uczcych wektor centrum odpowiada współrzdnym xi wektora uczcego) i szerokoci si.

¦

= ¸¸ ¹ · ¨¨ © § − − = p i i i i c x W x F 1 2 2 2 || || exp ) ( σ (1) 4. Algorytmy genetyczne

Algorytmy genetyczne stanowi bardzo silne narzdzie do rozwizywania wielu problemów optymalizacyjnych. Ich zasada działania oparta jest na mechanizmach doboru naturalnego oraz dziedzicznoci. Algorytm ewolucyjny przetwarza populacj osobników, z których kady jest pro-pozycj rozwizania postawionego problemu. Działa on w rodowisku, które mona zdefiniowa na podstawie problemu rozwizywanego przez algorytm. W rodowisku kademu osobnikowi jest przyporzdkowana warto liczbowa, okrelajca jako reprezentowanego przez niego rozwiza-nia; warto ta jest nazywana przystosowaniem osobnika. Kady osobnik jest wyposaony w

(5)

in-formacj stanowic jego genotyp, bdc „przepisem” na utworzenie fenotypu – zestawu cech okrelanych przez genotyp, podlegajcych ocenie rodowiska.

rodowisko mona opisa jako funkcj przystosowania, za pomoc której osobnikowi przypi-suje si przystosowanie na podstawie jego fenotypu. Funkcja ta moe by stacjonarna lub zmien-na w czasie, moe te zawiera element losowoci. Działanie algorytmu genetycznego sprowadza si do wykonania ptli przedstawionej na rys. 2, w której nastpuje po sobie reprodukcja, operacje genetyczne, ocena i sukcesja.

Rysunek 2. Schemat algorytmu ewolucyjnego ródło: [1]

W literaturze przedmiotu, reprodukcj i sukcesj okrela si łcznym mianem selekcji. Repro-dukcja w połczeniu z operatorami genetycznymi modeluje rozmnaanie, podczas którego mate-riał genetyczny rodziców przekazywany jest potomkom. Podczas reprodukcji zostaj powielone losowo wybrane osobniki z populacji bazowej. Powstałe w wyniku reprodukcji kopie, zwane osobnikami rodzicielskimi, poddawane s operacjom genetycznym takim jak mutacja i krzyowa-nie. Populacja potomna jest poddawana ocenie rodowiska, po czym nastpuje sukcesja – tworzy si now populacj bazow, mogc zawiera osobniki zarówno z populacji potomnej, jak i ze starej populacji bazowej. Cykl ewolucji moe si koczy si wówczas, gdy przystosowanie osob-ników jest odpowiednio due lub gdy stwierdzi si, e stan populacji bazowej wiadczy o stagna-cji algorytmu.

W przeprowadzonych badaniach algorytmy genetyczne wraz z sieci neuronow RBF zostały uyte do identyfikacji czynników ekonomicznych majcych wpływ na produkcj sprzedan prze-mysłu w Polsce w latach 1993 – 2000.

rodowisko Inicjacja Algorytm ewolucyjny Sukcesja Ocena Reprodukcja Operacje genetyczne

(6)

5. Teoria zbiorów przyblionych

ródłem teorii zbiorów przyblionych s liczne badania z zakresu analizy i reprezentacji w technikach informatycznych przeprowadzane przez polskich matematyków i informatyków w latach siedemdziesitych. Autorem koncepcji zbiorów przyblionych jest profesor Zdzisław Paw-lak, który ogłosił podstawy tej teorii w 1982 roku. Nastpnie została ona rozwinita do postaci aplikacji data mining przez profesora Andrzeja Skowrona. Obecnie jest ona jedn z najszybciej rozwijajcych si dziedzin sztucznej inteligencji.

Teoria zbiorów przyblionych stosowana jest do badania nieprecyzyjnoci, ogólnikowoci i niepewnoci w procesie analizy danych. Koncentruje si ona na dostarczaniu ogromnym zbiorom danych niezbdnych wzorów, reguł oraz informacji. Zbiory przyblione mog by równie in-strumentem prognostycznym słucym do zapisywania dowiadcze ekspertów w formie reguł decyzyjnych. Powstaj one na bazie materiałów empirycznych i umoliwiaj stosunkowo łatwe przetwarzanie informacji. Poszczególne etapy postpowania w trakcie analizy danych przy pomo-cy zbiorów przyblionych to:

1. zebranie materiału empirycznego (pierwotna tabela informacyjna), 2. dyskretyzacja danych,

3. zbudowanie wtórnej tabeli informacyjnej, 4. redukcja iloci atrybutów,

5. budowa bazy reguł decyzyjnych,

6. przeprowadzenie oceny jakoci i dokładnoci reguł, 7. wycignicie wniosków.

Poniej przedstawiona została przykładowa indukcja reguł wnioskowania na podstawie zre-dukowanej tabeli informacyjnej (Tabela 1).

Tabela 1. Wtórna, zredukowana tabela informacyjna rednia wysoko

zarobków (q2)

Prowizje (q4)

Decyzja: czy si za-trudni?

Przykład 1 mała tak tak

Przykład 2 rednia nie nie

Przykład 3 b. mała tak nie

Przykład 4 dua tak tak

Przykład 5 b. mała nie nie

ródło: opracowanie własne Przykładowe reguły:

R1: Jeeli (rednia wysoko zarobków = b. mała) i (prowizje = tak) to (zatrudni si? = nie) R2: Jeeli (rednia wysoko zarobków = dua) i (prowizje = tak) to (zatrudni si? = tak) R3: Jeeli (rednia wysoko zarobków = mała) i (prowizje = tak) to (zatrudni si? = tak)

W przeprowadzonych badaniach teoria zbiorów przyblionych została zastosowana do zbu-dowania bazy reguł, na podstawie której mona stwierdzi, które z potencjalnych czynników i w jakim stopniu maj wpływ na produkcj sprzedan przemysłu w Polsce.

(7)

6. Podsumowanie

Opisane w artykule metody sztucznej inteligencji zostały uyte do identyfikacji czynników wpływajcych na produkcj sprzedan przemysłu w Polsce. Zbudowanych zostało kilka modeli w oparciu o radialne sieci neuronowe, modele neuronowe połczone z algorytmem genetycznym, oraz model oparty na teorii zbiorów przyblionych.

Najlepszymi modelami okazały si modele łczce w sobie radialne sieci neuronowe z algo-rytmem genetycznym. Błdy poszczególnych modeli oraz numery zmiennych majcych istotny wpływ na badan zmienn przedstawia ponisza tabela.

Tabela 2. Wyniki bada

Sie RBF + Algorytm genetyczny ilo neuronów w warstwie ukrytej n=3 n=5 n=8 ilo wej 11 11 10 błd modelu 0,0619 0,0608 0,0601 wejcia 1, 2, 5, 7, 13, 15, 1, 4, 5, 7, 12, 13, 1, 4, 5, 7, 9, 12, 17, 18, 19, 20, 21 14, 15, 18, 19, 20 14, 15, 18, 20 ródło: opracowanie własne

Niestety wad wikszoci z tych metod jest czasochłonno. Na wygenerowanie modelu przy zastosowaniu jedynie sieci radialnych, komputer o parametrach P4, 1,8 GHz, 512 MB RAM po-trzebował około dwóch tygodni. Jednak połczenie sieci radialnych z algorytmem genetycznym pozwoliło skróci czas oczekiwania na wyniki do około 10 minut (tabela 3).

Tabela 3. Wyniki bada – cd.

Sie RBF Sie RBF + Algorytm genetyczny ilo neuronów w

warstwie ukrytej n=3 n=3

czas pracy komp. 2 tygodnie 10 minut

błd modelu 0,0619 0,0608 ilo wej 11 11 1, 2, 5, 7, 13, 15, 1, 4, 5, 7, 12, 13, wejcia 17, 18, 19, 20, 21 14, 15, 18, 19, 20 wspólnych 6 wej 1, 5, 13, 15, 18, 20

ródło: opracowanie własne

Zalet tych metod jest za to wiksza dokładno otrzymanych modeli. Błd redniokwadrato-wy wikszoci zbudowanych modeli nie przekraczał 6,5%, co w przypadku modeli opisujcych bardzo złoon rzeczywisto ekonomiczn mona uzna za niewielki.

(8)

1. Arabas J., 2001. Wykłady z algorytmów ewolucyjnych. WNT Warszawa.

2. Goldberg D. E., 1995. Algorytmy genetyczne i ich zastosowania. WNT Warszawa. 3. Jajuga K., 1993. Statystyczna analiza wielowymiarowa. Wydawnictwo Naukowe PWN

Warszawa.

4. Korol J., Szczuciski P., 2005. Modele równa strukturalnych i sieci neuronowe w mode-lowaniu procesów rozwoju zrównowaonego. Gawe Akademickie Wydawnictwo Ekono-miczne.

5. Nowak E., 1984. Problemy doboru zmiennych do modelu ekonometrycznego. PWN War-szawa.

6. Ososwski S., 2000. Sieci neuronowe do przetwarzania informacji. Oficyna wydawnicza Politechniki Warszawskiej Warszawa.

7. Piegat A. 1999., Modelowanie i sterowanie rozmyte. Akademicka Oficyna Wyd. Exit War-szawa.

8. Tadeusiewicz R., 1993. Sieci neuronowe. Akademicka Oficyna Wydawnicza RM Warsza-wa.

9. Welfe A., 1996. Ekonometria stosowana. Pastwowe Wydawnictwo Ekonomiczne War-szawa.

APLICATION OF ARTIFICIAL INTELLIGENCE FOR IDENTIFICATION OF ECO-NOMICAL FACTORS

Summary

The article presents the problem of the identification of factors, that have the in-fluence on the particular economic phenomenon, by the application of non-standard methods – methods of Artificial Intelligence.

Keywords: Radial Networks, Genetic Algorithms, Theory of Rough Sets, Identification of Eco-nomic Factors

ANDRZEJ PIEGAT

e-mail: Andrzej.Piegat@wi.ps.pl BARBARA W SIKOWSKA Uniwersytet Szczeciski

Instytut Informatyki w Zarzdzaniu 71-101 Szczecin, ul. Mickiewicza 64

Cytaty

Powiązane dokumenty

Jeśli przyjrzymy się metodom sztucznej inteligencji, czy szerzej – informatyki – to okaże się, że każdy z tych składników inteligencji jest lepiej czy gorzej opanowany.. Nie

• 4.MLP 4-6-3 pomyliła się czterokrotnie, z czego raz zamiast wybrać klasę Setosa, zakwalifikowano dane do klasy Versical, sieć 2 razy

Samoorganizacja w sieci neuronowej (np. SOM) umożliwiają uczenie sieci bez nauczyciela (unsupervised), którego celem jest wykształcenie w sieci neuronów, które by reagowały na

Wynikiem działania systemu optymalizacji jest nowa konstrukcja koła kolejowego wygenerowana automatycznie przez moduł sztucznej inteligencji na podstawie wyników ocen

W 2017 roku Komisja Etyki powołana przez Ministerstwo Transportu i Infra- struktury Cyfrowej Republiki Federalnej Niemiec (ang. Ethics Commission appo- inted by the

Warunkiem koniecznym uzyskania oceny pozytywnej za laboratoria jest oddanie (zaprezentowanie) uruchamiającego się projektu z dokumentacją, który spełnia swoje zadanie (lepiej

aspiracji  rozwi¡zanie zabronione (tj. b¦d¡ce na li±cie tabu) jest akcepto- wane, je±li warto±¢ funkcji aspiracji osi¡ga dla danego rozwi¡zania

dzano poprzez wykorzystanie zarezerwowanych do tego celu specjalnych rejestrów. Przenośnego komputera używano jedynie do rejestra- cji wartości poprawek odczytywanych przez