• Nie Znaleziono Wyników

Wybrane zagadnienia modelowania procesów rzeczywistych za pomocą równań różnicowych

N/A
N/A
Protected

Academic year: 2021

Share "Wybrane zagadnienia modelowania procesów rzeczywistych za pomocą równań różnicowych"

Copied!
9
0
0

Pełen tekst

(1)Zeszyty Naukowe nr. 838. 2010. Uniwersytetu Ekonomicznego w Krakowie. Wit Urban Katedra Informatyki. Wybrane zagadnienia modelowania procesów rzeczywistych za pomocą równań różnicowych Streszczenie. Artykuł stanowi prezentację rezultatów badań nad wykorzystaniem równań różnicowych w modelowaniu procesów rzeczywistych. Szczególną uwagę zwrócono na wielomianową postać takich równań. Opracowanie zawiera rozważania dotyczące możliwości estymacji ich parametrów na podstawie danych pochodzących z szeregów czasowych. Przedstawiono także możliwości wykorzystania wielomianów różnicowych w prognozowaniu wielkości opisujących zjawiska świata rzeczywistego. Słowa kluczowe: system dynamiczny, równanie różnicowe, wielomian.. 1. Wprowadzenie Jednym z istotnych zagadnień badawczych związanych z funkcjonowaniem systemów rzeczywistych jest analiza szeregów czasowych tworzonych na podstawie dostarczanych przez te systemy obserwacji empirycznych. Wykorzystuje się do tego wiele różnych metod. Celem niniejszego opracowania jest prezentacja rezultatów badań nad zastosowaniem w takim kontekście równań różnicowych ze szczególnym uwzględnieniem ich postaci wielomianowej. Wykorzystanie tego typu modeli jest uznawane w literaturze za jedną z podstawowych form opisu układów dynamicznych. Kwestiom związanym ze zdefiniowaniem przedmiotu analizy poświęcono w kolejnej części artykułu rozważania odwołujące się do zagadnień teoretycznych wynikających z ogólnej teorii systemów. Ostatnia część opracowania prezentuje wyniki badań nad modelowaniem procesów dynamicznych za pomocą wielomianów różnicowych..

(2) 202. Wit Urban. 2. Wybrane pojęcia ogólnej teorii systemów Modelowanie wybranych fragmentów świata rzeczywistego stanowi jedno z istotnych narzędzi poznania naukowego. Procedura związana z wykorzystaniem takiego podejścia wymaga jednak zdefiniowania podstawowych pojęć odnoszących się zarówno do przedmiotu badań, jak i metody jego opisu. W pierwszym z wymienionych aspektów pomocna jest ogólna teoria systemów. Prezentując aparat pojęciowy wypracowany w ramach tej teorii, należy przede wszystkim zwrócić uwagę na jej główny paradygmat określający sposób postrzegania rzeczywistości oraz podejście do związanych z nią problemów badawczych. Opiera się on na zasadzie całościowego ujmowania badanej rzeczywistości i wynika ze stwierdzenia, że złożoność jest nieodłączną cechą natury, nie zaś rezultatem wielu procesów zachodzących na bardziej elementarnym poziomie. Sens przedstawionego paradygmatu wyraża zasada Nernsta: „całość to coś więcej niż suma części”. Celem stosowania takiego podejścia w poznaniu naukowym jest wykrywanie homologii wyrażających strukturalnie identyczne prawa szerokiej klasy zjawisk i procesów. Służyć temu ma przyjęte w prezentowanej teorii podstawowe pojęcie systemu. Jest ono w różny sposób definiowane w literaturze. Na potrzeby tego opracowania wybrano określenie zawarte w pracy [Belinger 2002]. Definicja 1. System to byt, którego istnienie przejawia się przez synergiczne współdziałanie jego elementów. Jako podstawę wyboru definicji przyjęto zbieżność przedstawionego sposobu rozumienia pojęcia systemu z jego określeniem intuicyjnym. W tym sensie pojęcie to utożsamia się z dowolnym przedmiotem lub obiektem, na który nie nakłada się żadnych ograniczeń z wyjątkiem jednej zasady: dla danego systemu tworzące go elementy są niepodzielnymi jednościami. Niepodzielność ta ma oczywiście charakter względny. Wadą przedstawionego podejścia jest jednak traktowanie rozważanego pojęcia jako narzędzia poznawczego opisującego pewien byt idealny. W takim kontekście przedstawiona definicja nie odpowiada na zapotrzebowanie teorii modelowania, zgodnie z którą system kojarzony jest z przedmiotem analizy. Dlatego też dla celów tej teorii bardziej przydatne jest określenie systemu rzeczywistego odwołujące się do badanego fragmentu rzeczywistości. Definicja 2 [Blanchard 1990]. System rzeczywisty to źródło danych obserwowalnych. System może być naturalny lub sztuczny. Należy przy tym uwzględnić sytuację, w której zawiera elementy zarówno naturalne, jak i sztuczne. Z naukowego punktu widzenia interesujące są przede wszystkim systemy zmienne w czasie. Stwierdzenie to prowadzi do definicji abstrakcyjnego systemu czasowego..

(3) Wybrane zagadnienia modelowania procesów…. 203. Definicja 3 [Luenberger 1979]. Przez abstrakcyjny system czasowy należy rozumieć relację S ⊂ AT · BT, gdzie A i B to zbiory abstrakcyjne, a T – liniowo uporządkowany zbiór zwany zbiorem czasowym. Przez specyfikację zbioru stanów systemu dla abstrakcyjnego systemu czasowego można określić abstrakcyjny system dynamiczny. Przyjęcie podstawy czasu ma istotne znaczenie ze względu na możliwość opisu systemu. Z przytoczonej definicji systemu rzeczywistego wynika bowiem, że taki opis przede wszystkim powinien uwzględniać informacje dotyczące wielkości obserwowalnych związanych z funkcjonowaniem systemu. Podstawa czasu umożliwia w takim kontekście przypisanie ich do określonych momentów czasu. Punkt wyjścia dla związanych z tym rozważań stanowi określenie przedziału obserwacyjnego. Definiuje się taki przedział dla każdej pary t 0, t 1 ∈ T. t 0 ≤ t1. jako  t0, t1  ∈ {(t0, t1), [t0, t1), (t0, t1], [t0, t1]}, gdzie ogólnie przyjęto (t0, t1) = {t ∈ T: t0 < t < t1}; [t0, t1) = (t0, t1) ∪ {t0}; (t0, t1] = (t0, t1) ∪ {t1}; [t0, t1] = [t0, t1) ∪ (t0, t1]. Z przedstawionej definicji przedziału obserwacyjnego wynika niejednoznaczność jego określenia. Często jednak nie jest istotne, do której z opisanych możliwości odnosi się zapis t0, t1  . Wielkość t0 określa się mianem czasu początkowego lub rozpoczęcia, natomiast t1 czasem końcowym lub zakończenia. Znaczenie pojęcia przedziału obserwacyjnego polega na tym, że w ten sposób definiuje się dziedzinę przekształcenia nazywanego segmentem lub trajektorią. Odwzorowuje ono wskazany przedział w zbiór wartości sygnałów wejściowych, stanów lub sygnałów wyjściowych. ω: t0, t1 → Z Znaczenie trajektorii ω polega na tym, że opisuje ona dynamikę w zbiorze Z dla przedziału czasu t0, t1. Ponieważ zbiór Z może być zbiorem skończonym,.

(4) 204. Wit Urban. przeliczalnym (dyskretnym) lub nieprzeliczalnym (ciągłym) oraz podstawa czasu T może być także zbiorem przeliczalnym lub nieprzeliczalnym, można wyróżnić sześć kategorii systemów, którym odpowiadają definiowane we właściwy dla nich sposób trajektorie lub inaczej segmenty. Ich zestawienie zawiera tabela 1. Tabela 1. Zestawienie metod modelowania trajektorii systemu dynamicznego Podstawa czasu T Dyskretna. Zakres zbioru Z skończony automat skończony. dyskretny. ciągły. komputery nieskończone. systemy opisane za pomocą równań różniczkowych. systemy opisane jako maszyny sekwencyjne Ciągła. systemy asynchronicz- modele kolejkowania ne skończone. systemy opisane za pomocą równań różniczkowych. systemy opisane za pomocą dyskretnych zdarzeń Źródło: [Zeigler 1984].. Przedstawione zestawienie ilustruje wnioski z rozważań dotyczących aparatu pojęciowego związanego z modelowaniem wybranych fragmentów rzeczywistości i wskazuje na możliwości ich opisu. Wynika z nich, że w przypadku znaczącej części systemów rzeczywistych znajdują zastosowanie modele stworzone z wykorzystaniem równań różniczkowych lub z uwzględnieniem upraszczającego zabiegu dyskretyzacji różnicowej. Tym ostatnim została poświęcona kolejna część artykułu. 3. Wykorzystanie postaci wielomianowej równań różnicowych do modelowania procesów rzeczywistych Oczywiście odnosząc się do równań różnicowych lub różniczkowych jako metody opisu trajektorii systemów dynamicznych, należy mieć na względzie różne postacie takich zależności. Zakres badawczy niniejszego artykułu został jednak ograniczony do postaci wielomianowych równań różnicowych zgodnej z następującym wzorem: xt +1 = as xts + as −1 xts −1 + … + a1 xt + a0. s = 1, 2, …. (1).

(5) 205. Wybrane zagadnienia modelowania procesów…. Problem związany z praktycznym wykorzystaniem tego typu zależności wiąże się z estymacją parametrów a 0, a1, …, as – 1, as. s = 1, 2, …,. (2). na podstawie znanych wartości szeregu czasowego x1, x2, …, xN.. (3). Oprócz innych rozwiązań tego problemu można zaproponować standardową procedurę iteracyjną. Składa się ona z następujących kroków: a) dobór wartości startowych dla estymowanych parametrów oraz zakładanego docelowego poziomu dokładności dopasowania wielomianu różnicowego do danych statystycznych, b) wybór kolejnych parametrów równania różnicowego, c) modyfikacja wybranego parametru w zadany sposób, aż do chwili gdy funkcja kryterium przestanie uzasadniać dalsze jego zmiany, d) zatrzymanie procedury w momencie uzyskania żądanej dokładności dopasowania modelu lub w sytuacji, gdy dalsze jej stosowanie nie polepsza mierzącej go charakterystyki. Tego typu procedurę zastosowano do estymacji parametrów wielomianu różnicowego danego następującym wzorem: xt +1 = a4 xt4 + a3 xt3 + a2 xt2 + a1 xt + a0. (4). dopasowywanego do zbioru danych Y ={yt ∈ R: t = 0, 1, 2, 3, 4, 5} = {2,8678; 2,887; 2,8951; 2,9194; 2,9788; 2,9943}. (5) Uwzględniono przy tym dodatkowe założenia wynikające z konieczności uzupełnienia procedury o dobór metody modyfikacji wartości parametrów w kolejnych krokach oraz postać funkcji kryterium dopasowania modelu teoretycznego do danych empirycznych. W tym celu zostały przyjęte następujące rozwiązania. 1. Jako funkcję kryterium dopasowania modelu zastosowano odchylenie standardowe wielkości teoretycznych wygenerowanych za jego pomocą do wartości należących do zbioru Y. n. o = 1 ∑ (xt − yt )2 n t=0. (6). 2. Modyfikacja parametrów w kolejnych iteracjach procedury była realizowana według następujących zasad przy przyjęciu dodatkowych oznaczeń: a ∈ {a4, a3, a2, a1, a 0} – kolejny parametr równania różnicowego danego wzorem (4),.

(6) 206. Wit Urban. d – wielkość modyfikująca wybrany parametr, d 0, dg – odpowiednio wartość startowa i graniczna zmiennej d, i = 1, 2, 3, … – kolejna iteracja realizowanej procedury estymacyjnej, d = d 0 – ustawienie wielkości d na początku każdej modyfikacji wybranego parametru na poziomie startowym, ai = ai – 1 ± d ⇔ oi < oi – 1 – modyfikacja wybranego parametru w i-tym przebiegu procedury, oi ≥ oi – 1 ∧ d > dg ⇒ d = d / 10 – zmiana wielkości d modyfikującej wybrany parametr, gdy jej dotychczasowa wartość nie powoduje zmniejszania odchylenia standardowego danych teoretycznych w stosunku do empirycznych oraz gdy spełniony jest warunek polegający na tym, że nie osiągnęła ona jeszcze poziomu granicznego. Wielomian opisany wzorem (4) był estymowany dla dwóch poziomów granicznych wielkości d oraz. dg1 = 0,0000001. (7). dg1 = 0,000000001.. (8). W rezultacie otrzymano dwie postacie wspomnianego równania różnicowego scharakteryzowane dodatkowo odpowiadającymi im wartościami odchylenia standardowego wygenerowanych za ich pomocą danych w stosunku do wielkości należących do zbioru Y. xt + 1 = –0,215477x 4t + 0,439945x 3t + 2,972751x 2t + –6,055543xt o = 0,017241032 xt + 1 = –0,627505x 4t + 2,050158x 3t + 4,135626x 2t + –12,918719xt o = 0,012836. (9). (10). Ilustrację porównawczą dopasowania przedstawionych modeli do obserwacji empirycznych stanowi wykres na rys. 1. Zmiana wielkości granicznej dg wskazuje na związany z nią trend poprawiający jakość dopasowania wykresu wielomianu różnicowego o postaci danej wzorem (4) do danych ze zbioru Y. Każda tego typu zmiana wiąże się jednak z czasochłonnymi obliczeniami w przypadku procedury iteracyjnej. Do modelowania szeregu czasowego zestawionego z wartości zbioru Y wykorzystano również podejście statystyczne. W tym celu skorzystano także z wielomianu. (11) xt = b4t4 + b3t3 + b2t2 + b1t + b 0.

(7) 207. Wybrane zagadnienia modelowania procesów…. 3,02 3,00 2,98 2,96 2,94 2,92 2,90 2,88 2,86 0. 1. 2. 3. Emp.. 4. 5. (9). 6. (10). Rys. 1. Porównanie wartości teoretycznych wygenerowanych z użyciem modeli danych wzorami (9) i (10) z obserwacjami empirycznymi Źródło: opracowanie własne.. 3,02 3,00 2,98 2,96 2,94 2,92 2,90 2,88 2,86 0. 1. 2 Emp.. 3. 4 (9). 5 (12). 6. 7. (10). Rys. 2. Porównanie wartości teoretycznych wygenerowanych z użyciem modeli danych wzorami (9), (10) oraz (12) z obserwacjami empirycznymi Źródło: opracowanie własne..

(8) 208. Wit Urban. Po estymacji parametrów otrzymano następującą postać modelu: xt = –0,0022145t4 + 0,0300106t3 – 0,1339784t2 + 0,2464105t + 2,7272166. (12) Model ten charakteryzuje znacznie większy stopień dopasowania do danych empirycznych w stosunku do równań różnicowych (9) oraz (10). Potwierdzeniem tego może być też odchylenie standardowe na poziomie 0,002516369. Zestawienie wykresów dla wartości empirycznych oraz tych pochodzących z wymienionych w artykule modeli zostało przedstawione na rys. 2. Jak to już zostało wspomniane, w odniesieniu do równań różnicowych istnieje możliwość dalszego zwiększenia dopasowania modelu do obserwacji rzeczywistych. Wiąże się to jednak ze znacznie większymi problemami obliczeniowymi. Zbudowane modele zostały także wykorzystane do wyznaczenia prognozy kolejnej obserwacji, której rzeczywista wartość wyniosła 3,0045. Zestawienie obejmujące te prognozy oraz moduł błędu zawiera tabela 2. Tabela 2. Zestawienie prognoz dla siódmej obserwacji szeregu czasowego (5) otrzymanych z wykorzystaniem modeli (9), (10) oraz (12) Wyszczególnienie. Model (9). Model (10). Model (12). Wartość prognozowana. 3,020957. 2,993436. 2,863583. Moduł błędu. 0,016457319. 0,011064. 0,140916667. Źródło: opracowanie własne.. Zawarte w niej dane wyraźnie wskazują, że w prezentowanym przykładzie modele oparte na wielomianach różnicowych dają bardziej trafne prognozy nawet przy gorszym dopasowaniu do obserwacji empirycznych. Uzyskane wyniki pozwalają więc na stwierdzenie przydatności takiej formy modelowania szeregów czasowych, co jest zarazem potwierdzeniem zawartej w tabeli 1 tezy dotyczącej form opisu matematycznego znacznej części układów dynamicznych. Oczywiście nie oznacza to braku przydatności innych metod. Należy jednak zwrócić uwagę, że mimo trudności natury obliczeniowej wynikającej z zastosowania wielomianów różnicowych tego typu modele mogą w praktycznym zastosowaniu stanowić realną pomoc w prognozowaniu przebiegu zjawisk rzeczywistych. Literatura Blanchard B.S., Fabrycky W.J. [1990], Systems Engineering and Analysis, Prentice Hall, New York. Luenberger D.G. [1979], Introduction to Dynamic Systems, Theory, Models, Application, J. Wiley, New York. Zeigler B.P. [1984], Teoria modelowania i symulacji, PWN, Warszawa..

(9) Wybrane zagadnienia modelowania procesów…. 209. Selected Issues of Real Processes Modelling with Application of Discrete Differential Equations The paper presents research results concerning the utilisation of discrete differential equations in real processes modelling. Special attention has been given to a polynomial form of such equations. Some considerations relating to a possibility of their parameters estimation on the basis of data derived from time series have been submitted. The article also discusses possibilities created by discrete differential polynomials in the area of prediction of values that describe real world phenomena. Key words: dynamic system, discrete differential equation, polynomial..

(10)

Cytaty

Powiązane dokumenty

2) Jeśli (eps&lt;1) and (eps&gt;0) to przejdź do kroku 3, w przeciwnym wypadku przejdź do kroku 1 3) Ustaw początkową sumę szeregu: suma=1, numer wyrazu i=2; wartość

Wstępny do- bór centrów odbywa się najczęściej losowo przy wykorzystaniu rozkładu rów- nomiernego w procesie doboru odpowiednich wektorów ze zbioru danych uczą- cych.. W

Rozwiązywanie równań różniczkowych za pomocą transformacji Laplace’a..

[r]

 integralność na poziomie relacji oznacza poprawność definiowania relacji oraz pełną synchronizację połączonych danych. W literaturze spotyka

Napisz obok rysunku równanie przedstawiające sytuację na wadze i rozwiąż je. Zdejmowane przedmioty z wagi

Chłopcem przez szóstą część życia pozostać mu Bóg pozwolił, lica pokwitły mu zaś, kiedy dwunasta znów część życia mu minęła, a znów gdy przebył część siódmą,

Nazwa metody wprowadzona zostaªa przez analogi¦ do podobnej metody w dziedzinie rozwi¡zywania równa« ró»niczkowych [4].. Dla ilustracji tej metody znaleziona zostanie SORN