• Nie Znaleziono Wyników

Metoda suboptymalnego sterowania zdecentralizowanego w systemach robotyki

N/A
N/A
Protected

Academic year: 2022

Share "Metoda suboptymalnego sterowania zdecentralizowanego w systemach robotyki"

Copied!
10
0
0

Pełen tekst

(1)

Seria: MECHANIKA z. 85

Nr k o l. 1010

XI o g ó l n o p o l s k a : k o n f e r e n c j a t e o r i i m a s z y n

i m e c h a n iz m ó w

Uth POLISH CONFERENCE ON THE THEORY OF MACHINES AND MECHANISMS

27—30. 04. 1987 ZAKOPANE

Maciej KRAWCZAK

Instytut Badań Systemowych Polska Akademia Nauk

METODA SUBOPTYMALNEGO STEROWANIA ZDECENTRALIZOWANEGO W SYSTEMACH ROBOTYKI

St r es zczenie. Nieliniowy model robota-manipulatora może być trakto­

wa ny jako zbiór połączonych podsystemów. Każdy z podsystemów odpowia­

da jednemu stopniowi swob o dy .•Zakłada sie, że model każdego podsyste­

mu jest liniowym równaniem różniczkowym, a połączenia miedzy podsy­

stemami realizowane są przez nieliniowe funkcje stanu. Zatem każdy podsystem może być traktowany jako liniowy system z nieliniowym zabu­

rzeniem regularnym. Do znalezienia sterowań suboptymalnych wykorzys­

tano teorie zaburzeń. Zmienną sprzężoną do stanu każdego podsystemu rozwinięto w zbieżny szereg funkcyjny. W konsekwencji otrzymano zbiór różniczkowych równań Riccatiego oraz ciąg rekurencyjnych guasi-linio- wych równań różniczkowych cząstkowych. Jeżeli człony sprzęgające pod­

systemy są wielomianami,to rozwiązania równań quasi-liniowych też są wielomianami ze względu na stan. W pracy podano szereg twierdzeń.

1• Wprowadzenie

W pracy rozważa sie zagadnienie sterowania robotem-raanipulatorem trakto­

wanym jako duży: system' mechaniczny. Podobnie jak w pracy [lo], synteza sterowania składa sie z dwóch etapów. W pierwszym etapie wyznaczane jest sterowanie optymalne, programowe dające trajektorie programową przy założe­

niu, że nie oddziałują żadne zakłócenia na system. W drugim etapie poszu­

kuje Się sterowań realizujących śledzenie trajektorii programowej, przy za­

łożeniu, że albo model systemu nie jest idealny,albo na system działają za­

kłócenia. Tak więc w drugim etapie rozpatruje się model odchyleniowy sys- temu.

Model odchyleniowy dynamiki układu mechanicznego o N stopniach swobody jest reprezentowany przez układ nieliniowych równań różniczkowych. Zakłada się, że każdy ze stopni swobody może być opisany liniowym równaniem różnicz­

(2)

kowym, w którym występuje człon nieliniowy (traktowany jako regularne zabu­

rzenie) . Każdy stopień swobody stanowi zatem podsystem, a występujące czło­

ny nieliniowe sprzęgają dany podsystem z pozostałymi.

Ta specyfika modelu systemu mechanicznego została wykorzystana w niniej­

szej pracy, w której przedstawiono metodę regularnego zaburzenia.

Zagadnienie dwóch liniowych podsystemów sprzężonych ze sobą liniowo zo­

stało rozpatrzone w pracy [53- Suboptymalne sterowania dla tego problemu zostały otrzymane poprzez aproksymację odpowiednich równań Riccatiego.'

W przypadku układów nieliniowych znalezienie sterowań optymalnych jest albo bardzo trudne,albo wręcz niemożliwe, dlatego większość wysi łk ów po­

święcono na znalezienie sterowań suboptymalnych. Część metod,np. [/1, 3]j aproksymuje rozwiązanie równania Hamiltona-Jacobiego-Bellmana, druga część, np. [[6, 8, 9], oparta jest na aproksymacji wektora sprzężonego do wektora stanu.

W tej pracy rozwija się w szereg funkcyjny zmienne sprzężone do wektora stanu każdego podsystemu. Przyjęto, że wskaźniki jakości każdego podsystemu są kwadratowymi funkcjonałami ze względu na stan i sterowanie podsystemu.

Zastosowanie teorii zaburzeń pozwoliło otrzymać zbiór N różniczkowych równań Riccatiego oraz rekurencyjny ciąg quasi-liniowych równań cząstko­

wych. Następnie założono, że nieliniowe człony zaburzające są wielomianami ze względu na stan podsystemów. Udowodniono, że w takim przypadku rozwiąza­

nia quasi-liniowych równań cząstkowych też są wielomianami ze względu na stan podsystemów. U d o w o d n i o n o !również twierdzenie o aproksymacji wskaźników jakości, a także twierdzenie o rzędzie aproksymacji wskaźników jakości.

2. Sformułowanie zagadnienia

Załóżmy, że każdy stopień swobody manipulatora opisany jest następującym m o d e le m odchyleniowym:

x ± = + B iu i + £ f i (k,t), i = 1,...,N, (11

g d z i e :

X i ( t ) = z ^ t ) - z°(t) , zi (t) - stan aktualny, z°(t) - stan programowy, u i (x,t) - sterowanie,

A ± , B i są m acierzowymi funkcjami ciągłymi, f i realizuje sprzężenia mie­

dzy podsystemami,zaś £ jest parametrem skalarnym.

(3)

Następnie zakłada się minimalizację wskaźnika jakości!

N

J = 2 Ji' 12)

i=1 gdzie:

T

Ji = \ x* Qlf5£ (T) + \ J (xiQixi + uiRiui>dŁ (3) 0

gdzie Qiff Qi i spełniają warunki regulatora liniowo-kwadratowegc[ 4^.

Łatwo zauważyć, że 5 > 0, ponieważ podsystemy są połączone ze sobą.

Warunki konieczne optymalności prowadzą do [6]s

xi = Aixi + Biui + £ f '

xi (0) » x°

(4)

N 3f

P± - -QlXi - A'iPi - £ ^ & ‘Pj' pi (T) = Qifxi<T > <5>

j = 1

a dla rozpatrywanego przypadku bez uwzględniania ograniczeń na sterowania i stan^ sterowania mają postać:1

u^ = -R^BjP^ dla i=1,2,...,N. (6)

Podstawiając (6) do (4)-(5) otrzymujemy następujący zbiór regularnie zabu­

rzonych zagadnień dwubrzegowych:

*i = - B

j

R ^ B ^ + xi (0) = x°> 17)

” 0f, ,

P i = Qi x i

-

A'.P i

-

6

2 Pj* Pi<T > - Qifxi (T)

,8)

j=1

3. Aproksymacja sterowań

W pracy [[6] pokazano, że zmienna sprzężona p^ może być rozwinięta w szereg funkcyjny:

kr,<k> łvltl . (?)

Pi (x,t;e) = 2 fi Pi " (x't)

k=0

(4)

Różniczkując (9) wyraz p o wyrazie otrzymujemy;

« * 4-r®pik) • 0pik)i

pi = 2 e ~ 2 [ tdxj xj + o t ]•

( 1 0 )

k=0 j=1

Podstawiając (7) i (9) do (10) otrzymujemy;

ao N a„<k > „ ra,Jk>

»i ■ 2 < ¡ " { 2 * « j - sj 2 * - f t - }

k=0 j=1 3 k=0

(1 1)

gdzie

S i = B iR I lBi-

Po podstawieniu (9) i (11) do (8), a następnie porównując wyrazy stojące przy tej samej potądze parametru £ otrzymujemy:

dla k = 0 macierzowe równanie Riccatiego

P i = “ P iA i " A iP i ' Q i + P iS iP i' p i (T> = Q i f ! (12)

dla k = 1,2,...

~ w ~ + 2 1 3 7 - (Aj - sjp j)xj + (Ai - A ip i>' p ik) - h lkl (13)

j=1 3

p|k) (X,T) = 0 V x

g d z i e :

h (k> ^

1

0f, ,

- p f ' 1 ) f i - 2 < s ^ > ' p j k' 1)xj dla k j=i

N O f f l n ( k _ 1 ) N k _ 1 O r , ( 1 >

- 2 p f - ' 1 * - V ^ ] • 2 2 - f e

L j=1 1 3 j=1 1=1 3

(14)

s jp j (k-1)

dla k = 2,3,...

Tak wiec pokazaliśmy, że nieliniowe zagadnienie dwubrzegowe (7)-(8) może być rozwiązane poprzez rozwiązanie macierzowego równania różniczkowego RiC"

catiego (12) oraz ciągu guasi-liniowych cząstkowych równać różniczkowych.

(5)

Zakładając, że człon sprzęgający f ., ' i = 1, 2 ,— ,N, jest wielomianem wzglądem x, łatwo jest zauważyć, że

(1)

jest także wielomianem w zglą­

dem x.

Udowodnimy teraz nastąpujące twierdzenie:

Twierdzenie 1

(Vr) Jeżeli f i (x,t) jest wielomianem wzglądem x, to rozwiązanie p^ rów­

nania (13) dla k = 1,2,... jest także wielomianem wzglądem x.

Dowód

Wprowadzając oznaczenie, dla k = 1,2,...,

możemy zapisać (13) następująco;

(15)

lub:

(16)

Równanie (16) możemy także zapisać w postaci skalarnej;

(17)

(6)

odzie:

4

J'*1 1 ,i

x * f

N

2

j=i

n ® 4 n

2 r r 2 V ?

H ł-1 flyoc y = i

2 y=i

r<*

(18)

przy czym a , p = 1,2, e lementem wektora z'*

4(1

Współczynniki ai, i = 1,2,...,W, p = 1,2,...,n zależą od t i

y1/

i i i

a współczynniki b., cc = 1,2,...,n zależą od t, y oraz z J , j=1,2,...,K.

Współczynniki a^ są takie same dla każdego (3 . Równania takie nazywane i są równaniami z identyczną częścią zasadniczą (£2]]) . Stosownie do £żj cał­

k owanie równań (17) jest równoważne całkowaniu następujących równań charak­

terystycznych :

dt (19)

W postaci macierzowej równania charakterystyk mają postać ;

y1 =

h

V

ż1 = v1 - H' V - 7

h

V * H ' P z ñ

j - i ®y J

( 2 0 )

Równanie (20) jest równaniem liniowym, a biorąc pod uwagę fakt, że v jest wielomianem wz ględem y więc rozwiązanie równania (13) także może być

zapisane w formie wielomianu względem y. □

W ten sposób problem rozwiązania równania guasi-liniowego (13) został sprowadzony do znalezienia współczynników odpowiedniego wielomianu (£7]).

4. Własności rozwiązania suboptymalnego

Ze względów praktycznych tylko kilka pierwszych wyrazów ciągu (13) może byó wyznaczonych. Rozważmy sterowania suboptymalne, czyli: ,

" i = -RI \ [ piK + 2 í M k> } 1 = 1(2.... N ' (21)

k=1

gdzie oznacza rząd aproksymacji i-tego podsystemu.

(7)

Przytoczymy teraz trzy twierdzenia (bez dowodów) charakteryzujące włas­

ności sterowari suboptymalnych.

Twierdzenie 2

/ V \

Jeżeli PA jest rozwiązaniem równania (12), a p £ , k = 1,2,..., 1 ■ 1,2,...,N, jest rozwiązaniem równania (13), to wskaźnik jakości J^

(3) i-tego podsystemu ma następującą formę :

Ji = J xi (t)Pi (t)xi (t) +

2 e k j { k ) [ x <t > ' fcJ

k=1

(2 2)

gdzie t e [0,

t

], a j|k* jest rozwiązaniem równania:

0J (k) N O

j

(k)

“ E t - ł 2 xj (Aj - sjpj>' TZ1 = q (k)

j = 1

JxjL " ‘i (23)

przy czym

“x iP if i k = 1

N Qjlk-1) k-1 N k-1 N

V ""'i 1 V '"v’ -'dlr. (k-1) . V f n i l k - I L W 14 - 2 , f j - 0 7 — ‘ ? 2 Z pi Ejpj + 2 Z pj jO^T

j=1 3 1=1 j=i 1=1 j=1

(

1

)

dla k = 2,3,... (24) W następnym twierdzeniu rozważa sie rząd aproksymacji wskaźników jakości.

Twierdzenie 3 Jeżeli:

i

Pi = PiXi + 2 e kplkl ' i - 1,2,...;« (25)

k=1

jest wyznaczone optymalnie aż do rzędu w^, tę wskaźnik jakości J^ jest optymalny aż do rzędu 2wi.

Dowód

Niech p^ jest rozwiązaniem równania (13) aż do rzędu w^, to strategie

U1 też są wyznaczone optymalnie aż do rzędu w^. Podstawiając u^ do (3)

(8)

można zaobserwować, że ze względu na występowanie kwadratowych form w (3) wskaźnik jakości J i może być zapisany w formie :

J i (5i> = + £ 2wi +1A i (26)

gdzie u* oznacza strategie optymalne (w^ = o ° ) , l a oznacza resztę

szeregu potęgowego. □

Następne twierdzenie mówi o asymptotycznej własności sterować subopty- malnych.

Twierdzenie 4

Sterowanie suboptymalne iii ma następującą własność

2w, +1

J i (" i ) = + ° ( £ >• (27)

Dowody przytoczonych twierdzeć są podobne do dowodów odpowiednich twier- dzeć zamieszczonych w pracy [6^.

5. Uwagi koćcowe

W p r a c y przedstawiono aproksymację optymalnych sterować nieliniowego systemu podzielonego na podsystemy. Założono, że podsystemy te są liniowe, zaś człony sprzęgające są nieliniowe. Warunki konieczne optymalności dają układ nieliniowych zagadnieć dwubrzegowych, których rozwiązania mogą być rozwinięte w szeregi potęgowe. W rezultacie otrzymano zbiór różniczkowych równać Riccatiego oraz ciąg ąuasi-liniowych różniczkowych równać cząstko­

wych.

Własności rozwiązać suboptymalnych przedstawiono jako tezy przedstawio­

nych twierdzeć.

LITERATURA

[ l] BALDWIN J.F., SIMS WILLIAMS J.H.: The use of a method of perturbations in the synthesis of closed-loop optimal control laws for nonlinear sys­

tems. Automatica, Vol. 5, 1969.

[23 COURANT R., HILBERT D.: M e t h o d s of m a t h e m a t i c a l p h y s i c s . Interscience P u b l i s h e r s , N-V, 1962.

[3] GAP.RARD K.L., M c C L A M R O C K N.H., CLARK L . G . : A n approach to suboptimal

feedback

control of nonlinear systems. Int. J. Control, vol. 5, 1967.

KALMAN R.E.: Contributions to the theory of optimal control. Boletin ¿e la Sociedad, vol. 5, 1960.

[53 K0K0T0VIC P.V.: Feedback design of large linear systems, w J.B. Cruz (ed.): Feedback systems, McGraw-Hill, N-X, 1972.

(9)

[6] KRAWCZAK M . : Suboptimal strategies for Nash nonlinear differential games, [w:l K. Malanowski i K. Mizukami (eds.): Analysis and algorithms of optimization problems, Springer, 1986.

[7] KRAWCZAK M . : Nash game with regular polynomial perturbation. Procee­

dings 12th IFIP Conference, Budapest 1985. Springer, 1986.

[8] KRAWCZAK M . : Nonlinear £-couplina of large-scale linear systems. 4th IFAC/IFORS Symposium LSS.TA, Zurich 1986.

[9] NISHIKAWA Y., SANNOMIYA N., ITAKORA H.: Suboptimal design of a nonli­

near feedback system. Automatica, vol, 7, 1971.

[10] VUKOBRATOVIC M.,-STOKIC D.: Contribution to suboptimal control of m a ­ nipulation robots. IEEE Trans. Aut. Control, vol. AC-28, 1983.

KETDA CyEOniHMAJIhHOrO AEUEHTPAJIH3HP0BAH0r0 yiTPABJIEHHfl B CHCTEUAi POEOTHKH

P e 3 a m e

He.TOHeKHyB uoxejn, poCoTa-MaHHiryjniTopa u o j k h o paccuarpzBaxB k b k coBoicyn-

b o c x b coeAHHeHHhDc noACzcxeu. Kaxnaa noAczcxesia cooiBetcxByex oflHofi cxenezz

o b o S o j h , IIpeAnojiaraeu, n o KaJtsaa noAOHCiena oozcaza AHHefiHiat AZ$$epeiiLUiaAB

hum ypaBHeHueu • Cbabh MesAy noAczcTewaMz ocymecxBAKioxcH nocpeACTBOM HeAHBefl

h r x ^yHKUHii c o c i o z h h z . C Ae Aosaxea b h o, AoSy» noACHCxeuy m o s s h o paccMaxpzBaib

K a t . A H H e H H y io b npzcyxcxBzz HeAZHetaoft peryAapHoii nepxypSazBz. H x o S h HaHxz

cyfioniHMaABHoe ynpaBAeHHe HcnoAB30BaHa xeopzs. uaAoro napasjexpa. £ a a kas- Sofi noACHCieuH BtrczcAeHO pa3AozeHHe b $yHKmioHaAbHuii p«A nepeueaHoit conpa- seiffloii k c o c t o m h b . B peayABxaxe noAyzeza czcxeua ypaBHezzii PzKicaTero h fOCAeAOBaxeABHOCTB peKypeHIHKDC KBa3H-AKHeliHUX ypaBHeHHiS B aaCIHUX np0H3B0A-

h s o c , PemeHzz, axzx KBa3H-AHHeftHioc ypaszeHzfi a b a z b x c a MHorozAezazz, ecAz

xoAito conparamAze Z Ae zH noAczcxeM xose uzorozAezH. B pafioxe A0Ka3az psA leopez.

A METHOD OF SUBOPTIMAL DECENTRALIZED CONTROL IN ROBOTIC SYSTEMS

S u m m a r y

A nonlinear model of a robot-manipulator can be considered as a set of interconnected subsystems. Each subsystem is associated with one degree of freedom. It is assumed that the model of each subsystem is a linear diffe—•

rential equation while interconnections are nonlinear function of the sys- te» state.

(10)

Each subsystem is understood as a-linear system wi th nonlinear regular perturbation. The theory of perturbation has been applied to find subopti- mal control. The costate of each subsystem has been expanded in a conver­

gent power series. The approach allows us to obtain a set of Riccati diffe­

rential equations and series of coupled quasi-linear partial differential equations. It has been shown that the solution of these partial differential equations has a form of a polynomial provided that the perturbation terms are polynomials in the state. Several theorem have been included.

Recenzent: Doc. dr hab. ini. W i to ld Pedrycz

Wplynelo do redakcji 7.X I . 1986 r.

Cytaty

Powiązane dokumenty

There are many different factors that influence relations in a supply chain: an approach to cooperation, a communication method, risk management or a win‑win strategy that have

Czytając obce utwory, ucząc się w szkole zasad poezyi, Mickiewicz próbował już w Nowogródku sił swoich w tworzeniu wierszy; to kreślił bajki, to opi­ sywał

Wtedy obszerne zamiary jego były zniszczone: Wschód cały juz mu zamykał wstęp dalszy; powrót do Franoyi był mu przecięty; po świetnych nawet zwycięz- twach

I dodając do elementów dowolnego wiersza odpowiedne elementy innego wiersza pomnożone przez dowolną stała ¸, doprowadzamy do macierzy, której każda z pierwszych n kolumn składa

Przy przekształceniach elementarnych tej macierzy nie zmienia się zbiór rozwiązań układu równań Ax

Chcąc zaoszczędzić czas układy równań zapisujemy jako macierze, czyli prostokątne tabliczki liczb, które są odpowiednimi. współczynnikami w

Delta Diraca może służyć do modelowania prądu, który pojawia się w obwodzie.. elektrycznym jako

Przekształcenie polega na tym, że równania, których współczynniki „nie mieszczą” się w minorze zostają skreślone, zaś zmienne, których współczynniki