Metoda suboptymalnego sterowania zdecentralizowanego w systemach robotyki

(1)

Seria: MECHANIKA z. 85

Nr k o l. 1010

XI o g ó l n o p o l s k a : k o n f e r e n c j a t e o r i i m a s z y n

i m e c h a n iz m ó w

Uth POLISH CONFERENCE ON THE THEORY OF MACHINES AND MECHANISMS

27—30. 04. 1987 ZAKOPANE

Maciej KRAWCZAK

Instytut Badań Systemowych Polska Akademia Nauk

METODA SUBOPTYMALNEGO STEROWANIA ZDECENTRALIZOWANEGO W SYSTEMACH ROBOTYKI

St r es zczenie. Nieliniowy model robota-manipulatora może być trakto

wa ny jako zbiór połączonych podsystemów. Każdy z podsystemów odpowia

da jednemu stopniowi swob o dy .•Zakłada sie, że model każdego podsyste

mu jest liniowym równaniem różniczkowym, a połączenia miedzy podsy

stemami realizowane są przez nieliniowe funkcje stanu. Zatem każdy podsystem może być traktowany jako liniowy system z nieliniowym zabu

rzeniem regularnym. Do znalezienia sterowań suboptymalnych wykorzys

tano teorie zaburzeń. Zmienną sprzężoną do stanu każdego podsystemu rozwinięto w zbieżny szereg funkcyjny. W konsekwencji otrzymano zbiór różniczkowych równań Riccatiego oraz ciąg rekurencyjnych guasi-liniowych równań różniczkowych cząstkowych. Jeżeli człony sprzęgające pod

systemy są wielomianami,to rozwiązania równań quasi-liniowych też są wielomianami ze względu na stan. W pracy podano szereg twierdzeń.

1• Wprowadzenie

W pracy rozważa sie zagadnienie sterowania robotem-raanipulatorem trakto

wanym jako duży: system' mechaniczny. Podobnie jak w pracy [lo], synteza sterowania składa sie z dwóch etapów. W pierwszym etapie wyznaczane jest sterowanie optymalne, programowe dające trajektorie programową przy założe

niu, że nie oddziałują żadne zakłócenia na system. W drugim etapie poszu

kuje Się sterowań realizujących śledzenie trajektorii programowej, przy za

łożeniu, że albo model systemu nie jest idealny,albo na system działają za

kłócenia. Tak więc w drugim etapie rozpatruje się model odchyleniowy systemu.

Model odchyleniowy dynamiki układu mechanicznego o N stopniach swobody jest reprezentowany przez układ nieliniowych równań różniczkowych. Zakłada się, że każdy ze stopni swobody może być opisany liniowym równaniem różnicz

(2)

kowym, w którym występuje człon nieliniowy (traktowany jako regularne zabu

rzenie) . Każdy stopień swobody stanowi zatem podsystem, a występujące czło

ny nieliniowe sprzęgają dany podsystem z pozostałymi.

Ta specyfika modelu systemu mechanicznego została wykorzystana w niniej

szej pracy, w której przedstawiono metodę regularnego zaburzenia.

Zagadnienie dwóch liniowych podsystemów sprzężonych ze sobą liniowo zo

stało rozpatrzone w pracy [53- Suboptymalne sterowania dla tego problemu zostały otrzymane poprzez aproksymację odpowiednich równań Riccatiego.'

W przypadku układów nieliniowych znalezienie sterowań optymalnych jest albo bardzo trudne,albo wręcz niemożliwe, dlatego większość wysi łk ów po

święcono na znalezienie sterowań suboptymalnych. Część metod,np. [/1, 3]j aproksymuje rozwiązanie równania Hamiltona-Jacobiego-Bellmana, druga część, np. [[6, 8, 9], oparta jest na aproksymacji wektora sprzężonego do wektora stanu.

W tej pracy rozwija się w szereg funkcyjny zmienne sprzężone do wektora stanu każdego podsystemu. Przyjęto, że wskaźniki jakości każdego podsystemu są kwadratowymi funkcjonałami ze względu na stan i sterowanie podsystemu.

Zastosowanie teorii zaburzeń pozwoliło otrzymać zbiór N różniczkowych równań Riccatiego oraz rekurencyjny ciąg quasi-liniowych równań cząstko

wych. Następnie założono, że nieliniowe człony zaburzające są wielomianami ze względu na stan podsystemów. Udowodniono, że w takim przypadku rozwiąza

nia quasi-liniowych równań cząstkowych też są wielomianami ze względu na stan podsystemów. U d o w o d n i o n o !również twierdzenie o aproksymacji wskaźników jakości, a także twierdzenie o rzędzie aproksymacji wskaźników jakości.

2. Sformułowanie zagadnienia

Załóżmy, że każdy stopień swobody manipulatora opisany jest następującym m o d e le m odchyleniowym:

x ± = + B iu i + £ f i (k,t), i = 1,...,N, (11

g d z i e :

X i ( t ) = z ^ t ) - z°(t) , zi (t) - stan aktualny, z°(t) - stan programowy, u i (x,t) - sterowanie,

A ± , B i są m acierzowymi funkcjami ciągłymi, f i realizuje sprzężenia mie

dzy podsystemami,zaś £ jest parametrem skalarnym.

(3)

Następnie zakłada się minimalizację wskaźnika jakości!

N

J = 2 Ji' 12)

i=1 gdzie:

T

Ji = \ x* Qlf5£ (T) + \ J (xiQixi + uiRiui>dŁ (3) 0

gdzie Qiff Qi i spełniają warunki regulatora liniowo-kwadratowegc[ 4^.

Łatwo zauważyć, że 5 > 0, ponieważ podsystemy są połączone ze sobą.

Warunki konieczne optymalności prowadzą do [6]s

xi = Aixi + Biui + £ f '

xi (0) » x°

(4)

N 3f

P± - -QlXi - A'iPi - £ ^ & ‘Pj' pi (T) = Qifxi<T > <5>

j = 1

a dla rozpatrywanego przypadku bez uwzględniania ograniczeń na sterowania i stan^ sterowania mają postać:1

u^ = -R^BjP^ dla i=1,2,...,N. (6)

Podstawiając (6) do (4)-(5) otrzymujemy następujący zbiór regularnie zabu

rzonych zagadnień dwubrzegowych:

*i = - B

j

R ^ B ^ + xi (0) = x°> 17)

” 0f, ,

P i = Qi x i

-

A'.P i

-

6

2 Pj* Pi<T > - Qifxi (T)

•

,8)

j=1

3. Aproksymacja sterowań

W pracy [[6] pokazano, że zmienna sprzężona p^ może być rozwinięta w szereg funkcyjny:

kr,<k> łvltl . (?)

Pi (x,t;e) = 2 fi Pi " (x't)

k=0

(4)

Różniczkując (9) wyraz p o wyrazie otrzymujemy;

« * 4-r®pik) • 0pik)i

pi = 2 e ~ 2 [ tdxj xj + o t ]•

^{( 1 0 )}

k=0 j=1

Podstawiając (7) i (9) do (10) otrzymujemy;

ao N a„<k > „ ra,Jk>

»i ■ 2 < ¡ " { 2 * « j - sj 2 * - f t - }

k=0 j=1 3 k=0

(1 1)

gdzie

S i = B iR I lBi-

Po podstawieniu (9) i (11) do (8), a następnie porównując wyrazy stojące przy tej samej potądze parametru £ otrzymujemy:

dla k = 0 macierzowe równanie Riccatiego

P i = “ P iA i " A iP i ' Q i + P iS iP i' p i (T> = Q i f ! (12)

dla k = 1,2,...

~ w ~ + 2 1 3 7 - (Aj - sjp j)xj + (Ai - A ip i>' p ik) - h lkl (13)

j=1 3

p|k) (X,T) = 0 V x

g d z i e :

h (k> ^

1

0f, ,

- p f ' 1 ) f i - 2 < s ^ > ' p j k' 1)xj dla k j=i

N O f f l n ( k _ 1 ) N k _ 1 O r , ( 1 >

- 2 **p f - ' 1 * - V ^ ] • 2 2 - f e**

L j=1 1 3 j=1 1=1 3

(14)

s jp j (k-1)

dla k = 2,3,...

Tak wiec pokazaliśmy, że nieliniowe zagadnienie dwubrzegowe (7)-(8) może być rozwiązane poprzez rozwiązanie macierzowego równania różniczkowego RiC"

catiego (12) oraz ciągu guasi-liniowych cząstkowych równać różniczkowych.

(5)

Zakładając, że człon sprzęgający f ., ' i = 1, 2 ,— ,N, jest wielomianem wzglądem x, łatwo jest zauważyć, że

(1)

jest także wielomianem w zglą

dem x.

Udowodnimy teraz nastąpujące twierdzenie:

Twierdzenie 1

(Vr) Jeżeli f i (x,t) jest wielomianem wzglądem x, to rozwiązanie p^ rów

nania (13) dla k = 1,2,... jest także wielomianem wzglądem x.

Dowód

Wprowadzając oznaczenie, dla k = 1,2,...,

możemy zapisać (13) następująco;

(15)

lub:

(16)

Równanie (16) możemy także zapisać w postaci skalarnej;

(17)

(6)

odzie:

4

J'*1 1 ,i

x * f

N

2

j=i

n ® 4 n

2 r r 2 V ?

H ł-1 flyoc y = i

2 ’ y=i

r<*

⁽¹⁸⁾

przy czym a , p = 1,2, e lementem wektora z'*

4(1

Współczynniki ai, i = 1,2,...,W, p = 1,2,...,n zależą od t i

y1/

i i i

a współczynniki b., cc = 1,2,...,n zależą od t, y oraz z J , j=1,2,...,K.

Współczynniki a^ są takie same dla każdego (3 . Równania takie nazywane i są równaniami z identyczną częścią zasadniczą (£2]]) . Stosownie do £żj cał

k owanie równań (17) jest równoważne całkowaniu następujących równań charak

terystycznych :

dt (19)

W postaci macierzowej równania charakterystyk mają postać ;

y1 =

h

V

ż1 = v1 - H' V - 7

h

V * H ' P z ñ

j - i ®y J

( 2 0 )

Równanie (20) jest równaniem liniowym, a biorąc pod uwagę fakt, że v jest wielomianem wz ględem y więc rozwiązanie równania (13) także może być

zapisane w formie wielomianu względem y. □

W ten sposób problem rozwiązania równania guasi-liniowego (13) został sprowadzony do znalezienia współczynników odpowiedniego wielomianu (£7]).

4. Własności rozwiązania suboptymalnego

Ze względów praktycznych tylko kilka pierwszych wyrazów ciągu (13) może byó wyznaczonych. Rozważmy sterowania suboptymalne, czyli: ,

" i = -RI \ [ piK + 2 í M k> } 1 = 1(2.... N ' (21)

k=1

gdzie oznacza rząd aproksymacji i-tego podsystemu.

(7)

Przytoczymy teraz trzy twierdzenia (bez dowodów) charakteryzujące włas

ności sterowari suboptymalnych.

Twierdzenie 2

/ V \

Jeżeli PA jest rozwiązaniem równania (12), a p £ , k = 1,2,..., 1 ■ 1,2,...,N, jest rozwiązaniem równania (13), to wskaźnik jakości J^

(3) i-tego podsystemu ma następującą formę :

Ji = J xi (t)Pi (t)xi (t) +

2 e k j { k ) [ x <t > ' fcJ

k=1

(2 2⁾

gdzie t e [0,

t

], a j|k* jest rozwiązaniem równania:

0J (k) N O

j

(k)

“ E t - ł 2 xj (Aj - sjpj>' TZ1 = q (k)

j = 1

JxjL " ‘i (23)

przy czym

“x iP if i k = 1

N Qjlk-1) k-1 N k-1 N

V ""'i 1 V '"v’ -'dlr. (k-1) . V f n i l k - I L W 14 - 2 , f j - 0 7 — ‘ ? 2 Z pi Ejpj + 2 Z pj jO^T

j=1 3 1=1 j=i 1=1 j=1

(

1

)

dla k = 2,3,... (24) W następnym twierdzeniu rozważa sie rząd aproksymacji wskaźników jakości.

Twierdzenie 3 Jeżeli:

i

Pi = PiXi + 2 e kplkl ' i - 1,2,...;« (25)

k=1

jest wyznaczone optymalnie aż do rzędu w^, tę wskaźnik jakości J^ jest optymalny aż do rzędu 2wi.

Dowód

Niech p^ jest rozwiązaniem równania (13) aż do rzędu w^, to strategie

U1 też są wyznaczone optymalnie aż do rzędu w^. Podstawiając u^ do (3)

(8)

można zaobserwować, że ze względu na występowanie kwadratowych form w (3) wskaźnik jakości J i może być zapisany w formie :

J i (5i> = + £ 2wi +1A i (26)

gdzie u* oznacza strategie optymalne (w^ = o ° ) , l a oznacza resztę

szeregu potęgowego. □

Następne twierdzenie mówi o asymptotycznej własności sterować suboptymalnych.

Twierdzenie 4

Sterowanie suboptymalne iii ma następującą własność

2w, +1

J i (" i ) = + ° ( £ >• (27)

Dowody przytoczonych twierdzeć są podobne do dowodów odpowiednich twier- dzeć zamieszczonych w pracy [6^.

5. Uwagi koćcowe

W p r a c y przedstawiono aproksymację optymalnych sterować nieliniowego systemu podzielonego na podsystemy. Założono, że podsystemy te są liniowe, zaś człony sprzęgające są nieliniowe. Warunki konieczne optymalności dają układ nieliniowych zagadnieć dwubrzegowych, których rozwiązania mogą być rozwinięte w szeregi potęgowe. W rezultacie otrzymano zbiór różniczkowych równać Riccatiego oraz ciąg ąuasi-liniowych różniczkowych równać cząstko

wych.

Własności rozwiązać suboptymalnych przedstawiono jako tezy przedstawio

nych twierdzeć.

LITERATURA

[ l] BALDWIN J.F., SIMS WILLIAMS J.H.: The use of a method of perturbations in the synthesis of closed-loop optimal control laws for nonlinear sys

tems. Automatica, Vol. 5, 1969.

[23 COURANT R., HILBERT D.: M e t h o d s of m a t h e m a t i c a l p h y s i c s . Interscience P u b l i s h e r s , N-V, 1962.

[3] GAP.RARD K.L., M c C L A M R O C K N.H., CLARK L . G . : A n approach to suboptimal

feedback

control of nonlinear systems. Int. J. Control, vol. 5, 1967.

KALMAN R.E.: Contributions to the theory of optimal control. Boletin ¿e la Sociedad, vol. 5, 1960.

[53 K0K0T0VIC P.V.: Feedback design of large linear systems, w J.B. Cruz (ed.): Feedback systems, McGraw-Hill, N-X, 1972.

(9)

[6] KRAWCZAK M . : Suboptimal strategies for Nash nonlinear differential games, [w:l K. Malanowski i K. Mizukami (eds.): Analysis and algorithms of optimization problems, Springer, 1986.

[7] KRAWCZAK M . : Nash game with regular polynomial perturbation. Procee

dings 12th IFIP Conference, Budapest 1985. Springer, 1986.

[8] KRAWCZAK M . : Nonlinear £-couplina of large-scale linear systems. 4th IFAC/IFORS Symposium LSS.TA, Zurich 1986.

[9] NISHIKAWA Y., SANNOMIYA N., ITAKORA H.: Suboptimal design of a nonli

near feedback system. Automatica, vol, 7, 1971.

[10] VUKOBRATOVIC M.,-STOKIC D.: Contribution to suboptimal control of m a nipulation robots. IEEE Trans. Aut. Control, vol. AC-28, 1983.

KETDA CyEOniHMAJIhHOrO AEUEHTPAJIH3HP0BAH0r0 yiTPABJIEHHfl B CHCTEUAi POEOTHKH

P e 3 a m e

He.TOHeKHyB uoxejn, poCoTa-MaHHiryjniTopa u o j k h o paccuarpzBaxB k b k coBoicyn-

b o c x b coeAHHeHHhDc noACzcxeu. Kaxnaa noAczcxesia cooiBetcxByex oflHofi cxenezz

o b o S o j h , IIpeAnojiaraeu, n o KaJtsaa noAOHCiena oozcaza AHHefiHiat AZ$$epeiiLUiaAB

hum ypaBHeHueu • Cbabh MesAy noAczcTewaMz ocymecxBAKioxcH nocpeACTBOM HeAHBefl

h r x ^yHKUHii c o c i o z h h z . C Ae Aosaxea b h o, AoSy» noACHCxeuy m o s s h o paccMaxpzBaib

K a t . A H H e H H y io b npzcyxcxBzz HeAZHetaoft peryAapHoii nepxypSazBz. H x o S h HaHxz

cyfioniHMaABHoe ynpaBAeHHe HcnoAB30BaHa xeopzs. uaAoro napasjexpa. £ a a kas- Sofi noACHCieuH BtrczcAeHO pa3AozeHHe b $yHKmioHaAbHuii p«A nepeueaHoit conpa- seiffloii k c o c t o m h b . B peayABxaxe noAyzeza czcxeua ypaBHezzii PzKicaTero h fOCAeAOBaxeABHOCTB peKypeHIHKDC KBa3H-AKHeliHUX ypaBHeHHiS B aaCIHUX np0H3B0A-

h s o c , PemeHzz, axzx KBa3H-AHHeftHioc ypaszeHzfi a b a z b x c a MHorozAezazz, ecAz

xoAito conparamAze Z Ae zH noAczcxeM xose uzorozAezH. B pafioxe A0Ka3az psA leopez.

A METHOD OF SUBOPTIMAL DECENTRALIZED CONTROL IN ROBOTIC SYSTEMS

S u m m a r y

A nonlinear model of a robot-manipulator can be considered as a set of interconnected subsystems. Each subsystem is associated with one degree of freedom. It is assumed that the model of each subsystem is a linear diffe—•

rential equation while interconnections are nonlinear function of the sys- te» state.

(10)

Each subsystem is understood as a-linear system wi th nonlinear regular perturbation. The theory of perturbation has been applied to find suboptimal control. The costate of each subsystem has been expanded in a conver

gent power series. The approach allows us to obtain a set of Riccati diffe

rential equations and series of coupled quasi-linear partial differential equations. It has been shown that the solution of these partial differential equations has a form of a polynomial provided that the perturbation terms are polynomials in the state. Several theorem have been included.

Recenzent: Doc. dr hab. ini. W i to ld Pedrycz

Wplynelo do redakcji 7.X I . 1986 r.

Metoda suboptymalnego sterowania zdecentralizowanego w systemach robotyki

Nr k o l. 1010

i m e c h a n iz m ó w

Uth POLISH CONFERENCE ON THE THEORY OF MACHINES AND MECHANISMS

27—30. 04. 1987 ZAKOPANE

Następnie zakłada się minimalizację wskaźnika jakości!

N

J = 2 Ji' 12)

i=1 gdzie:

T

Ji = \ x* Qlf5£ (T) + \ J (xiQixi + uiRiui>dŁ (3) 0

gdzie Qiff Qi i spełniają warunki regulatora liniowo-kwadratowegc[ 4^.

Łatwo zauważyć, że 5 > 0, ponieważ podsystemy są połączone ze sobą.

Warunki konieczne optymalności prowadzą do [6]s

xi = Aixi + Biui + £ f '

(4)

N 3f

P± - -QlXi - A'iPi - £ ^ & ‘Pj' pi (T) = Qifxi<T > <5>

j = 1

a dla rozpatrywanego przypadku bez uwzględniania ograniczeń na sterowania i stan^ sterowania mają postać:1

u^ = -R^BjP^ dla i=1,2,...,N. (6)

Podstawiając (6) do (4)-(5) otrzymujemy następujący zbiór regularnie zabu­

rzonych zagadnień dwubrzegowych:

*i = - B

R ^ B ^ + xi (0) = x°> 17)

” 0f, ,

-

-

2 Pj* Pi<T > - Qifxi (T)

,8)

j=1

3. Aproksymacja sterowań

W pracy [[6] pokazano, że zmienna sprzężona p^ może być rozwinięta w szereg funkcyjny:

kr,<k> łvltl . (?)

Pi (x,t;e) = 2 fi Pi " (x't)

k=0

« * 4-r®pik) • 0pik)i

pi = 2 e ~ 2 [ tdxj xj + o t ]•

ao N a„<k > „ ra,Jk>

»i ■ 2 < ¡ " { 2 * « j - sj 2 * - f t - }

j=1 3

1

- p f ' 1 ) f i - 2 < s ^ > ' p j k' 1)xj dla k j=i

- 2 p f - ' 1 * - V ^ ] • 2 2 - f e

(1)

(17)

J'*1 1 ,i

N

j=i

n ® 4 n

2 r r 2 V ?

2 ’ y=i

r<*

4(1

y1/

y1 =

V

ż1 = v1 - H' V - 7

V * H ' P z ñ

j - i ®y J

" i = -RI \ [ piK + 2 í M k> } 1 = 1(2.... N ' (21)

Przytoczymy teraz trzy twierdzenia (bez dowodów) charakteryzujące włas­

ności sterowari suboptymalnych.

/ V \

Jeżeli PA jest rozwiązaniem równania (12), a p £ , k = 1,2,..., 1 ■ 1,2,...,N, jest rozwiązaniem równania (13), to wskaźnik jakości J^

(3) i-tego podsystemu ma następującą formę :

Ji = J xi (t)Pi (t)xi (t) +

k=1

gdzie t e [0,

], a j|k* jest rozwiązaniem równania:

0J (k) N O

(k)

“ E t - ł 2 xj (Aj - sjpj>' TZ1 = q (k)

JxjL " ‘i (23)

N Qjlk-1) k-1 N k-1 N

V ""'i 1 V '"v’ -'dlr. (k-1) . V f n i l k - I L W 14 - 2 , f j - 0 7 — ‘ ? 2 Z pi Ejpj + 2 Z pj jO^T

j=1 3 1=1 j=i 1=1 j=1

1

dla k = 2,3,... (24) W następnym twierdzeniu rozważa sie rząd aproksymacji wskaźników jakości.

Twierdzenie 3 Jeżeli:

Podstawiając (6) do (4)-(5) otrzymujemy następujący zbiór regularnie zabu

- 2 **p f - ' 1 * - V ^ ] • 2 2 - f e**

Przytoczymy teraz trzy twierdzenia (bez dowodów) charakteryzujące włas