ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: AUTOMATYKA z.108
1993 Nr kol.1150
Konrad WOJCIECHOWSKI
SYNTEZA NIEAKTYWNEGO PRAWA STEROWANIA W WARUNKACH NIEPEWNOŚCI OGRANICZONEJ NA PODSTAWIE MODELU BEZPOŚREDNIEGO
METODA ZBIOR0W INFORMACYJNYCH TYPU S
Streszczenie. W pracy przedstawiono rozwiązanie problemu syntezy nieaktywnych praw sterowania w warunkach niepewności ograniczonej na podstawie modelu sterowanego obiektu danego w postaci bezpośred
niej. W modelu niepewności ograniczonej, dany w odpowiednio wymiaro- przestrzeni rzeczywistej, ograniczony i całkowalny w sensie Lebesgue’a zbiór T określa łącznie możliwe wartości warunku początkowego oraz ciągów zakłóceń w równaniu stanu i równaniu pomiaru. Do rozwiązania sformułowanego problemu zastosowano oryginalną metodę swobodnych zbiorów informacyjnych typu S, których definicje i własności przedstawiono w Dodatku. W pracy pokazano, źe dla modelu liniowego względem sterowań, praw sterowania tworzących z nim zawierającą się strukturę informacyjną oraz wskaźnika jakości będącego agregatą drugich momentów obrazu zbioru T, optymalne prauo sterowania może być wyznaczone niezależnie dla każdej chwili rozpatrywanego horyzontu sterowania oraz jest liniową funkcją środka ciężkości warunkowego zbioru informacyjnego.
NONACTIVE CONTROL STRATEGY DESING IN THE PRESENCE OF BOUNDED UNCERTAINTY FOR THE DIRECT MODEL VIA INFORMATION SETS OF THE TYPE S
Summary. In the paper a problem of nonactive control strategy de
sing in the presence of bounded uncertainties is presented for the plant described by the direct model. It has been proved that for a linear with respect to control model, control strategies creating with the model a nested information structure and the performance index being an aggregate od second moments of the imagé of the set T an optimal control strategy can be found independently in the each moment of the considered control horizon. Moreover it is a linear function of the conditional information set.
292 K. Wojciechowski
C H H T E 3 H E A K T H B H O rO 3 A K 0 H A y n P A B J lE H H S B Y C riO B H SX OFPA H H H EH H O H H EO nPEH EJ1EH H O CTH HA OCH OBE H E n O C P E flC T B E H H O H
MOflEHH METOflOM HHSOPMAliHOHHblX MH OXECTB TH FIA S
P e3J3Me
B p a B o r e n o K a o t i B a e T C a , h t o n n s n H H e f tH o ń o t h o c h T © rxbh o y n p a B n e H H i i i i o n e n n . n n s sa K O H O B y n p a B n e H H S c o h h h s ü o ih h x c H e ń B C T p o e H H y » HHc}>opM aunoHHyx> c T p y K T y p y h n n a n o K a s a r e n a K a n e c T B a , K O T o p b iń H B n a e T c a a r p e r a p H e ń m o m b h t o s 3 —o ń C T e n e H K o ó p a a a M H o a e c T B a TT, o n T H M a n t hw(I 3î k o h y n p a B r r e H H S M o s c e r Sbrrb o n p e p e n e H H e a a s h c h n o « n a n n ô o r o « o i t e H T a B p e n e H H p a c c M O T p H B a e n o r o r o p H S O H T a y n p a s n e H H a a a B n a e r c a H H H e ń H o ń i^ y u K U H e ń u e H T p a T s a e c T H y c n o B H o r o H H < j> o p iia u H O H H o ro M H o a e c T B a .
1. Wprowadzenie
Model niepewności ograniczonej jest intuicyjnie najbardziej naturalny.
W przypadku skalarnym oznacza on, źe możliwe realizacje zmiennej niepewnej należą do danego zbioru którego struktura może być dowolna.
Pierwsze próby wykorzystania modelu niepewności ograniczonej można znaleźć w pracach [33, [71, [15,16] dotyczących teorii sterowania. Stosuje się w nich określenia "unknown but bounded errors", "bounded noise", "set of possible states". U pracach [1 ], [21 również z zakresu teorii strowanla wprowadzono nazwę "set-membership description of uncertainty". Model niepe
wności ograniczonej wykorzystywany był również w pracach [19-251.
W modelu niepewności ograniczonej przyjętym w pracy dany w odpowiednio wymiarowej przestrzeni rzeczywistej, ograniczony i całkowalny w sensie Lebesgue’a zbiór T określa łącznie możliwe wartości zmiennych niepewnych.
Wzajemnie jednoznaczne odwzorowanie zbioru T jest zbiorem informacyjnym.
W sformułowaniach problemu syntezy praw sterowania wykorzystywany jest najczęściej model sterowanego obiektu zapisany w konwencji zmiennych stanu a poszukiwane prawa sterowania są funkcjami informacji pomiarowej. W
Synteza nieaktywnego prawa. 293
odróżnieniu od powyższego model wykorzystywany w pracy jest modelem bezpośrednim tj. wyraża jawną zależność pomiarów od zmiennych niepewnych i sterowań zaś argumentami poszukiwanych funkcji są pomiary z “odliczonym“
wpływem sterowań. Dla celów pracy nazywa się je nieaktywnymi prawami stero
wania. Przyjęta w pracy postać modelu i praw sterowania pozwoliły łącznie na pokazanie, że dynamiczny problem syntezy praw sterowania w warunkach niepewności ograniczonej w przypadku modelu liniowego względem sterowań, klasycznej struktury informacyjnej i skończonego horyzontu sterowania spro
wadza się do skończonej liczby wzajemnie niezależnych skalarnych problemów statycznych.
W punkcie 2 zamieszczono wybrane zagadnienia pomocnicze, dotyczące renumeracji wielowymiarowego argumentu dyskretnego i funkcji wektorowych oraz wprowadzono pojęcie tzw. nieaktywnego prawa sterowania.
W punkcie 3 podano sformułowanie rozpatrywanego w pracy ogólnego problemu syntezy prawa sterowania.
Twierdzenia 1 1 2 zamieszczone wraz z dowodami w punkcie 4 określają postać optymalnego nieaktywnego prawa sterowania oraz odpowiadający mu optymalny wskaźnik jakości.
Swobodne zbiory informacyjne S keD oraz związane z nimi odwzorowania informacyjne przedstawione są w Dodatku A. Podaje się w nim definicje 1 podstawowe własności swobodnych zbiorów informacyjnych typu S. Jedną z nich jest słuszna w przypadku modelu liniowego inwariantność miary Lebesgue’a wymienionych zbiorów względem parametrów.modelu.
2. Zagadnienia pomocnicze
Niech 0={1,2,...} będzie zbiorem liczb naturalnych zaś !H=3x... xS iloczynem kartezjańskim M egzemplarzy zbioru D.
Skończenie elementowe zbiory f^cD \ IH^cB , t^cO , nazywamy odpowiednio horyzontami zmiennych niepewnych, sterowań i pomiarów. Ich
294 K. Wojciechowski
elementami są ciągi: i =(i .... i ), i = ( i . ...i ), i3= ( i ^ ...iM ).
i 2 3
W pracy wyróżniamy dodatkowo podzbiory DtcE-lt> D > E^clH oraz rodziną zbiorów D oznaczoną przez H .
Z Z
Na zbiorach IH , ¡H , ¡H określone są funkcje (ciągi) rozpatrywane w t u z
pracy. Podstawowymi są:
Zmienne niepewne t: H -> Rq
t Sterowanie u: H -> Rm
U
Pomiary z: ¡H -> Rp
Z
Zauważmy, źe ogólnie- funkcja (ciąg) f:WeRn określona, na skończenie elementowym zbiorze IHcł może być przedstawiona w postaci wektora blokowe
go, w którym n-wymiarowe składowe blokowe odpowiadają wartościom funkcji (ciągu) dla kolejnych (według ustalonego porządku) argumentów wybieranych ze zbioru H.
Odpowiednio do powyższej uwagi w pracy stosuje się zapisy
f wektor blokowy, którego elementami są wartości funkcji f dla argumentów ze zbioru IDcH, przy ustalonym porządku w zbiorze 0, f wektor blokowy, którego elementami są wartości funkcji f dla
i z
argumentów ze zbioru gdzie z założenia D , D dH, oraz D cD^. Porządek w zbiorze DjM)^ jest ustalony.
W szczególnym przypadku, gdy M=l, stosuje się równoważne zapisy:
fk =(f;...
fku=(f' ,...f') ,k>l.
1 + 1 k
Wielowymiarowy argument dyskretny w powiązaniu z wektorową postacią funkcji (ciągów) t, u, z opisuje przejrzyście realne problemy sterowania oraz podejmowania decyzji. Przykładowo w dwupoziomowym problemie decyzyjnym wygodnie jest “numerować" poszczególne decyzje parami liczb, z których
Synteza nieaktywnego prawa 295
pierwsza' oznacza numer poziomu decyzyjnego, druga zaś dyskretną chwilą czasu. Decyzja przyporządkowana określonej powyżej parze liczb może być wektorem m-wymiarowym.
W rozważaniach teoretycznych, a szczególnie w zap i sach operowanie wielowymiarowym argumentem dyskretnym w powiązaniu z wektorową strukturą funkcji nie jest wygodne. Z tego wzglądu wprowadzamy procedurą renumeracji dotyczącą zarówno wielowymiarowego argumentu, jak i funkcji wektorowych.
Ilustruje ją nastąpujący przykład:
Problem oryginalny Horyzont
I H = { ( 1 , 1 ) , C1 , 2 ) >.
Funkcja określona na zbiorze IH ma postać:
f: (H-> R2
f f
1,(1 ,1) 1 ,(1,2)
f f
2,(1,1) 2,(1,2) Problem po renumeracji
Horyzont
M = { 1 , 2 , 3 , 4 }
Funkcja określona na zbiorze IH^ ma postać:
f : H -> R
r e r c
F T f* = f
re.l ~ 1,(1,1> r c , 2 l,(ł,2>
^re, 3 ~ *2, (1,1) ^re,4 2, (1,2)
Ogólnie niech f:IR*Rn bądzie daną funkcją określoną na skończenie elementowym zbiorze HcłM, zaś u:{l n}xDF»B bądzie danym odwzorowaniem, renumeracji.
Oznaczmy
w({l... n}xlH)={l,... >N ^=IHre .i>(i, jn))=k g {1.... N}.
Funkcja f : ¡H -> R otrzymana w wyniku renumeracji okres jest:
296 K. Wojciechowski
f = f
1 n
gdzie: ke{l N>, i«={l,. .. ,n}, (J j leiH.
1 n
W dalszej części pracy nie będziemy rozróżniać horyzontów i funkcji pierwotnych od tych, które zostały otrzymane w wyniku renumeracji.
Dyskretny liniowy i stacjonarny model dynamiczny zapisany w przestrzeni stanu ma postać:
x = Ax + Bu + w , x
k * i k k k l
z = Cx + v
k k k
gdzie:
kelH = {!,... ,N>,
x , w sR , u eR , z , v eRp,
k k k k k
AeRnxn, BeRnxm’ CeRp
(1 )
Model (1) nazywamy modelem wymuszonym, mając na uwadze składnik Bu^ wystę
pujący w prawej stronie równań stanu. Model swobodny otrzymujemy pod
stawiając Buk=0.
W przypadku modelu (1) założenie stacjonarności ma tylko na celu uproszczenie zapisów i wszystkie rozważania można powtórzyć dla modeli liniowych niestacjonarnych.
Dyskretny liniowy • i stacjonarny model dynamiczny zapisany w postaci bezpośredniej ma formę:
z =h (t ,u ), (21
k k D D K )
t k t k
gdzie:
kelHZ
Ł D =(V iSDtkCHt’ t l « R , >
t k
u =(u : ielD clH , u eR®)
D i uk u 1
u k
z eRp.
k
Ten sam model po renumeracji wektorowego argumentu i funkcji wektorowych może być zapisany w postaci:
z =h (t , u ), O) k "
gdzie:
Synteza nieaktywnego prawa. . .___________________ _ _ _______________ 297
k k Dtk V
kelH ={1,. . -N >
z 3
t =(t : leB clH ={ 1.... N }. t eR)
D 1 tk t 1 1
Łk
u =(u : leD cH =< 1.... N >, ueR)
D 1 uk u 2 1
uk Z k6R.
W pracy stosuje się również uproszczone zapisy bezpośredniego modelu dynamicznego w postaci:
z=h(t,u), (4)
k k gdzie:
keH ={1,. . -N >
z 3
t=t =col(t : leiH =<1.... N), t eR)
H 1 t 1 1
t
u=u =col(u : ielH ={1,... ,N >, u eR)
H i u 2 1
u z eR.
k
h (t,u) jest funkcją stałą względem zmiennych t ’ u h\d r° ™ 3
k t tk u uk
hkU D ’ UD tk uk
Modele bezpośrednie (2), (3) nazywamy modelami wymuszonymi, odpowiada
jące im modele swobodne otrzymujemy podstawiając uq =0.
uk
Model o postaci (1) może być w sposób oczywisty przekształcony do modelu bezpośredniego.
Definicja 1 Niech
i) ¡H ={1 N }, IH =<1,....N } będą odpowiednio horyzontami sterowań i
u 2 z 3
pomiarów, D ,0 ich podzbiorami, zaś rodziną podzbiorów D^, ii) =) będzie przyporządkowaniem informacyjnym,
Z *z lii) Zj “hjit.Uj )
U z =h (t),
ol ol
gdzie ielt będą odpowiednio wymuszonym i swobodnym modelem bezpośrednim, z
Funkcje
298 K- Wojciechowski
M J u =u (z , ), IelH i i yu> u
nazywamy i-tym prawem sterowania, ii) u =u (z ), ieH
1 ol o,7( l > u
nazywamy i-tym nieaktywnym prawem sterowania,
Jeżeli w szczególności przyporządkowanie Informacyjne 7 jest takie, że 7(i) = {l i>SH , ielH
z u
oraz model bezpośredni może być zapisany w postaci:
Zi=tli ui_1^’
to prawa sterowania wymienione w punktach i)—i i) przyjmują postacie:
u =u (z1), ieH
i 1 U
u —u (z1), ielH
1 Ol O u
Jeżeli bezpośrednie modele dynamiczne, odpowiednio wymuszony i swobod
ny mają postacie:
z =h (t)+p (u-1-1), p (0)=0, jelH ,
J oj j j z
2 =h (t),
oj oj
to dla każdego ielH pomiędzy prawami sterowania u (z1), u (z1) zachodzą
u 1 ol O
związki
u (z‘)=u .(z1- d (z1 1 ))=u (z1), (5)
oi o ol — 1 1
u (zl)=u (z'+ c (z1_1))=u (z1). 1 1 O “ I ol o C6)
Bezpośrednio z postaci modelu, założenia p^(0)=0 dla jelH oraz postaci praw sterowania ufc(z ), keW mamy:
2 oJ= V P J ( U l i z l ) U J - l t e J ‘ 1))
2 oJ= 2 J - d J ( z J ' ł ) ’
dla jełK Rozpisując jawnie z^ uporządkowany do postaci wektora blokowego otrzymujemy:
Synteza nieaktywnego prawa. 299
.i i 1-1 \ z ~ z -d (z )
ol l i
lub w zapisie zwartym:
' i -J i ‘-1!
z =z - d (z ), O “ ł
co po podstawieniu do u (z'l u miejsce z! uzasadnia (5). Dla uzasadnienia
Ol O O
(6 ) podstawiamy za z w wyrażeniu na u^z*) uporządkowane do odpowiednich wektorów blokowych postacie
z —z +p (u (z1 u (zj 1) )
j o j j o l o o . J - l o
, J-l ■, z —z +c (z ).
j o j j o
3. Sformułowanie problemu syntezy praw sterowania
Zakładamy,że:
ildyskretne, stacjonarne bezpośrednie modele dynamiczne, odpowiednio wymuszony i swobodny, określone w horyzoncie mają postacie:
z =h t + p u,
k k * k
z o k =h't, k (8)
gdzie:
kelH ={1 N >,
5£ 3
t =col(t : ieiH ={1, . . . , N }, t eR ),
i t i i
u =col(u :i€lH={l N }. u eR ),
i u 2 1
N N
h eR l, p eR ,
k k
ii) wartości zmiennych t nie są znane, wiadomo jedynie, że należą do danego ograniczonego i mierzalnego w sensie Lebesgue’a zbioru ¥cR ,
iii)nieaktywne prawo sterowania ma postać,
300 K. Wojciechowski
gdzie
, y(k)=!D
u 1 z k
jest danym przyporządkowaniem informacyjnym takim, że prawa sterowania u =u (z ), ksW ,
k k y(k) u
równoważne nieaktywnym prawom sterowania (patrz p. 2 ), stanowią łącznie z modelem klasyczną strukturą informacyjną,
iv) kryterium optymalności ma postać:
k=N2
{ (akv ukyk)dt- m k = l
gdzie dla keiH
a sR, a k k>0 N -r V r 1 " R
1,0 = I dt'
v) zadanie syntezy polega na znalezieniu nieaktywnych praw sterowania
*
#
Uok or<k)^’ k6łV talcich' że odpowiadająca im wartość kryterium q jest minimalna.
Definicja 2. Kanonicznym problemem syntezy nieaktywnego prawa sterowania nazywamy
ml u
n i (a u2(z ) + u (z )y(t ))dz dt ,
J oD oD 2 oD 2
so H
gdzie S^cR 1, s=(z^d, t^eS^, dim t^N^-r, funkcja y jest dana.
4 . Synteza praw sterowania
Twierdzenie 1. Optymalne nieaktywne prawo sterowania bądące rozwiązaniem problemu określonego w def.1 ma postać:
Synteza nieaktywnego prawa. 301
u (z )=- - a' 1 i y(t )dt / [ dt (ll)i
oD 2 J 2 2 J 2
S z S z
o 1 oD o 1 oD
odpowiada mu optymalna wartość wskaźnika q wynosząca:
q * =- i a' 1
|
(|
y(t2 )dVJ
d t / dZoDdt2 S S z S zo • o 1 oD o 1 oD
Jeżeli dodatkowo założyć y(t2) = k ' t 2>
to
u (z )=- - a ’k b oE 2 S Iz
o 1 oD
(b I )2 dz dt ,oD 2 S < J Z oD
gdzie b jest środkiem ciężkości zbioru S z
” , o oD
S z
o 1 oD
Dowód. Stosując twierdzenie o całce iterowanej mamy:
f (a u2(z ) + u(z )y(t ))dz dt =
J oD oD Z oD 2
so
= J ' I (a u2 (Z0D) + U(ZoD)y(t2 )) dt2 )dZ0D=
Z S z
oD o oD
( u2(z )( f dt )+ uCz ) [ ytt ) dt )dz .
J oD J 2 o D J 2 2 o D
2 o D S Iz o 1 o D 5 2 «o 1 o D
(1 2)
Przyrównując do zera pochodną względem u wyrażenia podcałkowego przy uwzględnieniu J" dt >0 otrzymujemy:
S zo 1 oD
U ‘ (Zo0)=- i a " i y(t2)dV j
dt ,2S Iz S z
o 1 o D o 1 oD
zaś wskaźnik jakości otrzymany po podstawieniu powyższego wyrażenia ma postać:
302 K. Wojciechowski
q*=- i a' 1 | ( | y(t2 )dt2/ J d t / d z ^ .
S S z S z
o o o D o o D
Łatwo sprawdzić, że zakładając liniową postać funkcji y i ) tj.
y(t2)=k t2 otrzymujemy wyrażenia podane w tw. 1 .
Twierdzenie 2. Jeżeli spełnione są założenia i)-v), to rozwiązanie problemu syntezy nieaktywnych praw sterowania sprowadza się do rozwiązania wzaje
mnie niezależnych problemów postaci:
min f Ca uZ(z ) + u(z )y(t ))dz dt , (13)
J oD oD 2 oD 2
k sok k=l N .
2
Dowód. Dokonując odpowiedniej zmiany zmiennych w każdej z całek będących składnikami sumy, określającej q oraz uwzględniając, że żaden z występujących zbiorów nie zależy od praw sterowania, możemy zapisać problem minimalizacji w postaci:
q= min (
f
(a u2(z ) + u(z )y(t ))dz dt )+ ...oD oD 2 oD 2
f i 1 1 1
u (z ) S
min (
f
(a u2(z ) + u(z )y(t ))dz dt +oD oD 2 oD 2
i, i, t, u
u (zk) S
k o k
+ min (
f
(a u2(z ) + u(z )y(t ))dz dtoD oD 2 oD 2
, N* 1 N N N
u (z ) S
N oN
Założenie klasycznej struktury informacyjnej nie jest wykorzystywane w powyższym dowodzie, umożliwia natomiast "przeliczenie" nieaktywnych praw sterowania na prawa sterowania postaci u =u (z ), y(k)=D .
k k J ( k ) k
4. Podsumowanie
W pracy przedstawiono rozwiązanie problemu syntezy nieaktywnych praw sterowania dla modelu bezpośredniego danego jako źródłowy. Modele takie występują przykładowo w ekonometrii. Model bezpośredni może być uzyskany również z przekształcenia modelu danego pierwotnie w zmiennych stanu. Nie-
Synteza nieaktywnego prawa. 303
aktywne prawa sterowania są z definicji funkcjami pomiarów z “odliczonym"
wpływem sterowań. Połączenie w jednym problemie modelu bezpośredniego i pomocniczych praw sterowania pozwoliło na jawną dekompozycją wieloetapowego problemu wyjściowego na wzajemnie niezależne problemy jednoetapowe. Dla każdego z nich w przypadku modelu bezpośredniego liniowego wzglądem stero
wań, sterowanie optymalne jest liniową funkcją środka ciążkości warunkowego zbioru informacyjnego typu S dla dowolnego całkowalnego zbioru T. Możliwe jest również jawne zapisanie optymalnej postaci wskaźnika jakości.
Otrzymany wynik ma głównie charakter poznawczy, pokazuje bowiem w spo
sób najbardziej bezpośredni strukturą problemów syntezy praw sterowania z modelem liniowym, niepewnością ograniczoną i klasyczną strukturą informa
cyjną. W niektórych przypadkach postąpowanie przedstawione w problemie może być wykorzystane do uproszczenia rozwiązania praktycznego problemu syntezy praw sterowania.
LITERATURA
[1] Bertsekas D.P.: Control of uncertain systems with a set-membership description of the uncertainty, Ph.D. dissertation, Dept. Elec. Eng., MiT, Cambridge, 1971.
{2] Fogei E. : System identification via membership set constraints with energy constrained noise. IEEE Trans. Automatic Control, AC-24C19/9), pp. 752-758.
[3] Fogel E. , Huang Y.F.: On the value of Information in system identi
fication bounded noise case, Automática, 18(1982), pp. 229-238.
[4] Glover J.D., Schweppe F.C.: Control of linear dynamic systems withset constrained disturbances, IEEE Trans. Automatic Control, AC-16(1971), pp. 411-423.
[5] Ho Y. C. : Team decision theory and information structures. Proc. IEEE vol.68, (1980), pp.644-654. [28] Ho Y. C., Kastner M.P., Wong E. : Teams
signaling and information theory. IEEE Trans. Automatic Control, AC-23(1978), pp. 305-311.
304 K- Wojciechowski
[6] Ho Y. C. , Chu K. C. : Team decision theory and information structures in optimal control problems-part I. IEEE Trans. Automatic Control, AC-17(1972), pp. 15-22.
[7] Keesman K.J., van Straten G.: Modified set theoretic identyfication of ill-defined water quality systems from poor data. Proc. of IAWPRC Symp. Systems Analysis in Water Quality Management, Pergamon' Press, Oxford, 1987, pp.297-308.
[8] Kuncevicz W. M.: Opriedeienije garantirowanych ocenok sostojanija i paramietrov diskrietnych dynamiczieskich sistem. Kibiernietika i Wyczi- slitielnaja Tiechnika, Wyp.75 (1987), pp. 1 -6 .
[9] Kurzhanskii A.B.: "Control and Observation under Conditions of Uncertainty", Nauka, Moskow, 1977.
[10] Kurzhanskii A.B.: Dynamic control and system estimation under uncertainty conditions. I, II. Probl. Control & Information Theory, No. 6, 1980, No. 1, 1981.
[11] Lin J.N.: Determination of rechable set for a linear discrete system.
IEEE Trans. Automatic Control, AC-15 (1970), pp. 339-342.
[12] Norton J. P. : Identification and application of bounded-parameter models.
Automática, vol 23, 1987, pp.497-507.
[13] Ovseevich A.I., Trushchenkov V.L.,Chernousko F. L. : Equation^ of continuous guaranteed state estimation for dynamical systems. Izvestija of the USSR Academy of Sciences. Engineering Cybernetics, No.4,(1984), pp. 94-101.
[14] Pronzato L., Walter E.: Some results on experiment design for bounded- error models. Proc. 12th. IMACS World Congres on Scientific
Computation, Paris, 1988.
[15] Schweppe F.C. :Recursive state estimation: Unknown but bounded errors and system inputs. IEEE Trans, on Automatic Control, AC-13(196S). pp.
408-414.
[16] Schweppe F.C.: "Układy dynamiczne w warunkach losowych", WNT, Warszawa 1978.
[17] Uchida K.: Certainty equivalence property indiscrete time stochastic control problems with nonlinear measurements. Memories of the School of Science and Engineering, Waseda Univ. , No. 42, 1978, pp.1-16.
[18] Witsenhausen H.S.: Sets of possible states of linear systems given perturbed bservations. IEEE Trans. Automatic Control, AC-13 (1968), pp. 556-558.
[19] Wojciechowski K.: Sterowanie rozdziałem zasobów w warunkach niepewności. Z. N. Pol. Śl., Z.74, 1980.
Synteza nieaktywnego prawa. 305
[20] Sterowanie optymalne u warunkach niepewności stanu jako problem optymalizacji wielokryterialnej. Symp. Model, w Mech. , Beskid Śląski 1934.
[21] Metoda symulacji układów dynamicznych w warunkach niepewności ograniczonej . SPD 2, Zakopane, 1985.
[22] Control and decision making under set-membership model of uncertainty. Analysis and synthesis. Raport, LH Wageningen, 1986.
[23] Efektywność syntezy prawa sterowania techniką przestrzeni stanu dla zbiorowego modelu niepewności, Konf. RP.1.02, Kazimierz Dolny 1988.
[24] Synteza prawa sterowania w warunkach niepewności ograniczonej.
Przypadek centrowanego zbioru T, przyjęte do publikacji w Z.N. Pol. Sl.
s. Automatyka.
[25] Synteza prawa sterowania w warunkach niepewności ograniczonej.
Przypadek niecentrowanego zbioru f, przyjęte do publikacji w Archiwum Automatyki i Telemechaniki.
DODATEK A
A .l . D e f i n i c j e i p o d s t a w o w e w ł a s n o ś c i z b io r ó w i n f o r m a c y j n y c h t y p u S
Modele bezpośrednie, odpowiednio swobodny i wymuszony zapisujemy w postaciach:
zk=H s +vk (A. 1)
o k k
zk=H s +vk+p (zk *) (A. 2)
k k k
gdzie w obydwu przypadkach kelH, VksRp, zaś grupa zmiennych określona jest przez następujący podział wektora t=(sk,v ), skąd p, d=n+nN+pN, H cR1<p*(d'kp\
p
Definicja A. 1. Określone dla każdego ke(H wzajemnie jednoznaczne odwzorowa
nie u :Rd->Rd, d=n+nN+pN, przyporządkowujące każdemu punktowi (s vk)eRd
o k K
punkt (s ,zk)eRd gdzie sk=(xi,uN,vN/k), nazywamy swobodnym odwzorowaniem informacyjnym. Odwzorowanie przekształca dany zbiór TcR w zbiór
Zbiór S nazywamy zbiorem informacyjnym odpowiadającym zbiorowi T zgodnie
o k
z odwzorowaniem fd .
306 K. Wojciechowski
Twierdzenie A. 1. Jeżeli układ dynamiczny ma postać (A. 1) to dla każdego kelH:
1 ) odwzorowanie p jest liniowe 1 ma postać:
p (s .v ) =
o k k
1 0 S
k
H 1 Vk k
gdzie macierz H dana jest bezpośrednio, s wynika natomiast z podziału
k k
wektora t=(s , v ),
k
il) odzworowanie odwrotne /i ^ma postać:
- i , k .
V o k u(S u’o k 2 o5
1 0 s
k
- H 1 k
Z
k o
Dowód. Dla modelu (A.1) postać odwzorowania p ^ uzyskujemy dopisując do równań tego modelu tożsamość s^=s^. Odwzorowanie odwrotne otrzymujemy rozwikłując równanie modelu względem vk.
Twierdzenie A. 2 . Jeżeli układ dynamiczny ma postać (A.1) to dla każdego kelH zachodzi:
jdetj |= 1
gdzie J =8 ok
/ a jest macierzą Jacobiego odwzorowania p
Dowód. Macierz Jacobiego odwzorowania p ^ jest tożsama z macierzą (tw.A.1) określającą to odwzorowanie. Wyznacznik tej macierzy jest równy jedności.
Wniosek A. 1. Niech d{s^, zk), dts^, vk) będą odpowiadającymi sobie zgodnie z odwzorowaniem p objętościami elementów różniczkowych zbiorów S , TT. Dla
° k k
każdego kelH zachodzi d(s ,zk) = d(s ,vk).
Słownie oznacza to ,że objętość elementu różniczkowego (miara) jest niezmiennikiem odwzorowania p
o k
Definicja A. 2 . Niech dla każdego kelH będzie określone jednoznaczne odwzorowanie ’ d=n+nN+pN, przyporządkowujące punktowi
Synteza nieaktywnego prawa. 307
(s ,z , zk 1)eS cRd punkt (s ,v , z* 1)eS cRd. Odwzorowanie y
k o k o o k k k o o k - 1 o k
przekształca dany zbiór S w zbiór
ok
s = T) (S ) = - i ( s . z “ ' 1 ) : ( s , Z k l )=T)
o k - 1 o k o k I k - 1 o k - 1 o < (s zk)I(s Z k ) e S
ok k o ' k o o k
Twierdzenie A. 3. Jeżeli układ dynamiczny ma postać (A. 1) to dla każdego kelH odwzorowanie ij jest liniowe i ma postać :
o k
s
k
V -
k k - 1 Z
o
- h 1
k
s
k
Z o k k - 1
■* Zo
Odwzorowanie odwrotne rj ma postać:
o k
S k
Z -
o k k - 1 u Z0
h 1
k k
k - 1
gdzie jest k-tym wierszem blokowym macierzy z modelu (A.l).
Dowód. Postaci odwzorowń i) , rf1 wynikają bezpośrednio z modelu (A.l)
--- o k o k
rozpisanego z dokładnością do "blokowych" wierszy.
Twierdzenie A. 4. Jeżeli układ dynamiczny ma postać (A.l) to dla każdego ke!H zachodzi:
jdetj |=1
o k
g d z i e J = 5 o k
S s
o k - 1 ok
/ a
k - 1 k
Z Z
o 0
jest macierzą Jacobiego odwzorowania tj
Dowód. Macierz Jacobiego odwzorowania y jest równa macierzy
--- o k
reprezentującej to odwzorowanie (Tw. A. 3). Jej. wyznacznik jest równy 1.
Wniosek A. 2. Pomiędzy objętościami odpowiadających sobie według odwzorowa
nia y elementów różniczkowych zbiorów S , S zachodzi związek:
o k o k - 1 o k
308 K. Wojciechowski
Podobnie pomiędzy objętościami elementów różniczkowych zbiorów warunkowych S o k - l 1 o Iz* l, S lzk o k 1 o 1 (p.A.2. Def.A.3) zachodzi związek:
ds =ds dz
o k - 1 o k o k
A .Z. Z b io r y w a r u n k o w e i r z u t y
Definicja A. 3. Niech dla każdego kelH będzie dany zbiór S o elementach
--- o k
ts ,zk). Dla ustalonego zk zbiór S lzk={(s ): (s ,zk)eS } nazywamy
o k o o o k 1 o o k o k o o k
zbiorem warunkowym zbioru S przy warunku z .
Zbiór S I zk można interpretować geometrycznie jako rzut ortogonalny
o k o
na przestrzeń zmiennych s "przekroju" danego zbioru S hiperpłaszczyzną
o k o k
k k
(w przestrzeni zmiennych (s , z )) z =const.
o k o o
Definicja A.4. Niech dla każdego keH będzie dany zbiór S o elementach
--- ok
(s ,zk). Zbiór P =tt (S )={(zk):(s ,zk)eS } nazywamy rzutem
o k o o k z k o k o o k o ok
ortogonalnym zbioru S na przestrzeń zmiennych zk. Zbiór 2 |zk_1=
o k o o k 1 o
={zQk: (zok. zo k —1 nazywamy warunkowym zbiorem obserwacji z dla danego k-1
ciągu obserwacji z
O
Recenzent: Prof, dr hab. inż. Leszek Rutkowski
Wpłynęło do Redakcji 20.05. 1991r.
Abstract
In the paper a problem of nonactive control strategy design for the plant described by the direct model is presented . The model of uncertainty consi
sts in the bounded Lebesgue integrable set T defining jointly possible values for initial conditions and sequences of distyrbrnces in the state and measurement equation. To solve the problem, a novel method using free information sets of thee type S is used. Their definitions and properties are presented in the Appendix. In the paper it has been proved that for a
Synteza nieaktywnego prawa. 309 linear with respect to control model, control strategies creating with the model a nested information structure and the performance index being an aggregate od second moments of the image of the set T an optimal control strategy can be found independently in the each moment of the considered control horizon. Moreover it is a linear function of the center of gravity of the conditional information set.