ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO SERIA III: MATEMATYK.A STOSOWANA {1974)
J.
ZABCZYK{Warszawa) Sterowanie z
jedną korekcjąPrzed omówieniem zagadnienia wymienionego w tytule, podamy kilka uwag wprowa-
dzających.
Ewolucję układów
deterministycznych opisuje
się częstorównaniami
różniczkowymi zwyczajnymi.Jeżeliprzyjmiemy,
że„stan"
układujest w dowolnym momencie t
~O wekto- rem xt z przestrzeni n-wymiarowej Rn, to równania takie
mają postać:(1)
xt=ft(xt),
t~o.gdzie ft jest
funkcją przekształcającąRn w Rn. Gdy na przemieszczenia
układu wpływ mająjeszcze czynniki losowe (zaburzenia), a
więcgdy na
przykładgdzie
~t, hjest
zmienną losowąo
rozkładzienormalnym, to wtedy trajektorie
układu będąrealizacjami pewnego procesu stochastycznego. Procesy takie definiuje
się najczęściejjako
rozwiązania równań
stochastycznych, które w symbolicznym zapisie
mają postać:(2) t~O.
Równania typu (2)
różnią sięod
równańtypu (1)
składnikiem wt'tzw.
„białymszumem", procesem stochastycznym
będącym matematyczną idealizacją zaburzeń działającychw
różnych te~hnicznych układach (por. [1 ]).
Zagadnienia sterowania
pojawiają sięwtedy, gdy funkcja ft
zależyjeszcze dodatkowo od pewnego parametru
„sterującego"u. Wówczas
(3) t
~o.Parametr u ma
byćtak dobierany przez obserwatora, by przebieg procesu
byłoptymalny (w sensie
zależnymod sytuacji).
Układy
opisywane równaniami postaci (3) to tzw.
układystochastyczne sterowane (por.
[ 1 ]).
W niniejszym komunikacie zajmiemy
siękonkretnym
przykładem układustochastyczne- go sterowanego. Ograniczymy
sięprzy tym do sytuacji, gdy w trakcie
działania układu można
dokonaćtylko jeden raz zmiany parametru
sterującego. Zmianę taką nazywać będziemy korekcją.Przyjmijmy,
że układjest punktem materialnym
poruszającym sięw przestrzeni trójwymiarowej
R3 •Niech (-r,
O, O),r
>O, będzi~punktem startu, oraz niech
t
~o.158
j.ZabczykZakładamy
dodatkowo,
żeparametr
sterującyu jest dowolnym wektorem z
R3o
długości~I.
CeJem optymalnej korekcji jest maksymalizacja
prawdopodobieństwadotarcia punktu materialnego do kuli
K(O, a), której
środkiemjest O, a promieniem a.
Rozróżniamy
dwa przypadki:
(I) Obserwator zna
położeniepunktu w dowolnym momencie t
~O i
może dokonaćko- rekcji
uwzględniając rzeczywistą trajektorię cząstki.(II) Moment korekcji ma
byćpodany w chwili startu.
W cybernetyce przypadek (I) nazywa
sięsterowaniem ze
sprzężeniemzwrotnym, a przy-
padek (II) sterowaniem w
„pętliotwartej". ·
Uwagę naszą
skoncentrujemy na optymalnym wyborze momentu korekcji, natomiast o wektorze
prędkościu
założymy, żew chwili startu i w momencie korekcji jest on nakiero- wywany na punkt O i ma
maksymalną długość1.
P
rz y p a d e k (I). Przede wszystkim
należy wyliczyćlub
możliwie dokładnieoszaco-
wać prawdopodobieństwo
p(r, a) trafienia kuli
K(O, a), gdy nie dokonuje
siękorekcji. Oka- zuje
się(por. [3 ]),
że:Q Q 2
-~p(r,
r a)
~-er a, r>a.
Dokładność przybliżonego wzoru p(r, a) ~~jest tym lepsza, im mniejszy jest promień
kuli K(O, a). r
Poniższe
twierdzenie podaje oszacowanie
prawdopodobieństwapm (r, a) trafienia kuli K(O, a) przy optymalnej korekcji oraz pa(r, a) trafienia kuli, gdy dokonujemy korekcji na
płaszczytniex
1= O (przypominamy, punktem startu jest zawsze (-r, O, O)).
TwIERDZENIE. Prawdziwe
są następujące nierówności:pm (r, a) ~a Jf,[ e2a + e2a J!].
i dlatego
I
~ """" im--1• P(r, a)
1-...,,, ~1-:-- p(r,
1m - -a)~e2a
1-...,,,, ,r-+oo Q - r-+oo Q -
r r
Z twierdzenia wynika,
żejedna korekcja
może zwiększyć prawdopodobieństwotrafienia kuli J'f- -krotnie (przy dużej odległości początkowej r). Wynika z niego również, że korek- cja na
płaszczyźniex
1=O jest bliska optymalnej.
P r z y p a d e k (II). Znalezienie optymalnego deterministycznego momentu korekcji
prowadzi do szukania maksimum funkcji
określonejskomplikowanym wzorem. Ograniczy-
Sterowanie z jedną korekc1"ą
159
my
się więcdo
następującejinformacji.
Jeżeli będziemy dokonywaćkorekcji w momencie
t =
r, to prawdopodobieństwo ą(r, a) trafienia kuli będzie większe od liczby a A_ nr e-a.
2/2r
oraz
1 -1·
~ imPm(r, a)_,..
~ -1. 1mPm(r, a)_,..
~e 2a-.
1f;::;-00 ą(r,
a)
r-+ooq(r, a) 2
Dlatego
też prawdopodobieństwoq (r, a)
będzietego samego
rzęducp w przypadku (I). Ko-
rzyści płynące
w tym modelu ze
sprzężeniazwrotnego
są więcminimalne.
Pytanie
sformułowanew punkcie (I) prowadzi do
zagadnieńtzw. optymalnego zatrzy- mywania procesów stochastycznych, o których to zagadnieniach w sposób
wyczerpującymówi
książka[ 2]. Sam dowód twierdzenia
sformułowanegow
tekścieznajduje
sięw pracy [3 ].
Bibliografia
[1] K. I. Astr o m,Introduction to S(ochastic Control, New York 1970.
[2] A. H. llh1pHeB,
Cmamucmu'łteC1'UUnoCAeiJooameJ1,'bWbtU a11,aJ1,U3, MocKBa 1969.
[3) j: Z abc z y k, A mathematical correction problem, Kybernetika, 8(4) (1972).