INSTYTUT BADAŃ SYSTEMOWYCH POLSKA AKADEMIA NAUK
W WARSZAWIE
METODY ROZWIĄZYWANIA SKOŃCZENIE WYMIAROWYCH
ZDEGENEROWANYCH PROBLEMÓW OPTYMALIZACJI
Ewa Szczepanik
-Rozprawa doktorska-
Promotor:
prof. dr hab. Aleksiej A. Tretiakow
Warszawa 2010
SPIS TREŚCI
Spis oznaczeń i określeń. ... 5
Wstęp... 12
1. Podstawowe pojęcia oraz pomocnicze twierdzenia i lematy. ... 31
1.1. Przypadek regularny - podstawowe twierdzenia. ... 31
1.2. Elementy teorii p-regularności. ... 35
1.3. Procedura identyfikacji zerowych elementów. ... 41
1.4. Pomocnicze odwzorowanie h(x)... 56
2. Warunki optymalności w przypadku zdegenerowanym. ... 59
3. Metoda p-czynnikowa Lagrange`a rozwiązywania problemów zdegenerowanych z ograniczeniami równościowymi... 63
3.1. Podstawowy schemat metody... 63
3.1.1. Przykłady... 67
3.2. Przypadek, gdy PiF(x) są wielomianami stopnia i... 72
3.3. Numeryczna metoda rozwiązywania zdegenerowanego zagadnienia optymalizacji z ograniczeniami równościowymi. Ogólny przypadek. ... 82
3.3.1. Eksperyment numeryczny. ... 87
4. Metoda p - czynnikowa Lagrange`a rozwiązywania zdegenerowanych problemów optymalizacji z ograniczeniami nierównościowymi... 88
4.1. Podstawowy schemat metody... 89
4.1.1. Przykład... 91
4.2. Numeryczna metoda rozwiązywania zdegenerowanego zagadnienia optymalizacji z ograniczeniami nierównościowymi. Ogólny przypadek. ... 94
4.2.1. Eksperyment numeryczny. ... 97
5. Rozwiązywanie zdegenerowanych zadań optymalizacji warunkowej poprzez sprowadzanie do szeregu zadań optymalizacji bezwarunkowej. Metoda funkcji kary. ... 98
5.1. Idea Metody Funkcji Kary. ... 99
5.2. Zbieżność oraz oszacowanie prędkości zbieżności metody 2-
czynnikowej funkcji kary ... 101
5.2.1. Przykład... 106
Dodatek A ... 110
Implementacja metody p-czynnikowej Lagrange`a ... 110
Dodatek B... 119
Zakończenie ... 122
Bibliografia ... 123
Spis oznaczeń i określeń.
(x xn)T Rn
x= 1,..., ∈ - element przestrzeni R w postaci wektora kolumnowego; n
{ }x P - zbiór elementów x mających własność P ; s
k =1, - skrót oznaczenia: dla każdego k =1,2,...,s;
{ ∈ ( )=0}
= x R F x
X n - zbiór punktów dopuszczalnych dla problemów optymalizacji warunkowej z ograniczeniami równościowymi;
{
x R g x i m}
X = ∈ n i( )≤0, =1, - zbiór punktów dopuszczalnych dla problemów optymalizacji warunkowej z ograniczeniami nierównościowymi;
R - zbiór liczb rzeczywistych;
R - n-wymiarowa przestrzeń rzeczywista; n
N - zbiór liczb naturalnych;
− ) (x
Wr wielomian stopnia r ;
∑
=
= n
i i iy x y
x
1
, - iloczyn skalarny wektorów x i y ;
2 2
2 2
1 x ... xn
x
x = + + + - norma euklidesowa wektora x∈Rn;
− ) (sup
inf A A kres dolny ( górny) zbioru A⊂R; )
, (
dist x A =ρ( )x,A =inf{x−y,y∈A}- odległość punktu x od zbioru A ;
{ }
( i h )
Spanξi, ∈ 1,..., - powłoka liniowa;
{ }
( )
( ∈ )−
= = i Span j j m i
m
m) mini dist , , 1,..., \ ,...,
(
,
1 ξ 1 ξ ξ
ξ
ρ odległość między wektorami
ξm
ξ1,..., ;
{ ε}
ε x = y∈R x−y ≤
U ( ) n - domknięte ε otoczenie punktu x;
{x U (x*) F(x) F(x*)}
M = ∈ ε = - zbiór lokalnych rozwiązań równania
*) ( ) (x F x
F = .
) , lim ( : )
( 0 N
t t t O
O t =
→ gdzie N ≠0 − niezerowa stała;
) 0 lim ( : )
( 0 =
→ t
t t o
o
t ;
I – macierz jednostkowa;
A
det − wyznacznik macierzy;
A
rank − rząd (maksymalna liczba liniowo niezależnych wierszy lub kolumn) macierzy A;
A − macierz transponowana macierzy A; T
(Rn,Rm) − przestrzeń operatorów liniowych działających z R w n R ; m
{
0}
Ker Λ= x∈Rn Λx= − jądro danego liniowego operatora; Λ:Rn →Rm; }
: {
ImΛ= y∈Rm ∃x∈Rn y=Λx − obraz liniowego operatora Λ:Rn →Rm;
m p
n n
n R R R
R
Q × × × →
4 4
4 3
4 4
4 2
1 K
: jest odwzorowaniem p−liniowym jeśli jest liniowe ze względu na każdą zmienną z osobna przy pozostałych ustalonych;
[h hp]−
Q 1,..., działanie p-liniowego odwzorowania Q na element (h ,...,1 hp),
,p i R
hi ∈ n, =1 ; dla h1 =h2 =L=hp odwzorowanie p−liniowe będzie postaci
[ ]h p
Q ;
[]p
Q⋅ - odwzorowanie stopniap ( p -forma);
) , ( n m
p R R
Q − przestrzeń odwzorowań stopnia p (p-form) działających z R w n R ; m
{
[ ] 0}
KerpQ= x∈Rn Qx p = − p-jądro określonego na R odwzorowania stopnia p; n Rn
x*∈ − rozwiązanie zadania optymalizacji;
) ( ) ,
( n m p n
p R R C R
C = − klasa odwzorowań p-krotnie różniczkowalnych w sposób ciągły z przestrzeni R w n R ; m
)
)(
( x
F r − r-ta pochodna odwzorowania F w punkcie x;
Tradycyjnie w literaturze pochodne wyższych rzędów odwzorowania F:Rn →Rm przedstawia się w postaci macierzowej lub tensorowej jednakże w niniejszej pracy zostały wprowadzone nowe oznaczenia dla tych pochodnych. Będą one przedstawiane w postaci wektorowej. Postać ta jest przystosowana do algorytmów prezentowanych w pracy (np. algorytm wyznaczania liniowej zależności lub niezależności tensorów wyższych pochodnych). Ponadto dany sposób przedstawiania pochodnych wyższych rzędów daje możliwość efektywnego konstruowania elementów typu
p k
h x
F(p)( *)[ ]k, =1,..., , co trudno byłoby uzyskać korzystająć ze zwykłych macierzowych lub tensorowych przedstawień pochodnych.
W niniejszej pracy będą używane następujące oznaczenia:
=
) ( ...
) ( )
(
1
x f
x f x F
m
,
∂
∂
∂
∂
∂
∂
∂
∂
′ =
n m m
n
x x f x
x f
x x f x
x f x
F
) ... (
)
( ... ...
...
) ... (
) ( )
(
1
1 1
1
[ ]
[ ]
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
′′
′′
′′ =
n n
m n
m
n m m
n n n
n
m
x x
x f x
x x f
x x
x f x
x x f
x x
x f x
x x f
x x
x f x
x x f
x f
x f x F
) ... (
) (
...
...
...
) ... (
) (
...
...
...
...
) ... (
) (
...
...
...
) ... (
) (
) ( ...
) ( )
(
2
1 2
1 2
1 1 2
1 2
1 1 2
1 1 2
1 1
1 2
1
lub zgodnie z tym co zostało napisane powyżej w postaci wektorowej
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
′′ =
n n
m n
m n
m n
m m
m
n
n n n
n n
x x
x f x
x x f x
x x f x
x x f x
x x f x
x x f
x x
x f x
x x f x x
x f x
x x f x
x x f x
x x f x
F
) ,..., (
) , (
)
;...; ( ) ,..., (
) , (
) (
....
) ,..., (
) , (
)
;...; ( ) ,..., (
) , (
) ( )
(
2
2 2
1 2
1 2
2 1 2
1 1 2
1 2
2 1 2
1 1 2
1 1 2
2 1
1 2
1 1
1 2
4 4 4 4 4 4 4 4 4 4 4 4
4 8
4 4 4 4 4 4 4 4 4 4 4 4
4 7
6
ogólnie
{ {
{ {
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
−
− −
−
− −
−
− −
− −
−
3 2 1 3
2 1 4
4 4 4 4
4 8
4 4 4 4 4
4 7
6
4 4 3 4
4 2 1 4
4 3 4
4 2 1
M
3 2 1 3
2 1 4
4 4 4 4
4 8
4 4 4 4 4
4 7
6
4 4 3 4
4 2 1 4
4 3 4
4 2 1
nawiasów k k k
n
razy k
n m k
razy k
m k
nawiasów k
nawiasów k k k
n
razy k
n k
razy k k
nawiasów k k
x x x x
x f x
x x x
x f
x x x x
x f x
x x x
x f
x F
....
...
. ...
;...;
...
;...;
...
) ,..., (
...
) ... (
....
...
. ...
;...;
...
;...;
...
) ,..., (
...
) ... (
) (
1 1 1
1 1 1
1 1 1
1 1 1
1 1
1 1
1 1 1
1
) (
ewentualnie w formie skróconej:
{
{
′
∂
∂
∂
∂
∂
′
∂
∂
∂
∂
∂
=
−
−
−
−
−
−
−
−
3 2 1 M
3 2 1
nawiasów k ik i i i
m k
nawiasów k
nawiasów k ik i i i
k
nawiasów k k
x x x x
x f
x x x x
x f
x F
... ....
) ... (
... ....
) ... (
) (
1 3
2 1
1
1 3
2 1
1 1
) (
Działanie odwzorowania stopnia 2 na elemencie h∈Rn wyznaczone jest następująco:
[ ] [ ]
[ ] [ ] [ ]
[ ]
′′
′′
=
′′
′′
′′ =
h h x f
h h x f h
h x f
h x f h
x F
m
m ( ) ,
...
, ) (
) ( ...
) ( )
(
1 1
2 .
Można zatem ogólnie zapisać przy pomocy wzoru rekurencyjnego:
(f x h )h
h x
f (p)( )[ ]k = (p)( )[ ]k−1 np. dla k =1 mamy
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
′′′ =
n n n
m n
n m n
n m n
m n
n m n
m n
m m
n
n n n n
n n
n n
n
n n n
n
x x x
x f x x x
x f x
x x
x f x x x
x f x
x x
x f x x x
x f x
x x
x f x x x
x f
x x x
x f x
x x
x f x
x x
x f x
x x
x f x
x x
x f x
x x
x f x
x x
x f x x x
x f
x F
) ,..., (
)
;...; ( ) ,..., (
)
;...; ( ) ,..., (
)
;...; ( ) ,..., (
) (
....
) ,..., ( )
;...; ( ) ,..., ( )
;...; ( ) ,..., ( )
;...; ( ) ,..., ( ) (
) (
3
1 3
1 3
1 1 3
1 3
1 1 3
1 1 3
1 1 1 3
1 3
1 1 3
1 1 3
1 1 1 3
1 1 3
1 1
1 3
1 1
1 3
1 1 1
1 3
4 4 4 4 4 4 4 4 4
4 8
4 4 4 4 4 4 4 4 4
4 7
6 4 4 4 4 4 4 4 4 4
4 8
4 4 4 4 4 4 4 4 4
4 7
6
{
{ 123
L 4
4 3 4 4 2 1
K L
4 4 3 4 4 2 1
K L
4 4 3 4 4 2 1
K L
4 4 3 4 4 2 1
K L
K 4
4 3 4 4 2 1
K L
4 4 3 4 4 2 1
K L
4 4 3 4 4 2 1
K L
4 43 4 42 1
K 3
2 1
K
1 1
1 1
1 1 1 2
2 1
1 1 1
1 1 1
1 1 1 1 1 ) (
) ( )
; ( ) ;
( )
. (
;
) ; ( )
; ( ) ;
( )
] ( )[
(
− −
− −
∂
∂
∂ + ∂
∂ +
∂
∂
∂
∂
∂
∂ + ∂
∂ +
∂
∂
∂
∂
∂
∂ + ∂
∂ +
∂
∂
∂
∂
∂
∂ + ∂
∂ +
∂
∂
∂
=
p n
p n n n
p
p n n
p n
p n n
p
p n
p
p
p n
p n n p
p n p n
p n p
p p
p p
x h x x
x h f
x x x
x h f
x x x
x h f
x x x
x f
x h x x
x h f
x x x
x h f
x x x
x h f
x x x
x h f
x f