METODY ROZWIĄZYWANIA SKOŃCZENIE WYMIAROWYCH ZDEGENEROWANYCH PROBLEMÓW OPTYMALIZACJI

(1)

INSTYTUT BADAŃ SYSTEMOWYCH POLSKA AKADEMIA NAUK

W WARSZAWIE

METODY ROZWIĄZYWANIA SKOŃCZENIE WYMIAROWYCH

ZDEGENEROWANYCH PROBLEMÓW OPTYMALIZACJI

Ewa Szczepanik

-Rozprawa doktorska-

Promotor:

prof. dr hab. Aleksiej A. Tretiakow

Warszawa 2010

(2)

(3)

SPIS TREŚCI

Spis oznaczeń i określeń. ... 5

Wstęp... 12

1. Podstawowe pojęcia oraz pomocnicze twierdzenia i lematy. ... 31

1.1. Przypadek regularny - podstawowe twierdzenia. ... 31

1.2. Elementy teorii p-regularności. ... 35

1.3. Procedura identyfikacji zerowych elementów. ... 41

1.4. Pomocnicze odwzorowanie h(x)... 56

2. Warunki optymalności w przypadku zdegenerowanym. ... 59

3. Metoda p-czynnikowa Lagrange`a rozwiązywania problemów zdegenerowanych z ograniczeniami równościowymi... 63

3.1. Podstawowy schemat metody... 63

3.1.1. Przykłady... 67

3.2. Przypadek, gdy P_iF(x) są wielomianami stopnia i... 72

3.3. Numeryczna metoda rozwiązywania zdegenerowanego zagadnienia optymalizacji z ograniczeniami równościowymi. Ogólny przypadek. ... 82

3.3.1. Eksperyment numeryczny. ... 87

4. Metoda p - czynnikowa Lagrange`a rozwiązywania zdegenerowanych problemów optymalizacji z ograniczeniami nierównościowymi... 88

4.1. Podstawowy schemat metody... 89

4.1.1. Przykład... 91

4.2. Numeryczna metoda rozwiązywania zdegenerowanego zagadnienia optymalizacji z ograniczeniami nierównościowymi. Ogólny przypadek. ... 94

4.2.1. Eksperyment numeryczny. ... 97

5. Rozwiązywanie zdegenerowanych zadań optymalizacji warunkowej poprzez sprowadzanie do szeregu zadań optymalizacji bezwarunkowej. Metoda funkcji kary. ... 98

5.1. Idea Metody Funkcji Kary. ... 99

(4)

5.2. Zbieżność oraz oszacowanie prędkości zbieżności metody 2-

czynnikowej funkcji kary ... 101

5.2.1. Przykład... 106

Dodatek A ... 110

Implementacja metody p-czynnikowej Lagrange`a ... 110

Dodatek B... 119

Zakończenie ... 122

Bibliografia ... 123

(5)

Spis oznaczeń i określeń.

(x xn)^T Rⁿ

x= ₁,..., ∈ - element przestrzeni R w postaci wektora kolumnowego; ⁿ

{ }^x ^P - zbiór elementów x mających własność P ; s

k =1, - skrót oznaczenia: dla każdego k =1,2,...,s;

{ ^∈ ⁽ ⁾⁼⁰}

= x R F x

X ⁿ - zbiór punktów dopuszczalnych dla problemów optymalizacji warunkowej z ograniczeniami równościowymi;

{

^x ^R ^g ^x ⁱ ^m

}

X = ∈ ⁿ _i( )≤0, =1, - zbiór punktów dopuszczalnych dla problemów optymalizacji warunkowej z ograniczeniami nierównościowymi;

R - zbiór liczb rzeczywistych;

R - n-wymiarowa przestrzeń rzeczywista; n

N - zbiór liczb naturalnych;

− ) (x

W_r wielomian stopnia r ;

∑

=

= ⁿ

i i iy x y

x

1

, - iloczyn skalarny wektorów x i y ;

2 2

1 x ... x_n

x

x = + + + - norma euklidesowa wektora x∈Rⁿ;

− ) (sup

inf A A kres dolny ( górny) zbioru A⊂R; )

, (

dist x A =ρ( )^x^,Â ⁼înf{^x⁻^y^,^y^∈Â}- odległość punktu x od zbioru A ;

{ }

( ⁱ ^h )

Spanξ_i, ∈ 1,..., - powłoka liniowa;

{ }

( )

( ^∈ )⁻

= = _i Span _j j m i

m

m) mini dist , , 1,..., \ ,...,

(

,

1 ξ 1 ξ ξ

ξ

ρ ^odległość ^między ^wektorami

ξm

ξ1^,..., ;

{ ^ε}

ε x = y∈R x−y ≤

U ( ) ⁿ - domknięte ε otoczenie punktu x;

(6)

{^x ^U ⁽^x^*) ^F⁽^x⁾ ^F⁽^x^*)}

M = ∈ _ε = - zbiór lokalnych rozwiązań równania

*) ( ) (x F x

F = .

) , lim ( : )

( 0 N

t t t O

O t =

→ gdzie N ≠0 − niezerowa stała;

) 0 lim ( : )

( 0 =

→ t

t t o

o

t ;

I – macierz jednostkowa;

A

det − wyznacznik macierzy;

A

rank − rząd (maksymalna liczba liniowo niezależnych wierszy lub kolumn) macierzy A;

A − macierz transponowana macierzy A; T

(Rⁿ,R^m) − przestrzeń operatorów liniowych działających z R w ⁿ R ; ^m

{

⁰

}

Ker Λ= x∈Rⁿ Λx= − jądro danego liniowego operatora; Λ:Rⁿ →R^m; }

: {

ImΛ= y∈R^m ∃x∈Rⁿ y=Λx − obraz liniowego operatora Λ:Rⁿ →R^m;

m p

n n

n R R R

R

Q × × × →

4 4

4 3

4 4

4 2

1 K

: jest odwzorowaniem p−liniowym jeśli jest liniowe ze względu na każdą zmienną z osobna przy pozostałych ustalonych;

[^h ^h^p]⁻

Q ₁,..., działanie p-liniowego odwzorowania Q na element (^{h ,...,}¹ ^h^p)^,

,p i R

h_i ∈ ⁿ, =1 ; dla h1 =h2 =L=h_p odwzorowanie p−liniowe będzie postaci

[ ]^h ^p

Q ;

[]^p

Q⋅ - odwzorowanie stopniap ( p -forma);

) , ( ⁿ ^m

p R R

Q − przestrzeń odwzorowań stopnia p (p-form) działających z R w ⁿ R ; ^m

{

[ ] ⁰

}

Ker^pQ= x∈Rⁿ Qx ^p = ₋ p-jądro określonego na R odwzorowania stopnia p; ⁿ Rn

x*∈ − rozwiązanie zadania optymalizacji;

) ( ) ,

( ⁿ ^m ^p ⁿ

p R R C R

C = − klasa odwzorowań p-krotnie różniczkowalnych w sposób ciągły z przestrzeni R w ⁿ R ; ^m

)

)(

( x

F ^r − r-ta pochodna odwzorowania F w punkcie x;

(7)

Tradycyjnie w literaturze pochodne wyższych rzędów odwzorowania F:Rⁿ →R^m przedstawia się w postaci macierzowej lub tensorowej jednakże w niniejszej pracy zostały wprowadzone nowe oznaczenia dla tych pochodnych. Będą one przedstawiane w postaci wektorowej. Postać ta jest przystosowana do algorytmów prezentowanych w pracy (np. algorytm wyznaczania liniowej zależności lub niezależności tensorów wyższych pochodnych). Ponadto dany sposób przedstawiania pochodnych wyższych rzędów daje możliwość efektywnego konstruowania elementów typu

p k

h x

F⁽^p⁾( *)[ ]^k, =1,..., , co trudno byłoby uzyskać korzystająć ze zwykłych macierzowych lub tensorowych przedstawień pochodnych.

W niniejszej pracy będą używane następujące oznaczenia:

















=

) ( ...

) ( )

(

1

x f

x f x F

m

,

















∂

′ =

n m m

n

x x f x

x f

x x f x

x f x

F

) ... (

)

( ... ...

...

) ... (

) ( )

(

1

1 1

1

[ ]





























∂

















∂

=















′′

′′ =

n n

m n

m

n m m

n n n

n

m

x x

x f x

x x f

x x

x f x

x x f

x x

x f x

x x f

x x

x f x

x x f

x f

x f x F

) ... (

) (

...

) ... (

) (

...

) ... (

) (

...

) ... (

) (

) ( ...

) ( )

(

2

1 2

1 1 2

1 2

1 1 2

1 1

1 2

1

lub zgodnie z tym co zostało napisane powyżej w postaci wektorowej













































∂

 ∂













∂

























∂

 ∂













∂

′′ =

n n

m n

m m

m

n

n n n

n n

x x

x f x

x x f x

x x f

x x

x f x

x x f x x

x f x

x x f x

F

) ,..., (

) , (

)

;...; ( ) ,..., (

) , (

) (

....

) ,..., (

) , (

)

;...; ( ) ,..., (

) , (

) ( )

(

2

2 2

1 2

2 1 2

1 1 2

1 2

2 1 2

1 1 2

2 1

1 2

1 1

1 2

4 4 4 4 4 4 4 4 4 4 4 4

4 8

4 4 4 4 4 4 4 4 4 4 4 4

4 7

6

(8)

ogólnie

{ {

{ { 



















































∂

 ∂













































∂

 ∂











=

−

− −

−

− −

−

− −

−

3 2 1 3

2 1 4

4 4 4 4

4 8

4 4 4 4 4

4 7

6

4 4 3 4

4 2 1 4

4 3 4

4 2 1

M

3 2 1 3

2 1 4

4 4 4 4

4 8

4 4 4 4 4

4 7

6

4 4 3 4

4 2 1 4

4 3 4

4 2 1

nawiasów k k k

n

razy k

n m k

razy k

m k

nawiasów k

nawiasów k k k

n

razy k

n k

razy k k

nawiasów k k

x x x x

x f x

x x x

x f

x x x x

x f x

x x x

x f

x F

....

...

. ...

;...;

...

;...;

...

) ,..., (

...

) ... (

....

...

. ...

;...;

...

;...;

...

) ,..., (

...

) ... (

) (

1 1 1

1 1

1 1 1

1

) (

ewentualnie w formie skróconej:

{

{ 





















′ 













∂

 ∂



















′ 













∂

 ∂











=

−

3 2 1 M

3 2 1

nawiasów k ik i i i

m k

nawiasów k

nawiasów k ik i i i

k

nawiasów k k

x x x x

x f

x x x x

x f

x F

... ....

) ... (

... ....

) ... (

) (

1 3

2 1

1

1 3

2 1

1 1

) (

Działanie odwzorowania stopnia 2 na elemencie h∈Rⁿ wyznaczone jest następująco:

[ ] [ ]

[ ] [ ] [ ]

[ ] ^^















′′

 =















′′

′′ =

h h x f

h h x f h

h x f

h x f h

x F

m

m ( ) ,

...

, ) (

) ( ...

) ( )

(

1 1

2 .

Można zatem ogólnie zapisać przy pomocy wzoru rekurencyjnego:

(^f ^x ^h )^h

h x

f ⁽^p⁾( )[ ]^k = ⁽^p⁾( )[ ]^k⁻¹ np. dla k =1 mamy





















































∂

 ∂









∂

 ∂





















∂

 ∂









∂





































∂

 ∂









∂

 ∂





















∂

 ∂









∂

′′′ =

n n n

m n

n m n

m n

n m n

m n

m m

n

n n n n

n n

n

n n n

n

x x x

x f x x x

x f x

x x

x f x x x

x f x

x x

x f x x x

x f x

x x

x f x x x

x f

x x x

x f x

x x

x f x

x x

x f x

x x

x f x

x x

x f x

x x

x f x

x x

x f x x x

x f

x F

) ,..., (

)

;...; ( ) ,..., (

)

;...; ( ) ,..., (

)

;...; ( ) ,..., (

) (

....

) ,..., ( )

;...; ( ) ,..., ( )

;...; ( ) ,..., ( ) (

) (

3

1 3

1 1 3

1 3

1 1 3

1 1 1 3

1 3

1 1 3

1 1 1 3

1 1 3

1 1

1 3

1 1

1 3

1 1 1

1 3

4 4 4 4 4 4 4 4 4

4 8

4 4 4 4 4 4 4 4 4

4 7

6 4 4 4 4 4 4 4 4 4

4 8

4 4 4 4 4 4 4 4 4

4 7

6

{

{ 123

L 4

4 3 4 4 2 1

K L

4 4 3 4 4 2 1

K L

4 4 3 4 4 2 1

K L

4 4 3 4 4 2 1

K L

K 4

4 3 4 4 2 1

K L

4 4 3 4 4 2 1

K L

4 4 3 4 4 2 1

K L

4 43 4 42 1

K 3

2 1

K

1 1

1 1 1 2

2 1

1 1 1

1 1 1 1 1 ) (

) ( )

; ( ) ;

( )

. (

;

) ; ( )

; ( ) ;

( )

] ( )[

(

− −











∂

∂ + ∂

∂ +

∂

∂ + ∂

∂ +

∂

 ∂









∂

∂ + ∂

∂ +

∂

∂ + ∂

∂ +

∂

 ∂









= 

p n

p n n n

p

p n n

p n

p n n

p

p n

p

p n

p n n p

p n p n

p n p

p p

x h x x

x h f

x x x

x h f

x x x

x h f

x x x

x f

x h x x

x h f

x x x

x h f

x x x

x h f

x x x

x h f

x f