WYKŁAD nr 4

(1)

WYKŁAD nr 4

1. Zadanie programowania nieliniowego (ZPN)

1.1 Ekstrema funkcji jednej zmiennej o ciągłych pochodnych

Przypuśćmy ze punkt jest punktem stacjonarnym funkcji , gdzie punktem stacjonarnym nazywamy punkt dla którego

R

xˆ∈ f(x)

xˆ

( )

∇f _xˆ =⁰. A./ punkt stacjonarny jest miejscem ekstremum jeżeli :

) 0 , (

) 0 (

ˆ 2 2

ˆ

⎟⎟ >

⎠

⎞

⎜⎜⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x dx x

x f d dx

x

df , i wówczas występuje minimum lokalne silne ,

) 0 , (

) 0 (

ˆ 2 2

ˆ

⎟⎟ <

⎠

⎜⎜ ⎞

⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x dx x

x f d dx

x

df , i wówczas występuje maksimum lokalne silne,

B./ punkt stacjonarny nie jest miejscem ekstremum lecz miejscem przegięcia funkcji jeżeli :

0 ) ,

, ( ) 0

(

ˆ 3 3

ˆ 2 2

ˆ

<

⎟⎟ >

⎠

⎞

⎜⎜⎝

= ⎛

⎟⎟⎠

⎞

⎜⎜⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x

x x dx

x f d dx

x df

(2)

) (x f

x ) 0

, ( ) 0 (

ˆ 2 2 ˆ

⎟⎟ <

⎠

⎜⎜ ⎞

⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x dx x

x f d dx

x df minimum

maksimum

punkt przegiecia

) 0 , ( ) 0 , ( ) 0 (

ˆ 3 3 ˆ 2 2 ˆ

⎟⎟ >

⎠

⎞

⎜⎜⎝

= ⎛

⎟⎟⎠

⎞

⎜⎜⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x

x x dx

x f d dx

x df

) 0 , ( ) 0 , ( ) 0 (

ˆ 3 3 ˆ 2 2 ˆ

⎟⎟ <

⎠

⎜⎜ ⎞

⎝

= ⎛

⎟⎟⎠

⎜⎜ ⎞

⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x

x x dx

x f d dx

x df ) 0

, ( ) 0 (

ˆ 2 2 ˆ

⎟⎟ >

⎠

⎜⎜ ⎞

⎝

= ⎛

⎟⎠

⎜ ⎞

⎝

⎛

x dx x

x f d dx

x df

Rys.1 Ekstrema i punkty przegięcia funkcji

Uogólnienie: Jeżeli funkcja ma w otoczeniu pochodne do rzędu włącznie a nadto :

) (x

f xˆ K

) 0 1 (

,.., 1 ) 0

(

ˆ ˆ

⎟⎟ ≠

⎠

⎜⎜ ⎞

⎝

− ⎛

=

⎟⎟ =

⎠

⎜⎜ ⎞

⎝

⎛

x K K x

i i

dx x f oraz d K

i dx dla

x f d

to jeżeli K jest liczbą parzystą ,

A./ funkcjaf(x) ma w punkcie minimum lokalne silne gdy xˆ ) 0

(

ˆ

⎟⎟ >

⎠

⎞

⎜⎜⎝

⎛

x K K

dx x f d

B./ funkcja f(x) ma w punkcie maksimum lokalne silne gdy xˆ ) 0

(

ˆ

⎟⎟ <

⎠

⎜⎜ ⎞

⎝

⎛

x K K

dx x f d

Jeżeli jest nieparzyste , to ekstremum funkcji w punkcie stacjonarnym nie istnieje .

K f(x) xˆ

Znając punkty stacjonarne funkcji dla znalezienia jej minimum leżącego wewnątrz zbioru Η , wystarczy zbadać wartości , jakie funkcja przyjmie w punktach stacjonarnych. Możliwość wnioskowania o tym że punkt stacjonarny jest punktem

(3)

w którym funkcja osiąga ekstremum wiąże się z wypukłością funkcji oraz wypukłością zbioru

) (x f Η .

Zbiór punktów dopuszczalnych Η w obrębie którego możemy poszukiwać punktu w którym funkcja osiąga ekstremum , jest na ogół wyznaczony przez zespół warunków ograniczających , określonych przy pomocy pewnych funkcji ograniczających :

) (x f

a./ warunki ograniczające równościowe , b./ warunki ograniczające nierównościowe.

Ad.a punkt x musi spełniać warunki równościowe , które mają postać I równań :

I i g x

g_i( )= (_i , =1,.., g(_i − stałe (1) Warunek będziemy oznaczać

{

^w ⁱ ^I

}

W⁼ = _i⁼ , =1,.., (2)

co oznacza że punkt x ma należeć do zbioru punktów spełniających (1).

Zbiór ten oznaczamy ( hiperpowierzchnie ) .Spełnienie warunku jest równoważne spełnieniu warunku .

=

Ηi x∈Η_i⁼

i=

w

Równoczesne spełnienie zespołu dwóch równań

2 2

1

1(x) g ; g (x) g

g = ( = (

oznacza że punkt x leży zarówno na hiperpowierzchni jak i na hiperpowierzchni a więc należy do zbioru będącego iloczynem zbiorów i .

=

Η1

=

Η2 Η⁼ =Η₁⁼∩Η₂⁼

=

Η1 Η₂⁼

W przypadku gdy obie funkcje g₁(x)=g(₁ ; g₂(x)=g(₂ są liniowe , hiperpowierzchnie Η₁⁼ , Η₂⁼ są płaszczyznami .

W grę wchodzą trzy możliwości :

1. płaszczyzny Η₁⁼ , Η₂⁼ są równoległe 2. płaszczyzny Η₁⁼ , Η₂⁼ pokrywają się 3. płaszczyzny Η₁⁼ , Η₂⁼ przecinają się

Ograniczenia w przypadku 1. ,2. nazywamy zdegenerowanymi . Przypadek 3. jest niezdegenerowany , zbór jest linia przecięcia płaszczyzn ,

.

=

==Η₁ ∩Η₂

Η Η₁⁼

=

Η2

Oznaczymy ogólnie przez Η zbiór punktów spełniających zespół warunków ⁼

{

^w ⁱ ^I

}

W⁼ = _i⁼ , =1,.., . Zbór ten jest iloczynem zbiorów Η_i⁼ , zatem:

(4)

(3)

=

= =∩^I _i

i Η

Η 1

Znajdowanie rozwiązania zadania optymalizacji

∈Η=

x x

f x

ZO: : ( ) (4)

sprowadza się do badania funkcji f(x) w punktach leżących w zbiorze Η⁼ . Ad.b warunki ograniczające nierównościowe mają postać zespołu nierówności :

J j

h x h

J j h x h

j j

,.., 1 , ) (

' '

' ≥ =

=

≤ ( (

Nierówność taką oznaczamy symbolem w^≤_j a ich zespół przez

{

^w ^j ^J

}

W^≤ = ^≤_j , =1,.., (5)

Przy założeniu że funkcja jest funkcją ciągłą , hiperpowierzchnia określona równaniem

) (x

f Η_i⁼

j

j x h

h (

= )

( rozdziela przestrzeń R na dwa zbiory . Zbiór ^N leżący po jednej stronie powierzchni charakteryzuje się tym że , po drugiej zaś stronie tym że

j

j x h

h (

≥ ) (

j

j x h

h ( )≤ (

j

j x h

h (

>

) (

j

j x h

h ( )≤ (

j

j x h

h ( )= (

Rys. 2 Przestrzeń R^N rozdzielona na dwa zbiory

Zbiór punktów Η spełniających warunki nierównościowe jest więc iloczynem ^≤ zbiorów Η^≤_j , j=1,..,J

(6)

≤

=

≤ =∩^I _i

i Η

Η 1

(5)

=

Η1

1≤

= Η Η2

≥

Η2

=

Η3

≤

Η3

≤

=

≤ =∩ _i

i Η

Η ³

1

Rys.3 Zbiór ^≤

=

≤=∩^I _i

i Η

Η 1

Podobnie jak w przypadku warunków równościowych może powstać sytuacja że iloczyn jest zbiorem pustym co oznacza że warunki ograniczające są sprzeczne .

≤

= Η

∩^I _i

i 1

Poszukiwanie miejsca ekstremalnego znacznie się upraszcza jeżeli zbiór Η jest zbiorem wypukłym. ≤

Definicja: Zbiór A nazywamy zbiorem wypukłym jeżeli dla oraz wynika że punkt

A x′∈ A

x′′∈

1 0 )

1

( −α ⋅ ′+α⋅ ′′ ≤α≤

′′′= x x dla

x (7)

należy też do zbioru A

Tak więc zbiór jest wypukły , jeżeli z faktu iż dwa punkty x′∈A i wynika ,że cały odcinek łączący te punkty należy też do tego zbioru .

A x′′∈

Η1

x′ x ′′

Η2

x′

x ′′

x′

x ′′

Rys.4 Przykłady zbiorów wypukłych

(6)

Η1

x′

x′′ ^Η¹

Η2

x′ x′′

Rys 5 Przykłady zbiorów które nie są wypukłe

Uwaga: Iloczyn zbiorów wypukłych jest także zbiorem wypukłym 1./ Z pojęciem wypukłości zbioru wiąże się pojecie wypukłości funkcji

Mówimy że ciągła funkcja h(x), x∈R^N jest wypukła w dół w przestrzeni R jeżeli dla dowolnych dwóch punktów N , oraz każdego

zachodzi :

RN

x′∈ x′′∈R^N

>

∈<

α 0,1

h

[ (

1−α

)

⋅x′+α⋅x′′

]

≤

(

1−α

)

⋅h(x′)+α⋅h(x′′) (8) natomiast jeżeli :

( )

[

1 x x

] (

1

)

h(x) h(x )

h −α ⋅ ′+α⋅ ′′ ≥ −α ⋅ ′ +α⋅ ′′ (9) to funkcja h(x), x∈R^N jest wypukła w górę w przestrzeni R^N

2./ W przypadku gdy warunek (8) zachodzi tylko dla dowolnych punktów , przy czym

Η x Η

x′∈ , ′′∈ Η jest zbiorem wypukłym w przestrzeni R^N to funkcję h(x) nazywamy wypukła w dół w zbiorze wypukłym Η , w przypadku warunku (9) funkcję nazywamy wypukła w górę w zbiorze wypukłym

) (x h Η ,

C./ Warunki zapewniające istnienie ekstremum globalnego

Sytuacja upraszcza się jeżeli funkcja f(x) określona w zbiorze R wszystkich liczb rzeczywistych jest wypukła w górę lub w dół.

Jeżeli funkcja jest wypukła w dół , to może mieć tylko jedno minimum będące jej minimum globalnym .

) (x f

Jeżeli funkcja jest wypukła w górę , to może mieć tylko jedno maksimum będące jej maksimum globalnym .

) (x f

Funkcja f(x) określona w zbiorzeR jest :

wypukła w dół gdy dla wszystkich x∈R , d²f(x) dx² ≥0

(7)

wypukła w górę gdy dla wszystkich x∈R , d²f(x) dx² ≤0 D./ Ekstrema lokalne niewłaściwe (spłaszczone )

Jeżeli dla wszystkich xˆ∈Ηˆ jest

(

df(x) dx

)

_ˆ_x =0 oraz w pewnym przedziale Η takim ,że Η ⊃Ηˆ , druga pochodna

(

^d²^f⁽^x⁾ ^dx²

)

^jest

ciągła , to funkcja f(x) na w przedziale Ηˆ :

a.) maksimum lokalne niewłaściwe (spłaszczone) , gdy

(

^d²^f(^x) ^dx²

)

x_ˆ ≤0 , ^x∈^H

b.) minimum lokalne niewłaściwe (spłaszczone), gdy

(

^d²^f(^x) ^dx²

)

x_ˆ ≥0 , ^x∈^H

2. Ekstrema funkcji dwu zmiennych o ciągłych pochodnych

A./ Hesjan i jego własności

Hesjanem funkcji f(x₁,x₂) w punkcie ^X ^≡

(

^x₁_,^x₂

)

nazywamy :

( )

x x

x x x

x f x

x f

x x

f x

f f

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

⎟⎟ ∂

⎠

⎜⎜ ⎞

⎝

⎛

∂

⎟⎟⎠

⎜⎜ ⎞

⎝

⎛

∂

⎟⎟ ∂

⎠

⎞

⎜⎜⎝

⎛

∂

=

∇

2 2 2

2 1

2

2 1

2 2

1 2

2 (10)

Z twierdzenia Schwarca o równości pochodnych cząstkowych mieszanych wynika że hesjan jest macierzą symetryczną .

Jeżeli utworzymy wektor ^u⁼

[

^u₁ ^u₂

]

^T to funkcję

(

u₁,u₂

)

a₁₁ u₁² 2 a₁₂u₁u₂ a₂₂ u₂²

A = ⋅ + ⋅ + ⋅ (11)

gdzie : 1,2, 1,2

ˆ

2 ⎟⎟ = =

⎠

⎞

⎜⎜

⎝

⎛

∂

≡ ∂ i j

x x a f

j x i

ij możemy zapisać jako :

(

^u ^u

)

^u

( )

^f ^u

A ₁, ₂ = ^T ⋅ ∇² _x_ˆ ⋅ (12)

co oznacza że funkcja jest formą kwadratową względem wektora u o macierzy symetrycznej

(

u₁,u₂

A

)

( )

∇²f x_ˆ.

(8)

B./ Istnienie i postać ekstremum funkcji f(x₁,x₂) w punkcie stacjonarnym xˆ zależy od charakteru formy kwadratowej ^A

(

^u₁^,u₂

)

a ściślej od jej określoności lub półokreśloności .

C./ Jeżeli dla wszystkich wektorów u≠0 zachodzi nierówność :

1./

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u >

u

A ^T _x to (macierz

( )

∇²f x_ˆ ) forma kwadratowa ^A

(

^u₁^,u₂

)

jest dodatnio określona ,

2./

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u <

u

A ^T _x to (macierz

( )

∇²f x_ˆ ) forma kwadratowa A

(

u₁,u₂

)

jest ujemnie określona ,

D./ Jeżeli dla wszystkich wektorów u≠0 zachodzi nierówność:

1./

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u ≥

u

A ^T _x i istnieje taki wektor u≠0 że

( )

∇2 ˆ ⋅ =⁰

⋅ f u

u^T _x to (macierz

( )

∇²f x_ˆ ) forma kwadratowa jest dodatnio półokreślona ,

(

^u₁^,u₂

A

)

2./

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u ≤

u

A ^T _x i istnieje taki wektor u≠0 że

( )

∇2 ˆ ⋅ =⁰

⋅ f u

u^T _x to (macierz

( )

∇²f x_ˆ ) forma kwadratowa jest ujemnie półokreślona

(

^u₁^,u₂

A

)

E./ W szczególności , jeżeli forma kwadratowa ^A

(

^u₁^,u₂

)

jest dodatnio lub ujemnie półokreślona zaś dla wszystkich wektorów u≠0 zachodzi równość u^T ⋅

( )

∇2f _xˆ ⋅u =⁰ , to o formie kwadratowej ^A

(

^u₁^,u₂

)

^mówimy

że jest tożsamościowo równa zero .

W takim przypadku hesjan

( )

∇²f x_ˆ jest macierzą zerową .

F./ Możemy zawsze dokonać takiego obrotu układu o współrzędnych

[

u₁ u₂

]

że w nowym układzie o współrzędnych

[

u₁′ u₂′

]

formę kwadratową A

(

u₁,u₂

)

możemy zapisać w postaci :

(

u₁,u₂

)

A =A′

(

u₁′,u₂′

)

=ξ₁⋅u₁′²+ξ₂ ⋅u₂′² (13) w której : ξ₁ ,ξ₂ są wartościami własnymi macierzy

( )

∇²f x_ˆ

G./ Wielomianem charakterystycznym macierzy kwadratowej

( )

∇²f x_ˆ

nazywamy wielomian o postaci:

[ ( )

2 12

]

det )

(ξ = ∇ −ξ⋅

ϕ f (14)

Równaniem charakterystycznym macierzy kwadratowej

( )

∇²f x_ˆ

nazywamy :

0 (15)

) (ξ = ϕ

(9)

Wartościami własnymi ξ₁ ,ξ₂ macierzy

( )

∇²f x_ˆ są pierwiastki równania charakterystycznego (3.15) , zbiór wartości własnych

macierzy

{

ξ₁ ,ξ₂

}

( )

∇²f x_ˆ , nazywamy widmem tej macierzy.

Przykład 3.1

1./ funkcja dwóch zmiennych

2 2 2 1 2 1 2

1, ) 2 2

(x x x x x x

f = − ⋅ +

2./ hesjan funkcji

( )

2 4

2 2

22 2

2 1

2

2 1

2 12

2

−

= −

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

⎟⎟ ∂

⎠

⎜⎜ ⎞

⎝

⎛

∂

⎟⎟⎠

⎜⎜ ⎞

⎝

⎛

∂

⎟⎟ ∂

⎠

⎞

⎜⎜⎝

⎛

∂

=

∇

x x

x x x

x f x

x f

x x

f x

f f

3./ wielomian charakterystyczny hesjanu

[ ( ) ]

⎥

⎦

⎢ ⎤

⎣

⎡ −ξ⋅

−

= −

⋅ ξ

−

∇

= ξ

ϕ 0 1

0 1 4

2 2 det 2

1 det

)

( ²f ₂

4./ równanie charakterystyczne hesjanu ϕ(ξ)=0

( ) ( )

0 4 6 )

(

0 ) 2 ( ) 2 ( 4 2

) (

2 − ξ+ =

ξ

= ξ ϕ

=

−

⋅

−

− ξ

−

⋅ ξ

−

= ξ ϕ

5./ wartości własne hesjanu (pierwiastki równania charakterystycznego ) ξ₁ =3+ 5 ,ξ₂ =3− 5

6./ widmo hesjanu (zbiór pierwiastków charakterystycznych )

{

³⁺ ⁵ ^,³⁻ ⁵

}

H./ Ogólnie możliwa jest jedna z następujących sytuacji a./ obie wartości własne są dodatnie ,

b./ obie wartości własne są ujemne , c./ wartości własne mają przeciwne znaki ,

d./ jedna w wartości własnych jest równa zero

(10)

ad.a

1

1 x

xˆ =

2

2 x

xˆ = )

, (x₁ x₂ f

0

[

ˆ1,ˆ2

]

ˆ x x

x= ˆ )

ˆ, ˆ(

2 1 x x f

Rys.6 Paraboloida eliptyczna wypukła w dół

Jeżeli obie wartości własne hesjanu są dodatnie wówczas zachodzi przypadek C.1

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u >

u

A ^T _x ,

(macierz

( )

(

u₁,u₂

)

jest dodatnio określona.

Obrazem graficznym funkcji jest w tym przypadku paraboloida eliptyczna wypukła w dół .

) , (x₁ x₂ f

ad.b Jeżeli obie wartości własne hesjanu są ujemne wówczas zachodzi przypadek C.2

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u <

u ^T _x

A ,

(macierz

( )

(

u₁,u₂

)

jest ujemnie określona

Obrazem graficznym funkcji jest w tym przypadku paraboloida eliptyczna wypukła w górę .

) , (x₁ x₂ f

(11)

1

1 x

xˆ =

2

2 x

xˆ = )

, (x₁ x₂ f

0

[ˆ1,ˆ2]

ˆ x x x= ˆ )

ˆ , ˆ(

2 1 x x f

Rys.7. Paraboloida eliptyczna wypukła w górę

ad.c w przypadku gdy wartości własne są różnych znaków , forma kwadratowa przyjmuje zarówno wartości dodatnie jak i ujemne .

Forma kwadratowa jest zatem nieokreślona a także nieokreślony jest hesjan

( )

∇²f x_ˆ . Obrazem graficznym funkcji jest w tym przypadku paraboloida hiperboliczna jak na rysunku poniżej.

) , (x₁ x₂ f

x1

) , (x₁ x₂ f

0 x2

Rys.8 Hesjan nieokreślony Punkt siodłowy

[

^x₁^{, x}₂

]

(12)

ad.a

1.) Jeżeli jedna z wartości własnych jest równa zero a druga jest dodatnia to zachodzi przypadek D.1 ,

1

x1

0 x¹²

12

x

22

x A

( ) [ ] [

1 2³

]

2 2 2 1 1 1 1 2

1,ˆ , ˆ , , ˆ ,

ˆ xˆ x x x x x x x

f ∈ ∈

) , (x₁ x₂ f

Rys. 9 Minimum niewłaściwe (spłaszczone) funkcji f(x₁,x₂)

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u ≥

u

A ^T _x (macierz

( )

∇²f x_ˆ ) forma kwadratowa

jest dodatnio półokreślona .Dodatnia półokreśloność wskazywać może na istnienie minimum niewłaściwego (spłaszczonego) funkcji . Aproksymacja lokalna funkcji walcem hiperbolicznym leżącym i wypukłym w dół wykazuje istnienie minimum niewłaściwego (spłaszczonego) .

(

u₁,u₂

)

A

) , (x₁ x₂ f )

, (x₁ x₂ f

W przypadku A. w zbiorze Ηˆ istnieje minimum niewłaściwe( rys. 9) W przypadku B w zbiorze Ηˆ minimum niewłaściwe nie istnieje ( rys. 10).

2.) Jeżeli jedna z wartości własnych jest równa zero a druga jest ujemna to zachodzi przypadek D.2

(

^,

) ( )

2 ˆ ⁰

2

1 u =u ⋅ ∇ f ⋅u ≤

u

A ^T _x (macierz

( )

(

u₁,u₂

)

jest ujemnie półokreślona. Ujemna półokreśloność wskazywać może na istnienie maksimum niewłaściwego funkcji f(x₁,x₂).

(13)

) , (x₁ x₂ f

0

B

11 2

x x

1

12

x x

₂²

Rys.10. Minimum niewłaściwe (spłaszczone) nie istnieje

Aproksymacja lokalna funkcji walcem hiperbolicznym leżącym i wypukłym w górę wykazuje istnienie maksimum niewłaściwego.

) , (x₁ x₂ f

W przypadku A. w zbiorze Ηˆ istnieje maksimum niewłaściwe ( rys.11) W przypadku B. w zbiorze Ηˆ nie istnieje maksimum niewłaściwe (rys.12)

) , (x₁ x₂ f

0

Ηˆ A

11 2 x x1

22 1 x

x2

( ) [ ] [

1 ³2

]

2 2 2 1 1 1 1 2

1,ˆ , ˆ , , ˆ ,

ˆ xˆ x x x x x x x

f ∈ ∈

Rys.11. Maksimum niewłaściwe funkcji f(x₁,x₂)

(14)

1 0

x

1 21

x

1

x

2

x

₂²

) , (x₁ x₂

B

f

Rys.12. Maksimum niewłaściwe nie istnieje

I./ Warunki dostateczne istnienia ekstremum

Istnienie i postać ekstremum Hesjan

( )

∇²f x_ˆ

Wartości własne hesjanu

2 1 ,ξ ξ

Powierzchnia określona przez funkcję

) , (u₁ u₂ A Minimum

lokalne silne

dodatnio

określony 0

0

2 1

>

ξ

>

ξ paraboloida

eliptyczna wypukła w dół Istnieje w

punkcie stacjonarnym

xˆ Maksimum

lokalne silne

ujemnie

określony 0

0

2 1

<

ξ

<

ξ paraboloida

eliptyczna

wypukła w górę

Minimum lokalne niewłaściwe

dodatnio

półokreślony 0, 0

0 , 0

2 1

= ξ

≥ ξ

=

ξ walec

paraboliczny wypukły w dół Może istnieć

w otoczeniu punktu

stacjonarnego

xˆ Maksimum

Lokalne niewłaściwe

ujemnie

półokreślony 0, 0

0 , 0

2 1

= ξ

≤ ξ

=

ξ walec

paraboliczny wypukły w górę

(15)

Nie istnieje ekstremum

nieokreślony

0 , 0

2 1

>

ξ

<

ξ

<

ξ

>

ξ paraboloida

hiperboliczna

Dla ustalenia typu formy nie zachodzi konieczność rozwiązywania równania charakterystycznego gdyż nie musimy znać dokładnie wartości własnych

lecz tylko ich znaki. Można wykazać że jeżeli : )

, (u₁ u₂ A

2 1 ,ξ ξ

I.1.) 0 0

2

2 1

2 22

2 12 2 2 12 22 11 ˆ

12 2

11 ⎟⎟ >

⎠

⎞

⎜⎜⎝

⎛

∂

− ∂

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

⋅ ∂

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

= ∂

−

⎟ >

⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

= ∂

x x

f x

a f a a x oraz

a f

x

to forma kwadratowa A(u₁,u₂) jest dodatnio określona ,

I.2.) 0 0

2

2 1

2 2

2 2 2 1 2 2

12 22 11 ˆ

2 1 2

11 ⎟⎟ >

⎠

⎞

⎜⎜⎝

⎛

∂

− ∂

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

⋅ ∂

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

= ∂

−

⎟ <

⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

= ∂

x x

f x

a f a a x oraz

a f

x

to forma kwadratowa A(u₁,u₂) jest ujemnie określona .

Warunek dostateczny istnienia ekstremum funkcji dwóch zmiennych

Jeżeli funkcja ma ciągłe pochodne do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego to w tym punkcie funkcja osiąga

) , (x₁ x₂ f

xˆ

minimum silne gdy są spełnione warunki I.1.

maksimum silne gdy są spełnione warunki I.2.

Uwaga: Dotychczas mówiliśmy tylko o ekstremach lokalnych .

Analogicznie jak w przypadkach funkcji jednej zmiennej sytuacja znacznie się upraszcza gdy dana funkcja jest wypukła w dół bądź wypukła w górę .Jeżeli tylko występuje odpowiednie ekstremum to jest ono jednocześnie ekstremum globalnym .

Można wykazać że funkcja f(x₁,x₂) określona w przestrzeni R² jest funkcją a.) wypukłą w dół jeżeli dla wszystkich x∈R² hesjan

( )

∇²f x_ˆ jest dodatnio

półokreślony ,

b.) wypukłą w górę jeżeli dla wszystkich x∈R² hesjan

( )

∇²f x_ˆ jest ujemnie półokreślony ,

c.) silnie wypukłą w dół jeżeli dla wszystkich x∈R² hesjan

( )

∇²f x_ˆ jest dodatnio określony ,

d.) silnie wypukłą w górę jeżeli dla wszystkich x∈R² hesjan

( )

∇²f x_ˆ jest ujemnie określony

(16)

J./ Warunki dostateczne istnienia ekstremum niewłaściwego

Jeżeli wszystkie punkty stacjonarne funkcji xˆ f(x₁,x₂) tworzą zbiór spójny Hˆ oraz w pewnym zbiorze takim , że wszystkie pochodne rzędu drugiego funkcji są ciągłe to funkcja ta ma w zbiorze

H1 H Hˆ

1 ⊃ )

, (x₁ x₂

f Hˆ :

-minimum niewłaściwe lokalne , gdy hesjan jest dodatnio półokreślony dla

1 , H x∈

-maksimum niewłaściwe lokalne , gdy hesjan jest ujemnie półokreślony dla

1 . H x∈

Definicja : Przez zbiór spójny rozumiemy taki zbiór punktów , że każde dwa dowolnie wybrane punkty z tego zbioru możemy połączyć taka krzywą ciągłą której wszystkie punkty należą do danego zbioru.

3.3 Ekstrema funkcji wielu zmiennych o ciągłych pochodnych cząstkowych

A./ Postać hesjanu dla funkcji wielu zmiennych

( )

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

• ∂

⎟⎟ •

⎠

⎜⎜ ⎞

⎝

⎛

∂

⎟⎟ ∂

⎠

⎜⎜ ⎞

⎝

⎛

∂

•

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

• ∂

⎟⎟ •

⎠

⎞

⎜⎜⎝

⎛

∂

⎟⎟ ∂

⎠

⎞

⎜⎜⎝

⎛

∂

=

∇

n x n x

n x

n x x

x x

x f x

x f

x x

f x

x f x

f

ˆ 2 2

2 ˆ 2

1 ˆ 2

2 ˆ 1

2

ˆ 2 1 2

ˆ

2 (16)

B./ Warunki dostateczne istnienia ekstremum funkcji f(x₁x₂),x∈R^N w jej punkcie stacjonarnym xˆ

Istnienie i postać ekstremum Hesjan

( )

∇²f x_ˆ

Wartości własne hesjanu

ξn

ξ ξ₁ , ₂,....,

Powierzchnia określona przez funkcję A Istnieje w

punkcie stacjonarnym

Minimum Lokalne silne

dodatnio określony

0 ...., , 0 0

2 1

>

ξ

>

ξ

>

ξ

n

paraboloida eliptyczna wypukła w dół

(17)

xˆ ^Maksimum Lokalne silne

ujemnie określony

0 ,..., 0 0

2 1

>

ξ

<

ξ

<

ξ

n

paraboloida eliptyczna

wypukła w górę

Minimum lokalne niewłaściwe

dodatnio półokreślony

Jedna spośród wartości własnych

0 ,....,

1 ξ =

ξ _n

a pozostałe są nieujemne

walec paraboliczny wypukły w dół Może istnieć

w otoczeniu punktu

stacjonarnego xˆ

Maksimum Lokalne niewłaściwe

ujemnie półokreślony

Jedna spośród wartości własnych

0 ,....,

1 ξ =

ξ _n

a pozostałe są niedodatnie

walec paraboliczny

wypukły w górę

Nie istnieje ekstremum

nieokreślony co najmniej jedna jest dodatnia i co najmniej jedna ujemna

paraboloida hiperboliczna

Podobnie jak w przypadku N =2 , aby stwierdzić rodzaj określoności bądź półokreśloności hesjanu , nie istnieje konieczność rozwiązywania równania charakterystycznego . Mianowicie przy badaniu określoności hesjanu

(

∇²f

)

x_ˆ

można skorzystać ze wzoru Sylwestra o określoności form kwadratowych.

Aby z tego wzoru skorzystać , oznaczamy poszczególne podwyznaczniki hesjanu w następujący sposób :

•

⎥⎥

⎥

⎦

⎤

⎢⎢

⎢

⎣

⎡

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

⎟⎟ ∂

⎠

⎞

⎜⎜⎝

⎛

∂

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

⎟ ∂

⎟

⎠

⎞

⎜⎜

⎝

⎛

∂

=

∆

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

= ∂

∆

x x

x

x f x

x f

x x

f x

x x f

ˆ 22 2

2 ˆ 1

2

2 ˆ 1

2

ˆ 2 1 2

2

1 ˆ 2 1

) ˆ (

ˆ) (

(17)

(18)

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡

⎟⎟⎠

⎞

⎜⎜⎝

⎛

∂

• ∂

⎟⎟ •

⎠

⎞

⎜⎜⎝

⎛

∂

⎟⎟ ∂

⎠

⎞

⎜⎜⎝

⎛

∂

∂ • • • • •

⎟⎟⎠

⎜⎜ ⎞

⎝

⎛

∂

• ∂

⎟⎟ •

⎠

⎜⎜ ⎞

⎝

⎛

∂

⎟⎟ ∂

⎠

⎞

⎜⎜⎝

⎛

∂

=

∆

n x n x

n x

n x x x

n

x f x

x f

x x

f x

x f x

f

x

ˆ 2 2

2 ˆ 2

1 ˆ 2

2 ˆ 1

2

ˆ 12 2

ˆ) (

Wykorzystując podwyznaczniki ∆₁(xˆ),∆₂(xˆ),....,∆_n(xˆ) na podstawie twierdzenia Sylwestra można sformułować warunki dostateczne istnienia ekstremum funkcji

zmiennych : N

Funkcja zmiennych mająca ciągłe pochodne cząstkowe do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego :

N x f( ),

xˆ 1.) ma w punkcie xˆ minimum lokalne silne , gdy

N n

dla

n(xˆ)>0 =1,..,

∆ tj. gdy hesjan w punkcie jest dodatnio

określony ,

xˆ 2.) ma w punkcie xˆ maksimum lokalne silne , gdy

N n

dla

n x

n (ˆ) 0 1,..,

) 1

(− ⋅∆ > = tj. gdy hesjan w punkcie jest ujemnie określony,

xˆ 3.) nie można rozstrzygnąć czy istnieje ekstremum w punkcie xˆ gdy : 3.1) ∆_n(xˆ)≥0 dla n=1,..,N−1 , ∆_N(xˆ)=0

3.2) (−1)ⁿ⋅∆_n(xˆ)≥0 dla n=1,..,N−1 , ∆_N(xˆ)=0 tj. gdy hesjan w punkcie jest dodatnio lub ujemnie półokreślony , xˆ 4.) nie ma w punkcie ekstremum gdy nie są spełnione warunki 3.1 lub 3.2

tj. gdy hesjan w punkcie nie jest określony . xˆ

xˆ

3.4 Warunki optymalności programowania nieliniowego

Niech będzie dane zadanie programowania nieliniowego (ZPN) o postaci :

0

) ( min ) (

X

f f

∈

=

x

x x

gdzie : (17)

⎭⎬

⎫

⎩⎨

⎧

+

=

= ≤

m u

i g

u i X g

i i

,.., 1 ,

0 ) (

,.., 1 , 0 ) ( :

0 x

x x

: R R1

f x= ⁿ → jest funkcją kryterialną zadania :R R1

g_i ⁿ → są funkcjami przedstawiającymi ograniczenia gi

f , są funkcjami różniczkowalnymi .

(19)

Warunki Kuhna –Tuckera

Dla zadania optymalizacji (17) sformułowanego powyżej warunki Kuhna-Tuckera przedstawiają się następująco :

1.) xˆ∈X₀ , czyli jest punktem dopuszczalnym , jeżeli

istnieją λˆ_i ≥0,i=1,..,u ( mnożniki Lagrange’a) oraz istnieją λˆ_i ,i=1+u,..,m o nieoznaczonym znaku takie , że :

2.)

∑

oraz (18)

=

∇ λ +

∇ ^m

i

i g

f

1

0 ˆ) ˆ ( ˆ)

(x x

3.) λˆ_ig_i(xˆ)=0, i=1,..,u (19) Inna postać warunków Kuhna-Tuckera :

Dla zadania programowania nieliniowego (1) utwórzmy funkcję Lagrange’a w postaci :

(20)

∑

=

λ +

= ^m

i i ig f

L

1

) ( )

( )

(x,λ x x

Korzystając z (20) warunki konieczne można zapisać w postaci :

(21)

0 0 ˆ) (ˆ =

∇_xL x ,λ

(22)

ˆ) (ˆ ≤

∇_λL x,λ

0 ˆ) (ˆ

ˆ,∇ x,λ =

λ _λL (23)

(24)

0

0 ˆ ≥

λ

∇ x oznacza gradient funkcji Lagrange’a względem wektora , x

∇ λ oznacza gradient funkcji Lagrange’a względem wektora λ

Jeżeli w zbiorze ograniczeń wyróżniono w sposób jawny ograniczenia na zmienne decyzyjne x≥0 wówczas warunki Kuhna-Tuckera przyjmą postać :

(25)

ˆ) (ˆ ≥

∇_xL x ,λ

0 ˆ) (ˆ ˆ,∇ x,λ =

x _xL (26)

(27)

ˆ ≥0 x

(28)

0 ˆ) (ˆ ≤

∇_λL x,λ

0 ˆ) (ˆ

ˆ,∇ x,λ =

λ _λL (29)

(30)

ˆ ≥0 λ

gdzie funkcja Lagrange’a jest zdefiniowana jak poprzednio .