• Nie Znaleziono Wyników

WYKŁAD nr 4

N/A
N/A
Protected

Academic year: 2021

Share "WYKŁAD nr 4"

Copied!
19
0
0

Pełen tekst

(1)

WYKŁAD nr 4

1. Zadanie programowania nieliniowego (ZPN)

1.1 Ekstrema funkcji jednej zmiennej o ciągłych pochodnych

Przypuśćmy ze punkt jest punktem stacjonarnym funkcji , gdzie punktem stacjonarnym nazywamy punkt dla którego

R

xˆ∈ f(x)

( )

f xˆ =0. A./ punkt stacjonarny jest miejscem ekstremum jeżeli :

) 0 , (

) 0 (

ˆ 2 2

ˆ

⎟⎟ >

⎜⎜⎝

= ⎛

⎟⎠

⎜ ⎞

x dx x

x f d dx

x

df , i wówczas występuje minimum lokalne silne ,

) 0 , (

) 0 (

ˆ 2 2

ˆ

⎟⎟ <

⎜⎜ ⎞

= ⎛

⎟⎠

⎜ ⎞

x dx x

x f d dx

x

df , i wówczas występuje maksimum lokalne silne,

B./ punkt stacjonarny nie jest miejscem ekstremum lecz miejscem przegięcia funkcji jeżeli :

0 ) ,

, ( ) 0

, ( ) 0

(

ˆ 3 3

ˆ 2 2

ˆ

<

⎟⎟ >

⎜⎜⎝

= ⎛

⎟⎟⎠

⎜⎜⎝

= ⎛

⎟⎠

⎜ ⎞

x

x x dx

x f d dx

x f d dx

x df

(2)

) (x f

x ) 0

, ( ) 0 (

ˆ 2 2 ˆ

⎟⎟ <

⎜⎜

=

x dx x

x f d dx

x df minimum

maksimum

punkt przegiecia

punkt przegiecia

) 0 , ( ) 0 , ( ) 0 (

ˆ 3 3 ˆ 2 2 ˆ

⎟⎟ >

⎜⎜

=

⎟⎟

⎜⎜

=

x

x x dx

x f d dx

x f d dx

x df

) 0 , ( ) 0 , ( ) 0 (

ˆ 3 3 ˆ 2 2 ˆ

⎟⎟ <

⎜⎜

=

⎟⎟

⎜⎜

=

x

x x dx

x f d dx

x f d dx

x df ) 0

, ( ) 0 (

ˆ 2 2 ˆ

⎟⎟ >

⎜⎜

=

x dx x

x f d dx

x df

Rys.1 Ekstrema i punkty przegięcia funkcji

Uogólnienie: Jeżeli funkcja ma w otoczeniu pochodne do rzędu włącznie a nadto :

) (x

f K

) 0 1 (

,.., 1 ) 0

(

ˆ ˆ

⎟⎟ ≠

⎜⎜ ⎞

− ⎛

=

⎟⎟ =

⎜⎜ ⎞

x K K x

i i

dx x f oraz d K

i dx dla

x f d

to jeżeli K jest liczbą parzystą ,

A./ funkcjaf(x) ma w punkcie minimum lokalne silne gdy ) 0

(

ˆ

⎟⎟ >

⎜⎜⎝

x K K

dx x f d

B./ funkcja f(x) ma w punkcie maksimum lokalne silne gdy ) 0

(

ˆ

⎟⎟ <

⎜⎜ ⎞

x K K

dx x f d

Jeżeli jest nieparzyste , to ekstremum funkcji w punkcie stacjonarnym nie istnieje .

K f(x)

Znając punkty stacjonarne funkcji dla znalezienia jej minimum leżącego wewnątrz zbioru Η , wystarczy zbadać wartości , jakie funkcja przyjmie w punktach stacjonarnych. Możliwość wnioskowania o tym że punkt stacjonarny jest punktem

(3)

w którym funkcja osiąga ekstremum wiąże się z wypukłością funkcji oraz wypukłością zbioru

) (x f Η .

Zbiór punktów dopuszczalnych Η w obrębie którego możemy poszukiwać punktu w którym funkcja osiąga ekstremum , jest na ogół wyznaczony przez zespół warunków ograniczających , określonych przy pomocy pewnych funkcji ograniczających :

) (x f

a./ warunki ograniczające równościowe , b./ warunki ograniczające nierównościowe.

Ad.a punkt x musi spełniać warunki równościowe , które mają postać I równań :

I i g x

gi( )= (i , =1,.., g(i − stałe (1) Warunek będziemy oznaczać

{

w i I

}

W= = i= , =1,.., (2)

co oznacza że punkt x ma należeć do zbioru punktów spełniających (1).

Zbiór ten oznaczamy ( hiperpowierzchnie ) .Spełnienie warunku jest równoważne spełnieniu warunku .

=

Ηi xΗi=

i=

w

Równoczesne spełnienie zespołu dwóch równań

2 2

1

1(x) g ; g (x) g

g = ( = (

oznacza że punkt x leży zarówno na hiperpowierzchni jak i na hiperpowierzchni a więc należy do zbioru będącego iloczynem zbiorów i .

=

Η1

=

Η2 Η= =Η1=Η2=

=

Η1 Η2=

W przypadku gdy obie funkcje g1(x)=g(1 ; g2(x)=g(2 są liniowe , hiperpowierzchnie Η1= , Η2= są płaszczyznami .

W grę wchodzą trzy możliwości :

1. płaszczyzny Η1= , Η2= są równoległe 2. płaszczyzny Η1= , Η2= pokrywają się 3. płaszczyzny Η1= , Η2= przecinają się

Ograniczenia w przypadku 1. ,2. nazywamy zdegenerowanymi . Przypadek 3. jest niezdegenerowany , zbór jest linia przecięcia płaszczyzn ,

.

=

=

==Η1Η2

Η Η1=

=

Η2

Oznaczymy ogólnie przez Η zbiór punktów spełniających zespół warunków =

{

w i I

}

W= = i= , =1,.., . Zbór ten jest iloczynem zbiorów Ηi= , zatem:

(4)

(3)

=

=

= =∩I i

i Η

Η 1

Znajdowanie rozwiązania zadania optymalizacji

∈Η=

x x

f x

ZO: : ( ) (4)

sprowadza się do badania funkcji f(x) w punktach leżących w zbiorze Η= . Ad.b warunki ograniczające nierównościowe mają postać zespołu nierówności :

J j

h x h

J j h x h

j j

j j

,.., 1 , ) (

,.., 1 , ) (

' '

' ≥ =

=

≤ ( (

Nierówność taką oznaczamy symbolem wj a ich zespół przez

{

w j J

}

W = j , =1,.., (5)

Przy założeniu że funkcja jest funkcją ciągłą , hiperpowierzchnia określona równaniem

) (x

f Ηi=

j

j x h

h (

= )

( rozdziela przestrzeń R na dwa zbiory . Zbiór N leżący po jednej stronie powierzchni charakteryzuje się tym że , po drugiej zaś stronie tym że

j

j x h

h (

≥ ) (

j

j x h

h ( )≤ (

j

j x h

h (

>

) (

j

j x h

h ( )≤ (

j

j x h

h ( )= (

Rys. 2 Przestrzeń RN rozdzielona na dwa zbiory

Zbiór punktów Η spełniających warunki nierównościowe jest więc iloczynem zbiorów Ηj , j=1,..,J

(6)

=

=∩I i

i Η

Η 1

(5)

=

Η1

1

= Η Η2

Η2

=

Η3

Η3

=

=∩ i

i Η

Η 3

1

Rys.3 Zbiór

=

=∩I i

i Η

Η 1

Podobnie jak w przypadku warunków równościowych może powstać sytuacja że iloczyn jest zbiorem pustym co oznacza że warunki ograniczające są sprzeczne .

= Η

I i

i 1

Poszukiwanie miejsca ekstremalnego znacznie się upraszcza jeżeli zbiór Η jest zbiorem wypukłym.

Definicja: Zbiór A nazywamy zbiorem wypukłym jeżeli dla oraz wynika że punkt

A x′∈ A

x′′∈

1 0 )

1

( −α ⋅ ′+α⋅ ′′ ≤α≤

′′′= x x dla

x (7)

należy też do zbioru A

Tak więc zbiór jest wypukły , jeżeli z faktu iż dwa punkty x′∈A i wynika ,że cały odcinek łączący te punkty należy też do tego zbioru .

A x′′∈

Η1

x′ x ′′

Η2

x′

x ′′

x′

x ′′

Rys.4 Przykłady zbiorów wypukłych

(6)

Η1

x′

x′′ Η1

Η2

x′ x′′

x′ x′′

Rys 5 Przykłady zbiorów które nie są wypukłe

Uwaga: Iloczyn zbiorów wypukłych jest także zbiorem wypukłym 1./ Z pojęciem wypukłości zbioru wiąże się pojecie wypukłości funkcji

Mówimy że ciągła funkcja h(x), xRN jest wypukła w dół w przestrzeni R jeżeli dla dowolnych dwóch punktów N , oraz każdego

zachodzi :

RN

x′∈ x′′∈RN

>

∈<

α 0,1

h

[ (

1−α

)

x′+α⋅x′′

]

(

1−α

)

h(x′)+α⋅h(x′′) (8) natomiast jeżeli :

( )

[

1 x x

] (

1

)

h(x) h(x )

h −α ⋅ ′+α⋅ ′′ ≥ −α ⋅ ′ +α⋅ ′′ (9) to funkcja h(x), xRN jest wypukła w górę w przestrzeni RN

2./ W przypadku gdy warunek (8) zachodzi tylko dla dowolnych punktów , przy czym

Η x Η

x′∈ , ′′∈ Η jest zbiorem wypukłym w przestrzeni RN to funkcję h(x) nazywamy wypukła w dół w zbiorze wypukłym Η , w przypadku warunku (9) funkcję nazywamy wypukła w górę w zbiorze wypukłym

) (x h Η ,

C./ Warunki zapewniające istnienie ekstremum globalnego

Sytuacja upraszcza się jeżeli funkcja f(x) określona w zbiorze R wszystkich liczb rzeczywistych jest wypukła w górę lub w dół.

Jeżeli funkcja jest wypukła w dół , to może mieć tylko jedno minimum będące jej minimum globalnym .

) (x f

Jeżeli funkcja jest wypukła w górę , to może mieć tylko jedno maksimum będące jej maksimum globalnym .

) (x f

Funkcja f(x) określona w zbiorzeR jest :

wypukła w dół gdy dla wszystkich xR , d2f(x) dx2 ≥0

(7)

wypukła w górę gdy dla wszystkich xR , d2f(x) dx2 ≤0 D./ Ekstrema lokalne niewłaściwe (spłaszczone )

Jeżeli dla wszystkich xˆ∈Ηˆ jest

(

df(x) dx

)

ˆx =0 oraz w pewnym przedziale Η takim ,że ΗΗˆ , druga pochodna

(

d2f(x) dx2

)

jest

ciągła , to funkcja f(x) na w przedziale Ηˆ :

a.) maksimum lokalne niewłaściwe (spłaszczone) , gdy

(

d2f(x) dx2

)

xˆ ≤0 , xH

b.) minimum lokalne niewłaściwe (spłaszczone), gdy

(

d2f(x) dx2

)

xˆ ≥0 , xH

2. Ekstrema funkcji dwu zmiennych o ciągłych pochodnych

A./ Hesjan i jego własności

Hesjanem funkcji f(x1,x2) w punkcie X

(

x1,x2

)

nazywamy :

( )

x x

x x x

x f x

x f

x x

f x

f f

⎟⎟⎠

⎜⎜⎝

⎟⎟ ∂

⎜⎜ ⎞

⎟⎟⎠

⎜⎜ ⎞

⎟⎟ ∂

⎜⎜⎝

=

2 2 2

2 1

2

2 1

2 2

1 2

2 (10)

Z twierdzenia Schwarca o równości pochodnych cząstkowych mieszanych wynika że hesjan jest macierzą symetryczną .

Jeżeli utworzymy wektor u=

[

u1 u2

]

T to funkcję

(

u1,u2

)

a11 u12 2 a12u1u2 a22 u22

A = ⋅ + ⋅ + ⋅ (11)

gdzie : 1,2, 1,2

ˆ

2 ⎟⎟ = =

⎜⎜

≡ ∂ i j

x x a f

j x i

ij możemy zapisać jako :

(

u u

)

u

( )

f u

A 1, 2 = T ⋅ ∇2 xˆ ⋅ (12)

co oznacza że funkcja jest formą kwadratową względem wektora u o macierzy symetrycznej

(

u1,u2

A

)

( )

2f xˆ.

(8)

B./ Istnienie i postać ekstremum funkcji f(x1,x2) w punkcie stacjonarnym zależy od charakteru formy kwadratowej A

(

u1,u2

)

a ściślej od jej określoności lub półokreśloności .

C./ Jeżeli dla wszystkich wektorów u≠0 zachodzi nierówność :

1./

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu >

u

A T x to (macierz

( )

2f xˆ ) forma kwadratowa A

(

u1,u2

)

jest dodatnio określona ,

2./

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu <

u

A T x to (macierz

( )

2f xˆ ) forma kwadratowa A

(

u1,u2

)

jest ujemnie określona ,

D./ Jeżeli dla wszystkich wektorów u≠0 zachodzi nierówność:

1./

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu

u

A T x i istnieje taki wektor u≠0 że

( )

2 ˆ ⋅ =0

f u

uT x to (macierz

( )

2f xˆ ) forma kwadratowa jest dodatnio półokreślona ,

(

u1,u2

A

)

2./

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu

u

A T x i istnieje taki wektor u≠0 że

( )

2 ˆ ⋅ =0

f u

uT x to (macierz

( )

2f xˆ ) forma kwadratowa jest ujemnie półokreślona

(

u1,u2

A

)

E./ W szczególności , jeżeli forma kwadratowa A

(

u1,u2

)

jest dodatnio lub ujemnie półokreślona zaś dla wszystkich wektorów u≠0 zachodzi równość uT

( )

2f xˆu =0 , to o formie kwadratowej A

(

u1,u2

)

mówimy

że jest tożsamościowo równa zero .

W takim przypadku hesjan

( )

2f xˆ jest macierzą zerową .

F./ Możemy zawsze dokonać takiego obrotu układu o współrzędnych

[

u1 u2

]

że w nowym układzie o współrzędnych

[

u1u2

]

formę kwadratową A

(

u1,u2

)

możemy zapisać w postaci :

(

u1,u2

)

A =A

(

u1,u2

)

1u122u22 (13) w której : ξ12 są wartościami własnymi macierzy

( )

2f xˆ

G./ Wielomianem charakterystycznym macierzy kwadratowej

( )

2f xˆ

nazywamy wielomian o postaci:

[ ( )

2 12

]

det )

(ξ = ∇ −ξ⋅

ϕ f (14)

Równaniem charakterystycznym macierzy kwadratowej

( )

2f xˆ

nazywamy :

0 (15)

) (ξ = ϕ

(9)

Wartościami własnymi ξ12 macierzy

( )

2f xˆ są pierwiastki równania charakterystycznego (3.15) , zbiór wartości własnych

macierzy

{

ξ12

}

( )

2f xˆ , nazywamy widmem tej macierzy.

Przykład 3.1

1./ funkcja dwóch zmiennych

2 2 2 1 2 1 2

1, ) 2 2

(x x x x x x

f = − ⋅ +

2./ hesjan funkcji

( )

2 4

2 2

22 2

2 1

2

2 1

2 12

2

2

= −

⎟⎟⎠

⎜⎜⎝

⎟⎟ ∂

⎜⎜ ⎞

⎟⎟⎠

⎜⎜ ⎞

⎟⎟ ∂

⎜⎜⎝

=

x x

x x x

x f x

x f

x x

f x

f f

3./ wielomian charakterystyczny hesjanu

[ ( ) ]

⎢ ⎤

⎡ −ξ⋅

= −

⋅ ξ

= ξ

ϕ 0 1

0 1 4

2 2 det 2

1 det

)

( 2f 2

4./ równanie charakterystyczne hesjanu ϕ(ξ)=0

( ) ( )

0 4 6 )

(

0 ) 2 ( ) 2 ( 4 2

) (

2 − ξ+ =

ξ

= ξ ϕ

=

− ξ

⋅ ξ

= ξ ϕ

5./ wartości własne hesjanu (pierwiastki równania charakterystycznego ) ξ1 =3+ 5 ,ξ2 =3− 5

6./ widmo hesjanu (zbiór pierwiastków charakterystycznych )

{

3+ 5 ,3 5

}

H./ Ogólnie możliwa jest jedna z następujących sytuacji a./ obie wartości własne są dodatnie ,

b./ obie wartości własne są ujemne , c./ wartości własne mają przeciwne znaki ,

d./ jedna w wartości własnych jest równa zero

(10)

ad.a

1

1 x

xˆ =

2

2 x

xˆ = )

, (x1 x2 f

0

[

ˆ12

]

ˆ x x

x= ˆ )

ˆ, ˆ(

2 1 x x f

Rys.6 Paraboloida eliptyczna wypukła w dół

Jeżeli obie wartości własne hesjanu są dodatnie wówczas zachodzi przypadek C.1

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu >

u

A T x ,

(macierz

( )

2f xˆ ) forma kwadratowa A

(

u1,u2

)

jest dodatnio określona.

Obrazem graficznym funkcji jest w tym przypadku paraboloida eliptyczna wypukła w dół .

) , (x1 x2 f

ad.b Jeżeli obie wartości własne hesjanu są ujemne wówczas zachodzi przypadek C.2

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu <

u T x

A ,

(macierz

( )

2f xˆ ) forma kwadratowa A

(

u1,u2

)

jest ujemnie określona

Obrazem graficznym funkcji jest w tym przypadku paraboloida eliptyczna wypukła w górę .

) , (x1 x2 f

(11)

1

1 x

xˆ =

2

2 x

xˆ = )

, (x1 x2 f

0

[ˆ1,ˆ2]

ˆ x x x= ˆ )

ˆ , ˆ(

2 1 x x f

Rys.7. Paraboloida eliptyczna wypukła w górę

ad.c w przypadku gdy wartości własne są różnych znaków , forma kwadratowa przyjmuje zarówno wartości dodatnie jak i ujemne .

Forma kwadratowa jest zatem nieokreślona a także nieokreślony jest hesjan

( )

2f xˆ . Obrazem graficznym funkcji jest w tym przypadku paraboloida hiperboliczna jak na rysunku poniżej.

) , (x1 x2 f

x1

) , (x1 x2 f

0 x2

Rys.8 Hesjan nieokreślony Punkt siodłowy

[

x1, x2

]

(12)

ad.a

1.) Jeżeli jedna z wartości własnych jest równa zero a druga jest dodatnia to zachodzi przypadek D.1 ,

1

x1

0 x12

12

x

22

x A

( ) [ ] [

1 23

]

2 2 2 1 1 1 1 2

1,ˆ , ˆ , , ˆ ,

ˆ xˆ x x x x x x x

f ∈ ∈

) , (x1 x2 f

Rys. 9 Minimum niewłaściwe (spłaszczone) funkcji f(x1,x2)

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu

u

A T x (macierz

( )

2f xˆ ) forma kwadratowa

jest dodatnio półokreślona .Dodatnia półokreśloność wskazywać może na istnienie minimum niewłaściwego (spłaszczonego) funkcji . Aproksymacja lokalna funkcji walcem hiperbolicznym leżącym i wypukłym w dół wykazuje istnienie minimum niewłaściwego (spłaszczonego) .

(

u1,u2

)

A

) , (x1 x2 f )

, (x1 x2 f

W przypadku A. w zbiorze Ηˆ istnieje minimum niewłaściwe( rys. 9) W przypadku B w zbiorze Ηˆ minimum niewłaściwe nie istnieje ( rys. 10).

2.) Jeżeli jedna z wartości własnych jest równa zero a druga jest ujemna to zachodzi przypadek D.2

(

,

) ( )

2 ˆ 0

2

1 u =u ⋅ ∇ fu

u

A T x (macierz

( )

2f xˆ ) forma kwadratowa A

(

u1,u2

)

jest ujemnie półokreślona. Ujemna półokreśloność wskazywać może na istnienie maksimum niewłaściwego funkcji f(x1,x2).

(13)

) , (x1 x2 f

0

B

11 2

x x

1

12

x x

22

Rys.10. Minimum niewłaściwe (spłaszczone) nie istnieje

Aproksymacja lokalna funkcji walcem hiperbolicznym leżącym i wypukłym w górę wykazuje istnienie maksimum niewłaściwego.

) , (x1 x2 f

W przypadku A. w zbiorze Ηˆ istnieje maksimum niewłaściwe ( rys.11) W przypadku B. w zbiorze Ηˆ nie istnieje maksimum niewłaściwe (rys.12)

) , (x1 x2 f

0

Ηˆ A

11 2 x x1

22 1 x

x2

( ) [ ] [

1 32

]

2 2 2 1 1 1 1 2

1,ˆ , ˆ , , ˆ ,

ˆ xˆ x x x x x x x

f ∈ ∈

Rys.11. Maksimum niewłaściwe funkcji f(x1,x2)

(14)

1 0

x

1 21

x

1

x

2

x

22

) , (x1 x2

B

f

Rys.12. Maksimum niewłaściwe nie istnieje

I./ Warunki dostateczne istnienia ekstremum

Istnienie i postać ekstremum Hesjan

( )

2f xˆ

Wartości własne hesjanu

2 1 ,ξ ξ

Powierzchnia określona przez funkcję

) , (u1 u2 A Minimum

lokalne silne

dodatnio

określony 0

0

2 1

>

ξ

>

ξ paraboloida

eliptyczna wypukła w dół Istnieje w

punkcie stacjonarnym

Maksimum

lokalne silne

ujemnie

określony 0

0

2 1

<

ξ

<

ξ paraboloida

eliptyczna

wypukła w górę

Minimum lokalne niewłaściwe

dodatnio

półokreślony 0, 0

0 , 0

2 1

2 1

= ξ

≥ ξ

≥ ξ

=

ξ walec

paraboliczny wypukły w dół Może istnieć

w otoczeniu punktu

stacjonarnego

Maksimum

Lokalne niewłaściwe

ujemnie

półokreślony 0, 0

0 , 0

2 1

2 1

= ξ

≤ ξ

≤ ξ

=

ξ walec

paraboliczny wypukły w górę

(15)

Nie istnieje ekstremum

nieokreślony

0 , 0

0 , 0

2 1

2 1

>

ξ

<

ξ

<

ξ

>

ξ paraboloida

hiperboliczna

Dla ustalenia typu formy nie zachodzi konieczność rozwiązywania równania charakterystycznego gdyż nie musimy znać dokładnie wartości własnych

lecz tylko ich znaki. Można wykazać że jeżeli : )

, (u1 u2 A

2 1 ,ξ ξ

I.1.) 0 0

2

2 1

2 22

2 12 2 2 12 22 11 ˆ

12 2

11 ⎟⎟ >

⎜⎜⎝

− ∂

⎟⎟

⎜⎜

⋅ ∂

⎟⎟

⎜⎜

= ∂

⎟ >

⎜⎜

= ∂

x x

f x

f x

a f a a x oraz

a f

x

to forma kwadratowa A(u1,u2) jest dodatnio określona ,

I.2.) 0 0

2

2 1

2 2

2 2 2 1 2 2

12 22 11 ˆ

2 1 2

11 ⎟⎟ >

⎜⎜⎝

− ∂

⎟⎟

⎜⎜

⋅ ∂

⎟⎟

⎜⎜

= ∂

⎟ <

⎜⎜

= ∂

x x

f x

f x

a f a a x oraz

a f

x

to forma kwadratowa A(u1,u2) jest ujemnie określona .

Warunek dostateczny istnienia ekstremum funkcji dwóch zmiennych

Jeżeli funkcja ma ciągłe pochodne do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego to w tym punkcie funkcja osiąga

) , (x1 x2 f

minimum silne gdy są spełnione warunki I.1.

maksimum silne gdy są spełnione warunki I.2.

Uwaga: Dotychczas mówiliśmy tylko o ekstremach lokalnych .

Analogicznie jak w przypadkach funkcji jednej zmiennej sytuacja znacznie się upraszcza gdy dana funkcja jest wypukła w dół bądź wypukła w górę .Jeżeli tylko występuje odpowiednie ekstremum to jest ono jednocześnie ekstremum globalnym .

Można wykazać że funkcja f(x1,x2) określona w przestrzeni R2 jest funkcją a.) wypukłą w dół jeżeli dla wszystkich xR2 hesjan

( )

2f xˆ jest dodatnio

półokreślony ,

b.) wypukłą w górę jeżeli dla wszystkich xR2 hesjan

( )

2f xˆ jest ujemnie półokreślony ,

c.) silnie wypukłą w dół jeżeli dla wszystkich xR2 hesjan

( )

2f xˆ jest dodatnio określony ,

d.) silnie wypukłą w górę jeżeli dla wszystkich xR2 hesjan

( )

2f xˆ jest ujemnie określony

(16)

J./ Warunki dostateczne istnienia ekstremum niewłaściwego

Jeżeli wszystkie punkty stacjonarne funkcji f(x1,x2) tworzą zbiór spójny oraz w pewnym zbiorze takim , że wszystkie pochodne rzędu drugiego funkcji są ciągłe to funkcja ta ma w zbiorze

H1 H Hˆ

1 ⊃ )

, (x1 x2

f :

-minimum niewłaściwe lokalne , gdy hesjan jest dodatnio półokreślony dla

1 , H x

-maksimum niewłaściwe lokalne , gdy hesjan jest ujemnie półokreślony dla

1 . H x

Definicja : Przez zbiór spójny rozumiemy taki zbiór punktów , że każde dwa dowolnie wybrane punkty z tego zbioru możemy połączyć taka krzywą ciągłą której wszystkie punkty należą do danego zbioru.

3.3 Ekstrema funkcji wielu zmiennych o ciągłych pochodnych cząstkowych

A./ Postać hesjanu dla funkcji wielu zmiennych

( )

⎥⎥

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎢⎢

⎟⎟⎠

⎜⎜⎝

• ∂

⎟⎟ •

⎜⎜ ⎞

⎟⎟ ∂

⎜⎜ ⎞

⎟⎟⎠

⎜⎜⎝

• ∂

⎟⎟ •

⎜⎜⎝

⎟⎟ ∂

⎜⎜⎝

=

n x n x

n x

n x x

x x

x f x

x f x

x f

x x

f x

x f x

f

f

ˆ 2 2

2 ˆ 2

1 ˆ 2

1 ˆ 2

2 ˆ 1

2

ˆ 2 1 2

ˆ

2 (16)

B./ Warunki dostateczne istnienia ekstremum funkcji f(x1x2),xRN w jej punkcie stacjonarnym

Istnienie i postać ekstremum Hesjan

( )

2f xˆ

Wartości własne hesjanu

ξn

ξ ξ1 , 2,....,

Powierzchnia określona przez funkcję A Istnieje w

punkcie stacjonarnym

Minimum Lokalne silne

dodatnio określony

0 ...., , 0 0

2 1

>

ξ

>

ξ

>

ξ

n

paraboloida eliptyczna wypukła w dół

(17)

Maksimum Lokalne silne

ujemnie określony

0 ,..., 0 0

2 1

>

ξ

<

ξ

<

ξ

n

paraboloida eliptyczna

wypukła w górę

Minimum lokalne niewłaściwe

dodatnio półokreślony

Jedna spośród wartości własnych

0 ,....,

1 ξ =

ξ n

a pozostałe są nieujemne

walec paraboliczny wypukły w dół Może istnieć

w otoczeniu punktu

stacjonarnego

Maksimum Lokalne niewłaściwe

ujemnie półokreślony

Jedna spośród wartości własnych

0 ,....,

1 ξ =

ξ n

a pozostałe są niedodatnie

walec paraboliczny

wypukły w górę

Nie istnieje ekstremum

nieokreślony co najmniej jedna jest dodatnia i co najmniej jedna ujemna

paraboloida hiperboliczna

Podobnie jak w przypadku N =2 , aby stwierdzić rodzaj określoności bądź półokreśloności hesjanu , nie istnieje konieczność rozwiązywania równania charakterystycznego . Mianowicie przy badaniu określoności hesjanu

(

2f

)

xˆ

można skorzystać ze wzoru Sylwestra o określoności form kwadratowych.

Aby z tego wzoru skorzystać , oznaczamy poszczególne podwyznaczniki hesjanu w następujący sposób :

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎟⎟

⎜⎜

⎟⎟ ∂

⎜⎜⎝

⎟⎟⎠

⎜⎜⎝

⎟ ∂

⎜⎜

=

⎟⎟⎠

⎜⎜⎝

= ∂

x x

x x

x

x f x

x f

x x

f x

f x

x x f

ˆ 22 2

2 ˆ 1

2

2 ˆ 1

2

ˆ 2 1 2

2

1 ˆ 2 1

) ˆ (

ˆ) (

(17)

(18)

⎥⎥

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎢⎢

⎟⎟⎠

⎜⎜⎝

• ∂

⎟⎟ •

⎜⎜⎝

⎟⎟ ∂

⎜⎜⎝

∂ • • • • •

⎟⎟⎠

⎜⎜ ⎞

• ∂

⎟⎟ •

⎜⎜ ⎞

⎟⎟ ∂

⎜⎜⎝

=

n x n x

n x

n x x x

n

x f x

x f x

x f

x x

f x

x f x

f

x

ˆ 2 2

2 ˆ 2

1 ˆ 2

1 ˆ 2

2 ˆ 1

2

ˆ 12 2

ˆ) (

Wykorzystując podwyznaczniki ∆1(xˆ),∆2(xˆ),....,∆n(xˆ) na podstawie twierdzenia Sylwestra można sformułować warunki dostateczne istnienia ekstremum funkcji

zmiennych : N

Funkcja zmiennych mająca ciągłe pochodne cząstkowe do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego :

N x f( ),

1.) ma w punkcie xˆ minimum lokalne silne , gdy

N n

dla

n(xˆ)>0 =1,..,

∆ tj. gdy hesjan w punkcie jest dodatnio

określony ,

2.) ma w punkcie maksimum lokalne silne , gdy

N n

dla

n x

n (ˆ) 0 1,..,

) 1

(− ⋅∆ > = tj. gdy hesjan w punkcie jest ujemnie określony,

3.) nie można rozstrzygnąć czy istnieje ekstremum w punkcie gdy : 3.1) ∆n(xˆ)≥0 dla n=1,..,N−1 , ∆N(xˆ)=0

3.2) (−1)n⋅∆n(xˆ)≥0 dla n=1,..,N−1 , ∆N(xˆ)=0 tj. gdy hesjan w punkcie jest dodatnio lub ujemnie półokreślony , 4.) nie ma w punkcie ekstremum gdy nie są spełnione warunki 3.1 lub 3.2

tj. gdy hesjan w punkcie nie jest określony .

3.4 Warunki optymalności programowania nieliniowego

Niech będzie dane zadanie programowania nieliniowego (ZPN) o postaci :

0

) ( min ) (

X

f f

=

x

x x

gdzie : (17)

⎭⎬

⎩⎨

+

=

=

=

= ≤

m u

i g

u i X g

i i

,.., 1 ,

0 ) (

,.., 1 , 0 ) ( :

0 x

x x

: R R1

f x= n → jest funkcją kryterialną zadania :R R1

gi n → są funkcjami przedstawiającymi ograniczenia gi

f , są funkcjami różniczkowalnymi .

(19)

Warunki Kuhna –Tuckera

Dla zadania optymalizacji (17) sformułowanego powyżej warunki Kuhna-Tuckera przedstawiają się następująco :

1.) xˆ∈X0 , czyli jest punktem dopuszczalnym , jeżeli

istnieją λˆi ≥0,i=1,..,u ( mnożniki Lagrange’a) oraz istnieją λˆi ,i=1+u,..,m o nieoznaczonym znaku takie , że :

2.)

oraz (18)

=

=

∇ λ +

m

i

i

i g

f

1

0 ˆ) ˆ ( ˆ)

(x x

3.) λˆigi(xˆ)=0, i=1,..,u (19) Inna postać warunków Kuhna-Tuckera :

Dla zadania programowania nieliniowego (1) utwórzmy funkcję Lagrange’a w postaci :

(20)

=

λ +

= m

i i ig f

L

1

) ( )

( )

(x,λ x x

Korzystając z (20) warunki konieczne można zapisać w postaci :

(21)

0 0 ˆ) (ˆ =

xL x ,λ

(22)

ˆ) (ˆ ≤

λL x,λ

0 ˆ) (ˆ

ˆ,∇ x,λ =

λ λL (23)

(24)

0

0 ˆ ≥

λ

x oznacza gradient funkcji Lagrange’a względem wektora , x

λ oznacza gradient funkcji Lagrange’a względem wektora λ

Jeżeli w zbiorze ograniczeń wyróżniono w sposób jawny ograniczenia na zmienne decyzyjne x≥0 wówczas warunki Kuhna-Tuckera przyjmą postać :

(25)

ˆ) (ˆ ≥

xL x ,λ

0 ˆ) (ˆ ˆ,∇ x,λ =

x xL (26)

(27)

ˆ ≥0 x

(28)

0 ˆ) (ˆ ≤

λL x,λ

0 ˆ) (ˆ

ˆ,∇ x,λ =

λ λL (29)

(30)

ˆ ≥0 λ

gdzie funkcja Lagrange’a jest zdefiniowana jak poprzednio .

Cytaty

Powiązane dokumenty

Zbiorem wielościennym nazywamy podzbiór przestrzeni Rn będący przecięciem skończonej liczby półprzestrzeni domkniętych. Wielościan jest ograniczonym zbio- rem

Jeśli jednak ktoś świetnie poradzi sobie z zadaniem, z?. przyjemnością postawię bardzo

Uogólnieniem interpolacji Lagrange’a jest interpolacja l’Hermitte’a, w której w węzłach obok wartości funkcji mogą być również dane wartości pochodnych...

Zaproponowany sposób opiera się na cyklicznej zmianie obciążenia elektrowni poprzez zmianę napięcia referencyjnego falownika, na pomiarze wielkości napięć i

W niektórych przypadkach pomiarów dokonuje się przy długości fali, której odpowiada maksymalna różnica pomiędzy absorbancją oznaczanego kompleksu i absorbancją

wyznaczyć współczynniki kombinacji liniowej, należy skorzystać z wzorów pokazanych

Wtedy własność W zachodzi dla wszystkich liczb naturalnych.... Ostatecznie równość (3) zachodzi dla wszystkich

Każdy niepusty podzbiór A zbioru liczb naturalnych N ma element najmniejszy... Ostatecznie równość (1) zachodzi dla wszystkich