WYKŁAD nr 4
1. Zadanie programowania nieliniowego (ZPN)
1.1 Ekstrema funkcji jednej zmiennej o ciągłych pochodnych
Przypuśćmy ze punkt jest punktem stacjonarnym funkcji , gdzie punktem stacjonarnym nazywamy punkt dla którego
R
xˆ∈ f(x)
xˆ
( )
∇f xˆ =0. A./ punkt stacjonarny jest miejscem ekstremum jeżeli :) 0 , (
) 0 (
ˆ 2 2
ˆ
⎟⎟ >
⎠
⎞
⎜⎜⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x dx x
x f d dx
x
df , i wówczas występuje minimum lokalne silne ,
) 0 , (
) 0 (
ˆ 2 2
ˆ
⎟⎟ <
⎠
⎜⎜ ⎞
⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x dx x
x f d dx
x
df , i wówczas występuje maksimum lokalne silne,
B./ punkt stacjonarny nie jest miejscem ekstremum lecz miejscem przegięcia funkcji jeżeli :
0 ) ,
, ( ) 0
, ( ) 0
(
ˆ 3 3
ˆ 2 2
ˆ
<
⎟⎟ >
⎠
⎞
⎜⎜⎝
= ⎛
⎟⎟⎠
⎞
⎜⎜⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x
x x dx
x f d dx
x f d dx
x df
) (x f
x ) 0
, ( ) 0 (
ˆ 2 2 ˆ
⎟⎟ <
⎠
⎜⎜ ⎞
⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x dx x
x f d dx
x df minimum
maksimum
punkt przegiecia
punkt przegiecia
) 0 , ( ) 0 , ( ) 0 (
ˆ 3 3 ˆ 2 2 ˆ
⎟⎟ >
⎠
⎞
⎜⎜⎝
= ⎛
⎟⎟⎠
⎞
⎜⎜⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x
x x dx
x f d dx
x f d dx
x df
) 0 , ( ) 0 , ( ) 0 (
ˆ 3 3 ˆ 2 2 ˆ
⎟⎟ <
⎠
⎜⎜ ⎞
⎝
= ⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x
x x dx
x f d dx
x f d dx
x df ) 0
, ( ) 0 (
ˆ 2 2 ˆ
⎟⎟ >
⎠
⎜⎜ ⎞
⎝
= ⎛
⎟⎠
⎜ ⎞
⎝
⎛
x dx x
x f d dx
x df
Rys.1 Ekstrema i punkty przegięcia funkcji
Uogólnienie: Jeżeli funkcja ma w otoczeniu pochodne do rzędu włącznie a nadto :
) (x
f xˆ K
) 0 1 (
,.., 1 ) 0
(
ˆ ˆ
⎟⎟ ≠
⎠
⎜⎜ ⎞
⎝
− ⎛
=
⎟⎟ =
⎠
⎜⎜ ⎞
⎝
⎛
x K K x
i i
dx x f oraz d K
i dx dla
x f d
to jeżeli K jest liczbą parzystą ,
A./ funkcjaf(x) ma w punkcie minimum lokalne silne gdy xˆ ) 0
(
ˆ
⎟⎟ >
⎠
⎞
⎜⎜⎝
⎛
x K K
dx x f d
B./ funkcja f(x) ma w punkcie maksimum lokalne silne gdy xˆ ) 0
(
ˆ
⎟⎟ <
⎠
⎜⎜ ⎞
⎝
⎛
x K K
dx x f d
Jeżeli jest nieparzyste , to ekstremum funkcji w punkcie stacjonarnym nie istnieje .
K f(x) xˆ
Znając punkty stacjonarne funkcji dla znalezienia jej minimum leżącego wewnątrz zbioru Η , wystarczy zbadać wartości , jakie funkcja przyjmie w punktach stacjonarnych. Możliwość wnioskowania o tym że punkt stacjonarny jest punktem
w którym funkcja osiąga ekstremum wiąże się z wypukłością funkcji oraz wypukłością zbioru
) (x f Η .
Zbiór punktów dopuszczalnych Η w obrębie którego możemy poszukiwać punktu w którym funkcja osiąga ekstremum , jest na ogół wyznaczony przez zespół warunków ograniczających , określonych przy pomocy pewnych funkcji ograniczających :
) (x f
a./ warunki ograniczające równościowe , b./ warunki ograniczające nierównościowe.
Ad.a punkt x musi spełniać warunki równościowe , które mają postać I równań :
I i g x
gi( )= (i , =1,.., g(i − stałe (1) Warunek będziemy oznaczać
{
w i I}
W= = i= , =1,.., (2)
co oznacza że punkt x ma należeć do zbioru punktów spełniających (1).
Zbiór ten oznaczamy ( hiperpowierzchnie ) .Spełnienie warunku jest równoważne spełnieniu warunku .
=
Ηi x∈Ηi=
i=
w
Równoczesne spełnienie zespołu dwóch równań
2 2
1
1(x) g ; g (x) g
g = ( = (
oznacza że punkt x leży zarówno na hiperpowierzchni jak i na hiperpowierzchni a więc należy do zbioru będącego iloczynem zbiorów i .
=
Η1
=
Η2 Η= =Η1=∩Η2=
=
Η1 Η2=
W przypadku gdy obie funkcje g1(x)=g(1 ; g2(x)=g(2 są liniowe , hiperpowierzchnie Η1= , Η2= są płaszczyznami .
W grę wchodzą trzy możliwości :
1. płaszczyzny Η1= , Η2= są równoległe 2. płaszczyzny Η1= , Η2= pokrywają się 3. płaszczyzny Η1= , Η2= przecinają się
Ograniczenia w przypadku 1. ,2. nazywamy zdegenerowanymi . Przypadek 3. jest niezdegenerowany , zbór jest linia przecięcia płaszczyzn ,
.
=
=
==Η1 ∩Η2
Η Η1=
=
Η2
Oznaczymy ogólnie przez Η zbiór punktów spełniających zespół warunków =
{
w i I}
W= = i= , =1,.., . Zbór ten jest iloczynem zbiorów Ηi= , zatem:
(3)
=
=
= =∩I i
i Η
Η 1
Znajdowanie rozwiązania zadania optymalizacji
∈Η=
x x
f x
ZO: : ( ) (4)
sprowadza się do badania funkcji f(x) w punktach leżących w zbiorze Η= . Ad.b warunki ograniczające nierównościowe mają postać zespołu nierówności :
J j
h x h
J j h x h
j j
j j
,.., 1 , ) (
,.., 1 , ) (
' '
' ≥ =
=
≤ ( (
Nierówność taką oznaczamy symbolem w≤j a ich zespół przez
{
w j J}
W≤ = ≤j , =1,.., (5)
Przy założeniu że funkcja jest funkcją ciągłą , hiperpowierzchnia określona równaniem
) (x
f Ηi=
j
j x h
h (
= )
( rozdziela przestrzeń R na dwa zbiory . Zbiór N leżący po jednej stronie powierzchni charakteryzuje się tym że , po drugiej zaś stronie tym że
j
j x h
h (
≥ ) (
j
j x h
h ( )≤ (
j
j x h
h (
>
) (
j
j x h
h ( )≤ (
j
j x h
h ( )= (
Rys. 2 Przestrzeń RN rozdzielona na dwa zbiory
Zbiór punktów Η spełniających warunki nierównościowe jest więc iloczynem ≤ zbiorów Η≤j , j=1,..,J
(6)
≤
=
≤ =∩I i
i Η
Η 1
=
Η1
1≤
= Η Η2
≥
Η2
=
Η3
≤
Η3
≤
=
≤ =∩ i
i Η
Η 3
1
Rys.3 Zbiór ≤
=
≤=∩I i
i Η
Η 1
Podobnie jak w przypadku warunków równościowych może powstać sytuacja że iloczyn jest zbiorem pustym co oznacza że warunki ograniczające są sprzeczne .
≤
= Η
∩I i
i 1
Poszukiwanie miejsca ekstremalnego znacznie się upraszcza jeżeli zbiór Η jest zbiorem wypukłym. ≤
Definicja: Zbiór A nazywamy zbiorem wypukłym jeżeli dla oraz wynika że punkt
A x′∈ A
x′′∈
1 0 )
1
( −α ⋅ ′+α⋅ ′′ ≤α≤
′′′= x x dla
x (7)
należy też do zbioru A
Tak więc zbiór jest wypukły , jeżeli z faktu iż dwa punkty x′∈A i wynika ,że cały odcinek łączący te punkty należy też do tego zbioru .
A x′′∈
Η1
x′ x ′′
Η2
x′
x ′′
x′
x ′′
Rys.4 Przykłady zbiorów wypukłych
Η1
x′
x′′ Η1
Η2
x′ x′′
x′ x′′
Rys 5 Przykłady zbiorów które nie są wypukłe
Uwaga: Iloczyn zbiorów wypukłych jest także zbiorem wypukłym 1./ Z pojęciem wypukłości zbioru wiąże się pojecie wypukłości funkcji
Mówimy że ciągła funkcja h(x), x∈RN jest wypukła w dół w przestrzeni R jeżeli dla dowolnych dwóch punktów N , oraz każdego
zachodzi :
RN
x′∈ x′′∈RN
>
∈<
α 0,1
h
[ (
1−α)
⋅x′+α⋅x′′]
≤(
1−α)
⋅h(x′)+α⋅h(x′′) (8) natomiast jeżeli :( )
[
1 x x] (
1)
h(x) h(x )h −α ⋅ ′+α⋅ ′′ ≥ −α ⋅ ′ +α⋅ ′′ (9) to funkcja h(x), x∈RN jest wypukła w górę w przestrzeni RN
2./ W przypadku gdy warunek (8) zachodzi tylko dla dowolnych punktów , przy czym
Η x Η
x′∈ , ′′∈ Η jest zbiorem wypukłym w przestrzeni RN to funkcję h(x) nazywamy wypukła w dół w zbiorze wypukłym Η , w przypadku warunku (9) funkcję nazywamy wypukła w górę w zbiorze wypukłym
) (x h Η ,
C./ Warunki zapewniające istnienie ekstremum globalnego
Sytuacja upraszcza się jeżeli funkcja f(x) określona w zbiorze R wszystkich liczb rzeczywistych jest wypukła w górę lub w dół.
Jeżeli funkcja jest wypukła w dół , to może mieć tylko jedno minimum będące jej minimum globalnym .
) (x f
Jeżeli funkcja jest wypukła w górę , to może mieć tylko jedno maksimum będące jej maksimum globalnym .
) (x f
Funkcja f(x) określona w zbiorzeR jest :
wypukła w dół gdy dla wszystkich x∈R , d2f(x) dx2 ≥0
wypukła w górę gdy dla wszystkich x∈R , d2f(x) dx2 ≤0 D./ Ekstrema lokalne niewłaściwe (spłaszczone )
Jeżeli dla wszystkich xˆ∈Ηˆ jest
(
df(x) dx)
ˆx =0 oraz w pewnym przedziale Η takim ,że Η ⊃Ηˆ , druga pochodna(
d2f(x) dx2)
jestciągła , to funkcja f(x) na w przedziale Ηˆ :
a.) maksimum lokalne niewłaściwe (spłaszczone) , gdy
(
d2f(x) dx2)
xˆ ≤0 , x∈Hb.) minimum lokalne niewłaściwe (spłaszczone), gdy
(
d2f(x) dx2)
xˆ ≥0 , x∈H2. Ekstrema funkcji dwu zmiennych o ciągłych pochodnych
A./ Hesjan i jego własności
Hesjanem funkcji f(x1,x2) w punkcie X ≡
(
x1,x2)
nazywamy :( )
x x
x x x
x f x
x f
x x
f x
f f
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
⎟⎟ ∂
⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
∂
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
⎟⎟ ∂
⎠
⎞
⎜⎜⎝
⎛
∂
∂
=
∇
2 2 2
2 1
2
2 1
2 2
1 2
2 (10)
Z twierdzenia Schwarca o równości pochodnych cząstkowych mieszanych wynika że hesjan jest macierzą symetryczną .
Jeżeli utworzymy wektor u=
[
u1 u2]
T to funkcję(
u1,u2)
a11 u12 2 a12u1u2 a22 u22A = ⋅ + ⋅ + ⋅ (11)
gdzie : 1,2, 1,2
ˆ
2 ⎟⎟ = =
⎠
⎞
⎜⎜
⎝
⎛
∂
∂
≡ ∂ i j
x x a f
j x i
ij możemy zapisać jako :
(
u u)
u( )
f uA 1, 2 = T ⋅ ∇2 xˆ ⋅ (12)
co oznacza że funkcja jest formą kwadratową względem wektora u o macierzy symetrycznej
(
u1,u2A
)
( )
∇2f xˆ.B./ Istnienie i postać ekstremum funkcji f(x1,x2) w punkcie stacjonarnym xˆ zależy od charakteru formy kwadratowej A
(
u1,u2)
a ściślej od jej określoności lub półokreśloności .C./ Jeżeli dla wszystkich wektorów u≠0 zachodzi nierówność :
1./
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u >
u
A T x to (macierz
( )
∇2f xˆ ) forma kwadratowa A(
u1,u2)
jest dodatnio określona ,2./
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u <
u
A T x to (macierz
( )
∇2f xˆ ) forma kwadratowa A(
u1,u2)
jest ujemnie określona ,D./ Jeżeli dla wszystkich wektorów u≠0 zachodzi nierówność:
1./
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u ≥
u
A T x i istnieje taki wektor u≠0 że
( )
∇2 ˆ ⋅ =0⋅ f u
uT x to (macierz
( )
∇2f xˆ ) forma kwadratowa jest dodatnio półokreślona ,(
u1,u2A
)
2./
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u ≤
u
A T x i istnieje taki wektor u≠0 że
( )
∇2 ˆ ⋅ =0⋅ f u
uT x to (macierz
( )
∇2f xˆ ) forma kwadratowa jest ujemnie półokreślona(
u1,u2A
)
E./ W szczególności , jeżeli forma kwadratowa A
(
u1,u2)
jest dodatnio lub ujemnie półokreślona zaś dla wszystkich wektorów u≠0 zachodzi równość uT ⋅( )
∇2f xˆ ⋅u =0 , to o formie kwadratowej A(
u1,u2)
mówimyże jest tożsamościowo równa zero .
W takim przypadku hesjan
( )
∇2f xˆ jest macierzą zerową .F./ Możemy zawsze dokonać takiego obrotu układu o współrzędnych
[
u1 u2]
że w nowym układzie o współrzędnych[
u1′ u2′]
formę kwadratową A(
u1,u2)
możemy zapisać w postaci :(
u1,u2)
A =A′
(
u1′,u2′)
=ξ1⋅u1′2+ξ2 ⋅u2′2 (13) w której : ξ1 ,ξ2 są wartościami własnymi macierzy( )
∇2f xˆG./ Wielomianem charakterystycznym macierzy kwadratowej
( )
∇2f xˆnazywamy wielomian o postaci:
[ ( )
2 12]
det )
(ξ = ∇ −ξ⋅
ϕ f (14)
Równaniem charakterystycznym macierzy kwadratowej
( )
∇2f xˆnazywamy :
0 (15)
) (ξ = ϕ
Wartościami własnymi ξ1 ,ξ2 macierzy
( )
∇2f xˆ są pierwiastki równania charakterystycznego (3.15) , zbiór wartości własnychmacierzy
{
ξ1 ,ξ2}
( )
∇2f xˆ , nazywamy widmem tej macierzy.Przykład 3.1
1./ funkcja dwóch zmiennych
2 2 2 1 2 1 2
1, ) 2 2
(x x x x x x
f = − ⋅ +
2./ hesjan funkcji
( )
2 42 2
22 2
2 1
2
2 1
2 12
2
2
−
= −
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
⎟⎟ ∂
⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
∂
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
⎟⎟ ∂
⎠
⎞
⎜⎜⎝
⎛
∂
∂
=
∇
x x
x x x
x f x
x f
x x
f x
f f
3./ wielomian charakterystyczny hesjanu
[ ( ) ]
⎥⎦
⎢ ⎤
⎣
⎡ −ξ⋅
−
= −
⋅ ξ
−
∇
= ξ
ϕ 0 1
0 1 4
2 2 det 2
1 det
)
( 2f 2
4./ równanie charakterystyczne hesjanu ϕ(ξ)=0
( ) ( )
0 4 6 )
(
0 ) 2 ( ) 2 ( 4 2
) (
2 − ξ+ =
ξ
= ξ ϕ
=
−
⋅
−
− ξ
−
⋅ ξ
−
= ξ ϕ
5./ wartości własne hesjanu (pierwiastki równania charakterystycznego ) ξ1 =3+ 5 ,ξ2 =3− 5
6./ widmo hesjanu (zbiór pierwiastków charakterystycznych )
{
3+ 5 ,3− 5}
H./ Ogólnie możliwa jest jedna z następujących sytuacji a./ obie wartości własne są dodatnie ,
b./ obie wartości własne są ujemne , c./ wartości własne mają przeciwne znaki ,
d./ jedna w wartości własnych jest równa zero
ad.a
1
1 x
xˆ =
2
2 x
xˆ = )
, (x1 x2 f
0
[
ˆ1,ˆ2]
ˆ x x
x= ˆ )
ˆ, ˆ(
2 1 x x f
Rys.6 Paraboloida eliptyczna wypukła w dół
Jeżeli obie wartości własne hesjanu są dodatnie wówczas zachodzi przypadek C.1
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u >
u
A T x ,
(macierz
( )
∇2f xˆ ) forma kwadratowa A(
u1,u2)
jest dodatnio określona.Obrazem graficznym funkcji jest w tym przypadku paraboloida eliptyczna wypukła w dół .
) , (x1 x2 f
ad.b Jeżeli obie wartości własne hesjanu są ujemne wówczas zachodzi przypadek C.2
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u <
u T x
A ,
(macierz
( )
∇2f xˆ ) forma kwadratowa A(
u1,u2)
jest ujemnie określonaObrazem graficznym funkcji jest w tym przypadku paraboloida eliptyczna wypukła w górę .
) , (x1 x2 f
1
1 x
xˆ =
2
2 x
xˆ = )
, (x1 x2 f
0
[ˆ1,ˆ2]
ˆ x x x= ˆ )
ˆ , ˆ(
2 1 x x f
Rys.7. Paraboloida eliptyczna wypukła w górę
ad.c w przypadku gdy wartości własne są różnych znaków , forma kwadratowa przyjmuje zarówno wartości dodatnie jak i ujemne .
Forma kwadratowa jest zatem nieokreślona a także nieokreślony jest hesjan
( )
∇2f xˆ . Obrazem graficznym funkcji jest w tym przypadku paraboloida hiperboliczna jak na rysunku poniżej.) , (x1 x2 f
x1
) , (x1 x2 f
0 x2
Rys.8 Hesjan nieokreślony Punkt siodłowy
[
x1, x2]
ad.a
1.) Jeżeli jedna z wartości własnych jest równa zero a druga jest dodatnia to zachodzi przypadek D.1 ,
1
x1
0 x12
12
x
22
x A
( ) [ ] [ 1 23]
2 2 2 1 1 1 1 2
1,ˆ , ˆ , , ˆ ,
ˆ xˆ x x x x x x x
f ∈ ∈
) , (x1 x2 f
Rys. 9 Minimum niewłaściwe (spłaszczone) funkcji f(x1,x2)
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u ≥
u
A T x (macierz
( )
∇2f xˆ ) forma kwadratowajest dodatnio półokreślona .Dodatnia półokreśloność wskazywać może na istnienie minimum niewłaściwego (spłaszczonego) funkcji . Aproksymacja lokalna funkcji walcem hiperbolicznym leżącym i wypukłym w dół wykazuje istnienie minimum niewłaściwego (spłaszczonego) .
(
u1,u2)
A
) , (x1 x2 f )
, (x1 x2 f
W przypadku A. w zbiorze Ηˆ istnieje minimum niewłaściwe( rys. 9) W przypadku B w zbiorze Ηˆ minimum niewłaściwe nie istnieje ( rys. 10).
2.) Jeżeli jedna z wartości własnych jest równa zero a druga jest ujemna to zachodzi przypadek D.2
(
,) ( )
2 ˆ 02
1 u =u ⋅ ∇ f ⋅u ≤
u
A T x (macierz
( )
∇2f xˆ ) forma kwadratowa A(
u1,u2)
jest ujemnie półokreślona. Ujemna półokreśloność wskazywać może na istnienie maksimum niewłaściwego funkcji f(x1,x2).
) , (x1 x2 f
0
B
11 2
x x
112
x x
22Rys.10. Minimum niewłaściwe (spłaszczone) nie istnieje
Aproksymacja lokalna funkcji walcem hiperbolicznym leżącym i wypukłym w górę wykazuje istnienie maksimum niewłaściwego.
) , (x1 x2 f
W przypadku A. w zbiorze Ηˆ istnieje maksimum niewłaściwe ( rys.11) W przypadku B. w zbiorze Ηˆ nie istnieje maksimum niewłaściwe (rys.12)
) , (x1 x2 f
0
Ηˆ A
11 2 x x1
22 1 x
x2
( ) [ ] [ 1 32]
2 2 2 1 1 1 1 2
1,ˆ , ˆ , , ˆ ,
ˆ xˆ x x x x x x x
f ∈ ∈
Rys.11. Maksimum niewłaściwe funkcji f(x1,x2)
1 0
x
1 21x
1
x
2x
22) , (x1 x2
B
fRys.12. Maksimum niewłaściwe nie istnieje
I./ Warunki dostateczne istnienia ekstremum
Istnienie i postać ekstremum Hesjan
( )
∇2f xˆWartości własne hesjanu
2 1 ,ξ ξ
Powierzchnia określona przez funkcję
) , (u1 u2 A Minimum
lokalne silne
dodatnio
określony 0
0
2 1
>
ξ
>
ξ paraboloida
eliptyczna wypukła w dół Istnieje w
punkcie stacjonarnym
xˆ Maksimum
lokalne silne
ujemnie
określony 0
0
2 1
<
ξ
<
ξ paraboloida
eliptyczna
wypukła w górę
Minimum lokalne niewłaściwe
dodatnio
półokreślony 0, 0
0 , 0
2 1
2 1
= ξ
≥ ξ
≥ ξ
=
ξ walec
paraboliczny wypukły w dół Może istnieć
w otoczeniu punktu
stacjonarnego
xˆ Maksimum
Lokalne niewłaściwe
ujemnie
półokreślony 0, 0
0 , 0
2 1
2 1
= ξ
≤ ξ
≤ ξ
=
ξ walec
paraboliczny wypukły w górę
Nie istnieje ekstremum
nieokreślony
0 , 0
0 , 0
2 1
2 1
>
ξ
<
ξ
<
ξ
>
ξ paraboloida
hiperboliczna
Dla ustalenia typu formy nie zachodzi konieczność rozwiązywania równania charakterystycznego gdyż nie musimy znać dokładnie wartości własnych
lecz tylko ich znaki. Można wykazać że jeżeli : )
, (u1 u2 A
2 1 ,ξ ξ
I.1.) 0 0
2
2 1
2 22
2 12 2 2 12 22 11 ˆ
12 2
11 ⎟⎟ >
⎠
⎞
⎜⎜⎝
⎛
∂
∂
− ∂
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
⋅ ∂
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
= ∂
−
⎟ >
⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
= ∂
x x
f x
f x
a f a a x oraz
a f
x
to forma kwadratowa A(u1,u2) jest dodatnio określona ,
I.2.) 0 0
2
2 1
2 2
2 2 2 1 2 2
12 22 11 ˆ
2 1 2
11 ⎟⎟ >
⎠
⎞
⎜⎜⎝
⎛
∂
∂
− ∂
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
⋅ ∂
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
= ∂
−
⎟ <
⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
= ∂
x x
f x
f x
a f a a x oraz
a f
x
to forma kwadratowa A(u1,u2) jest ujemnie określona .
Warunek dostateczny istnienia ekstremum funkcji dwóch zmiennych
Jeżeli funkcja ma ciągłe pochodne do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego to w tym punkcie funkcja osiąga
) , (x1 x2 f
xˆ
minimum silne gdy są spełnione warunki I.1.
maksimum silne gdy są spełnione warunki I.2.
Uwaga: Dotychczas mówiliśmy tylko o ekstremach lokalnych .
Analogicznie jak w przypadkach funkcji jednej zmiennej sytuacja znacznie się upraszcza gdy dana funkcja jest wypukła w dół bądź wypukła w górę .Jeżeli tylko występuje odpowiednie ekstremum to jest ono jednocześnie ekstremum globalnym .
Można wykazać że funkcja f(x1,x2) określona w przestrzeni R2 jest funkcją a.) wypukłą w dół jeżeli dla wszystkich x∈R2 hesjan
( )
∇2f xˆ jest dodatniopółokreślony ,
b.) wypukłą w górę jeżeli dla wszystkich x∈R2 hesjan
( )
∇2f xˆ jest ujemnie półokreślony ,c.) silnie wypukłą w dół jeżeli dla wszystkich x∈R2 hesjan
( )
∇2f xˆ jest dodatnio określony ,d.) silnie wypukłą w górę jeżeli dla wszystkich x∈R2 hesjan
( )
∇2f xˆ jest ujemnie określonyJ./ Warunki dostateczne istnienia ekstremum niewłaściwego
Jeżeli wszystkie punkty stacjonarne funkcji xˆ f(x1,x2) tworzą zbiór spójny Hˆ oraz w pewnym zbiorze takim , że wszystkie pochodne rzędu drugiego funkcji są ciągłe to funkcja ta ma w zbiorze
H1 H Hˆ
1 ⊃ )
, (x1 x2
f Hˆ :
-minimum niewłaściwe lokalne , gdy hesjan jest dodatnio półokreślony dla
1 , H x∈
-maksimum niewłaściwe lokalne , gdy hesjan jest ujemnie półokreślony dla
1 . H x∈
Definicja : Przez zbiór spójny rozumiemy taki zbiór punktów , że każde dwa dowolnie wybrane punkty z tego zbioru możemy połączyć taka krzywą ciągłą której wszystkie punkty należą do danego zbioru.
3.3 Ekstrema funkcji wielu zmiennych o ciągłych pochodnych cząstkowych
A./ Postać hesjanu dla funkcji wielu zmiennych
( )
⎥⎥
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
• ∂
⎟⎟ •
⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
⎟⎟ ∂
⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
∂
•
•
•
•
•
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
∂
• ∂
⎟⎟ •
⎠
⎞
⎜⎜⎝
⎛
∂
∂
⎟⎟ ∂
⎠
⎞
⎜⎜⎝
⎛
∂
∂
=
∇
n x n x
n x
n x x
x x
x f x
x f x
x f
x x
f x
x f x
f
f
ˆ 2 2
2 ˆ 2
1 ˆ 2
1 ˆ 2
2 ˆ 1
2
ˆ 2 1 2
ˆ
2 (16)
B./ Warunki dostateczne istnienia ekstremum funkcji f(x1x2),x∈RN w jej punkcie stacjonarnym xˆ
Istnienie i postać ekstremum Hesjan
( )
∇2f xˆWartości własne hesjanu
ξn
ξ ξ1 , 2,....,
Powierzchnia określona przez funkcję A Istnieje w
punkcie stacjonarnym
Minimum Lokalne silne
dodatnio określony
0 ...., , 0 0
2 1
>
ξ
>
ξ
>
ξ
n
paraboloida eliptyczna wypukła w dół
xˆ Maksimum Lokalne silne
ujemnie określony
0 ,..., 0 0
2 1
>
ξ
<
ξ
<
ξ
n
paraboloida eliptyczna
wypukła w górę
Minimum lokalne niewłaściwe
dodatnio półokreślony
Jedna spośród wartości własnych
0 ,....,
1 ξ =
ξ n
a pozostałe są nieujemne
walec paraboliczny wypukły w dół Może istnieć
w otoczeniu punktu
stacjonarnego xˆ
Maksimum Lokalne niewłaściwe
ujemnie półokreślony
Jedna spośród wartości własnych
0 ,....,
1 ξ =
ξ n
a pozostałe są niedodatnie
walec paraboliczny
wypukły w górę
Nie istnieje ekstremum
nieokreślony co najmniej jedna jest dodatnia i co najmniej jedna ujemna
paraboloida hiperboliczna
Podobnie jak w przypadku N =2 , aby stwierdzić rodzaj określoności bądź półokreśloności hesjanu , nie istnieje konieczność rozwiązywania równania charakterystycznego . Mianowicie przy badaniu określoności hesjanu
(
∇2f)
xˆmożna skorzystać ze wzoru Sylwestra o określoności form kwadratowych.
Aby z tego wzoru skorzystać , oznaczamy poszczególne podwyznaczniki hesjanu w następujący sposób :
•
•
•
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
⎟⎟ ∂
⎠
⎞
⎜⎜⎝
⎛
∂
∂
∂
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
∂
⎟ ∂
⎟
⎠
⎞
⎜⎜
⎝
⎛
∂
∂
=
∆
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
= ∂
∆
x x
x x
x
x f x
x f
x x
f x
f x
x x f
ˆ 22 2
2 ˆ 1
2
2 ˆ 1
2
ˆ 2 1 2
2
1 ˆ 2 1
) ˆ (
ˆ) (
(17)
⎥⎥
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
• ∂
⎟⎟ •
⎠
⎞
⎜⎜⎝
⎛
∂
∂
⎟⎟ ∂
⎠
⎞
⎜⎜⎝
⎛
∂
∂
∂ • • • • •
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
• ∂
⎟⎟ •
⎠
⎜⎜ ⎞
⎝
⎛
∂
∂
⎟⎟ ∂
⎠
⎞
⎜⎜⎝
⎛
∂
∂
=
∆
n x n x
n x
n x x x
n
x f x
x f x
x f
x x
f x
x f x
f
x
ˆ 2 2
2 ˆ 2
1 ˆ 2
1 ˆ 2
2 ˆ 1
2
ˆ 12 2
ˆ) (
Wykorzystując podwyznaczniki ∆1(xˆ),∆2(xˆ),....,∆n(xˆ) na podstawie twierdzenia Sylwestra można sformułować warunki dostateczne istnienia ekstremum funkcji
zmiennych : N
Funkcja zmiennych mająca ciągłe pochodne cząstkowe do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego :
N x f( ),
xˆ 1.) ma w punkcie xˆ minimum lokalne silne , gdy
N n
dla
n(xˆ)>0 =1,..,
∆ tj. gdy hesjan w punkcie jest dodatnio
określony ,
xˆ 2.) ma w punkcie xˆ maksimum lokalne silne , gdy
N n
dla
n x
n (ˆ) 0 1,..,
) 1
(− ⋅∆ > = tj. gdy hesjan w punkcie jest ujemnie określony,
xˆ 3.) nie można rozstrzygnąć czy istnieje ekstremum w punkcie xˆ gdy : 3.1) ∆n(xˆ)≥0 dla n=1,..,N−1 , ∆N(xˆ)=0
3.2) (−1)n⋅∆n(xˆ)≥0 dla n=1,..,N−1 , ∆N(xˆ)=0 tj. gdy hesjan w punkcie jest dodatnio lub ujemnie półokreślony , xˆ 4.) nie ma w punkcie ekstremum gdy nie są spełnione warunki 3.1 lub 3.2
tj. gdy hesjan w punkcie nie jest określony . xˆ
xˆ
3.4 Warunki optymalności programowania nieliniowego
Niech będzie dane zadanie programowania nieliniowego (ZPN) o postaci :
0
) ( min ) (
X
f f
∈
=
x
x x
gdzie : (17)
⎭⎬
⎫
⎩⎨
⎧
+
=
=
=
= ≤
m u
i g
u i X g
i i
,.., 1 ,
0 ) (
,.., 1 , 0 ) ( :
0 x
x x
: R R1
f x= n → jest funkcją kryterialną zadania :R R1
gi n → są funkcjami przedstawiającymi ograniczenia gi
f , są funkcjami różniczkowalnymi .
Warunki Kuhna –Tuckera
Dla zadania optymalizacji (17) sformułowanego powyżej warunki Kuhna-Tuckera przedstawiają się następująco :
1.) xˆ∈X0 , czyli jest punktem dopuszczalnym , jeżeli
istnieją λˆi ≥0,i=1,..,u ( mnożniki Lagrange’a) oraz istnieją λˆi ,i=1+u,..,m o nieoznaczonym znaku takie , że :
2.)
∑
oraz (18)=
=
∇ λ +
∇ m
i
i
i g
f
1
0 ˆ) ˆ ( ˆ)
(x x
3.) λˆigi(xˆ)=0, i=1,..,u (19) Inna postać warunków Kuhna-Tuckera :
Dla zadania programowania nieliniowego (1) utwórzmy funkcję Lagrange’a w postaci :
(20)
∑
=λ +
= m
i i ig f
L
1
) ( )
( )
(x,λ x x
Korzystając z (20) warunki konieczne można zapisać w postaci :
(21)
0 0 ˆ) (ˆ =
∇xL x ,λ
(22)
ˆ) (ˆ ≤
∇λL x,λ
0 ˆ) (ˆ
ˆ,∇ x,λ =
λ λL (23)
(24)
0
0 ˆ ≥
λ
∇ x oznacza gradient funkcji Lagrange’a względem wektora , x
∇ λ oznacza gradient funkcji Lagrange’a względem wektora λ
Jeżeli w zbiorze ograniczeń wyróżniono w sposób jawny ograniczenia na zmienne decyzyjne x≥0 wówczas warunki Kuhna-Tuckera przyjmą postać :
(25)
ˆ) (ˆ ≥
∇xL x ,λ
0 ˆ) (ˆ ˆ,∇ x,λ =
x xL (26)
(27)
ˆ ≥0 x
(28)
0 ˆ) (ˆ ≤
∇λL x,λ
0 ˆ) (ˆ
ˆ,∇ x,λ =
λ λL (29)
(30)
ˆ ≥0 λ
gdzie funkcja Lagrange’a jest zdefiniowana jak poprzednio .