• Nie Znaleziono Wyników

2.5 Pochodne cząstkowe wyższych rzędów i wzór Taylora

2.5.5 Ekstrema lokalne

·s − α1

α2



· . . . ·s − (α1+ · · · + αn−1) αn



= s!

α1! · α2! · . . . · αn! = s!

α!. Dla każdego z tych ciągów mamy

Dis. . . Di2Di1f (a + th)hi1hi2 · . . . · his = Dαf (a + th)hα, a więc wzór (2.49) można przepisać w postaci

g(s)(t)

s! = X

|α|=s

1

α!Dαf (a + th)hα, s = 1, 2, . . . , k. (2.50) Podstawiając (2.50) do wzoru (2.48), otrzymujemy tezę twierdzenia. 

W szczególnym przypadku k = 2, dla funkcji f : Rn ⊃ Ω → R różniczkowalnej dwu-krotnie w sposób ciągły, można podobnie (stosując wzór Taylora z resztą Lagrange’a dla funkcji g(t) = f ( a + t h ) jednej zmiennej t) uzyskać następujący fakt.

Wniosek 2.59. Jeśli Ω ⊂ Rn, f ∈ C2(Ω, R) i odcinek [a, a+h] ⊂ Ω, gdzie h = (h1, . . . , hn), to istnieje wówczas punkt θ ∈ (0, 1) taki, że

f (a + h) = f (a) +

n

X

i=1

fxi(a)hi+1 2

n

X

i,j=1

fxixj(a + θ h)hihj. (2.51)

Dowód. Ćwiczenie dla Czytelnika.

Zadanie 2.60. Wykazać, że dla każdego x = (x1, . . . , xn) ∈ Rni dla każdego k ∈ N jest (x1+ x2+ · · · + xn)k= X

|α|=k

k!

α!xα.

Wskazówka. Oznaczyć lewą stronę f(x ) i zastosować wzór Taylora.

2.5.5 Ekstrema lokalne.

Wiemy już, że warunkiem koniecznym, by funkcja różniczkowalna f : Ω → R miała eks-tremum w punkcie a ∈ Ω, jest znikanie jej gradientu w tym punkcie. Zajmiemy się teraz sformułowaniem warunków dostatecznych istnienia ekstremum lokalnego funkcji klasy C2. Wyrazimy je za pomocą własności drugiej różniczki.

Definicja 2.61. Niech f ∈ C2(Ω, R). Macierz Hf(a ) = D2f (a ) = fxixj(a )

i,j=1,2,...,n∈ Mn×n nazywamy hesjanem funkcji f w punkcie a ∈ Ω.

Z twierdzenia Schwarza o równości pochodnych mieszanych wynika natychmiast, że Hf(a ) jest macierzą symetryczną. Jak wiadomo z wykładów Algebry Liniowej, wszystkie wartości własne macierzy symetrycznej A są rzeczywiste, a w Rn istnieje baza ortonor-malna, złożona z wektorów własnych A.

Przypomnijmy, że macierz symetryczna A ∈ Mn×n nazywa się dodatnia (ujemna) wtedy i tylko wtedy, gdy hA v , v i > 0 dla v ∈ Rn \ {0} (odpowiednio hAv, vi < 0 dla v ∈ Rn\ {0}). Macierze nieujemne i niedodatnie definiuje się analogicznie, za pomocą nierówności nieostrych. Jeśli A jest dodatnia (ujemna, nieujemna, niedodatnia), to pi-szemy A > 0 (odpowiednio: A < 0, A ≥ 0, A ≤ 0).

Stwierdzenie 2.62. Załóżmy, że a ∈ Ω jest punktem krytycznym funkcji f ∈ C2(Ω, R).

Jeśli f ma w a minimum (odpowiednio: maksimum) lokalne, to Hf(a) ≥ 0 (odpowiednio:

Hf(a) ≤ 0).

Dowód. Dla ustalenia uwagi załóżmy, że f ma w a minimum lokalne. W punkcie krytycz-nym fxi(a ) = 0 dla i = 1, 2, . . . , n. Dlatego ze wzoru Taylora (2.51) (patrz Wniosek2.59) otrzymujemy

1

2Hf(a + θ h)h, h = 1 2

X

1≤i,j≤n

fxixj(a + θ h)hihj = f (a + h) − f (a ) ≥ 0

dla wszystkich k h k dostatecznie małych. Ustalmy v ∈ Rn\ {0} i podstawmy w tej nie-równości h = t v , gdzie t ∈ R i |t|  1. Dzieląc obie strony przez 12t2 > 0, otrzymujemy

Hf(a + θtv)v, v ≥ 0 .

Przechodząc do granicy t → 0 i korzystając z ciągłości drugich pochodnych cząstkowych f otrzymujemy hHf(a )v, vi ≥ 0.

Jeśli f ma w a maksimum lokalne, to rozpatrujemy funkcję −f , która ma w tym punkcie minimum lokalne. 

Przydatna w praktyce jest oczywiście implikacja odwrotna.

Twierdzenie 2.63 (warunki dostateczne ekstremów lokalnych). Niech Ω ⊂ Rn bę-dzie zbiorem otwartym. Przypuśćmy, że f ∈ C2(Ω, R) ma w a ∈ Ω punkt krytyczny, tzn.

grad f ( a ) = 0. Wówczas:

(i) Jeśli Hf(x) ≥ 0 w pewnym otoczeniu punktu a, to f ma w a minimum lokalne.

(ii) Jeśli Hf(a) > 0, to f ma w a minimum lokalne właściwe.

(iii) Jeśli Hf(x) ≤ 0 w pewnym otoczeniu punktu a, to f ma w a maksimum lokalne.

(iv) Jeśli Hf(a) < 0, to f ma w a maksimum lokalne właściwe.

Dowód. Ponieważ fxi(a ) = 0 dla i = 1, 2, . . . , n, więc ze wzoru Taylora (2.51) otrzymujemy 1

2Hf(a + θ h)h, h = f (a + h) − f (a) ,

gdzie θ = θ( h ) ∈ (0, 1). Z tej równości natychmiast wynikaja podpunkty (i) oraz (iii) Twierdzenia2.63.

Załóżmy teraz, że A := Hf(a ) > 0. Funkcja Sn−1 3 v 7→ φ(v) = hAv, vi jest wtedy dodatnia i ciągła na sferze jednostkowej Sn−1, która jest zbiorem zwartym. Wobec twier-dzenia Weierstrassa o przyjmowaniu kresów, istnieją stałe α, β > 0 takie, że

β ≥ φ(v) = hAv, vi ≥ α > 0 dla wszystkich v ∈ Sn−1.

Podstawiając w tej nierówności v = w /k w k, gdzie w ∈ Rn jest dowolnym wektorem różnym od 0, otrzymujemy

βkwk2 ≥ hAw, wi ≥ αkwk2 > 0 dla wszystkich w ∈ Rn\ {0}.

Dlatego, z nierówności Schwarza i definicji normy macierzy, Hf(a + θ h)h, h

= hAh, hi +

Hf(a + θ h) − A h, h

≥ αkhk2

Hf(a + θ h) − A h

· khk (2.52)

≥ αkhk2

Hf(a + θ h) − A · khk2

Ponieważ f ∈ C2, więc wszystkie współrzędne macierzy Hf(x ) zależą od x w sposób ciągły. Istnieje zatem liczba δ > 0 taka, że jeśli 0 < k h k < δ i θ ∈ (0, 1), to

Hf(a + θ h) − Hf(a ) =

Hf(a + θ h) − A < α

2 . Wtedy jednak, wobec (2.52),

f (a + h) − f (a ) = 1

2Hf(a + θ h)h, h > α

4khk2> 0 . To dowodzi punktu (ii). Dowód (iv) jest taki sam. 

Uwaga 2.64. W dowodach podpunktów (ii) oraz (iv) w Twierdzeniu2.63nie trzeba za-kładać, że f ∈ C2. Wystarczy po prostu, żeby f była różniczkowalna na zbiorze Ω i jej druga różniczka D2f (a ) istniała w punkcie krytycznym a i była w nim dodatnia (wtedy f ma w a minimum lokalne właściwe) bądź ujemna (wtedy f ma w a maksimum lokalne właściwe). W dowodzie wykorzystuje się wzór Taylora z resztą Peano. Zainteresowany Czytelnik zdoła sam uzupełnić szczegóły rozumowania.

Zanim przejdziemy do przykładów, przytoczymy jeszcze twierdzenie, które pozwala wnioskować, kiedy f z pewnością nie ma ekstremum lokalnego w punkcie krytycznym.

Twierdzenie 2.65. Załóżmy, że f ∈ C1(Ω, R) ma w a ∈ Ω punkt krytyczny i D2f (a) istnieje. Jeśli Hf(a) = D2f (a) ma wartość własną λ1 > 0i wartość własną λ2 < 0, to f nie ma ekstremum lokalnego w punkcie a.

Dowód. Niech vibędzie unormowanym wektorem własnym macierzy Hf(a ), odpowiada-jącym wartości własnej λi, gdzie i = 1, 2. Dla dostatecznie małej liczby δ > 0 rozpatrzmy dwie funkcje pomocnicze,

gi(t) = f (a + tvi), |t| < δ , i = 1, 2.

Mamy gi0(t) = Df (a + tvi)vi, tzn. g0i(0) = 0, oraz

g00(t) = hD2f (a + tvi)vi,vii .

Zatem g100(0) = hD2f (a )v1,v1i = λ1kv1k2 = λ1 > 0. Podobnie, g002(0) = λ2 < 0. Dlatego g1 ma minimum lokalne właściwe w zerze, a g2ma maksimum lokalne właściwe w zerze.

Wynika stąd, że f nie ma ekstremum lokalnego w punkcie a (gdyby miała, to każda z funkcji gv = f (a + tv) miałaby w zerze ekstremum lokalne tego samego typu, co f ).  To, czy macierz Hf(a ) = D2f (a ) jest dodatnia (ujemna), można rozpoznawać za po-mocą kryterium Sylvestera.

Twierdzenie 2.66 (kryterium Sylvestera). Niech A = (aij) ∈ Mn×n(R) i aij = ajidla wszystkich i, j = 1, 2, . . . , n. Oznaczmy

d` = det aij

i,j=1,...,`, ` = 1, 2, . . . , n . (i) Jeśli d`> 0dla każdego ` = 1, 2, . . . , n, to A > 0.

(ii) Jeśli (−1)`d` > 0dla każdego ` = 1, 2, . . . , n, to A < 0.

(iii) Jeśli d` 6= 0 dla każdego ` = 1, . . . , n, ale nie zachodzi ani założenie (i), ani założe-nie (ii), to macierz A ma wartości własne różnych znaków.

Dowód Czytelnik miał okazję poznać na wykładach z Algebry Liniowej. Zaintereso-wanym polecam książkę A. Mostowskiego i M. Starka Elementy algebry wyższej.

Uwaga 2.67. Jeśli f : Rn ⊃ Ω → R jest klasy C2, ma punkt krytyczny a ∈ Ω i wszystkie wartości własne macierzy D2f (a ) są różne od zera, to mówimy, że a jest niezdegenrowa-nym punktem krytyczniezdegenrowa-nym. Z Twierdzeń 2.65i 2.63wynika, że o tym, czy funkcja f ma w niezdegenerowanym punkcie krytycznym ekstremum lokalne, można jednoznacznie przesądzić, badając znaki wartości własnych macierzy D2f (a ).

Uwaga 2.68. Podkreślmy wyraźnie: założenie ostrych nierówności w punktach (ii) i (iv) Twierdzenia2.63jest istotne. Każda z funkcji

f1(x, y) = x4+ y4, f2(x, y) = −x4− y4, f3(x, y) = x4− y4, (x, y) ∈ R2 ma (jedyny) punkt krytyczny w (0, 0). Jest oczywiste, że dla funkcji f1 ten punkt jest minimum lokalnym właściwym, dla f2 – maksimum lokalnym właściwym, natomiast f3

w ogóle nie ma tym punkcie ekstremum lokalnego. Mamy jednak D2fi(0, 0) =0 0

0 0



, i = 1, 2, 3.

Biorąc

f4(x, y) = x2+ y4, f5(x, y) = x2, f6(x, y) = x2− y4, (x, y) ∈ R2

otrzymamy

– minimum lokalne (które nie jest właściwe), natomiast f6 w ogóle nie ma ekstremum.

Przykład 2.69. Niech h(x, y) = ay(ex− 1) + x sin x + 1 − cos y dla x, y ∈ R. Wykażemy, że h ma ekstremum lokalne w punkcie (0, 0) wtedy i tylko wtedy, gdy a ∈ (−√

2,√ 2).

Pochodne cząstkowe funkcji h są równe

hx(x, y) = ayex+ sin x + x cos x, hy(x, y) = a(ex− 1) + sin y ,

więc (niezależnie od wartości parametru a ∈ R) jest hx(0, 0) = hy(0, 0) = 0 i h ma w zerze punkt krytyczny. Dalej, obliczamy

hxx(x, y) = ayex+ 2 cos x − x sin x, hxy(x, y) = aex, hyy = cos y.

Podstawiając x = y = 0 otrzymujemy D2h(0, 0) =2 a że macierz D2h(0, 0) jest dodatnio określona, a więc h ma minimum lokalne właściwe w punkcie (0, 0) (patrz Twierdzenie2.63(ii)).

Jeśli a 6∈ [−

√2,√

2], to det D2h(0, 0) = 2 − a2 < 0. Macierz D2h(0, 0) ma więc wartości własne różnych znaków i wobec Twierdzenia2.65h nie ma w zerze ekstremum lokalnego.

Przypadek a = ±

√2 trzeba rozpatrzeć osobno. Macierz D2h(0, 0) ma wtedy wartości własne 3 i 0, więc nie jest dodatnia i nie wolno stosować Twierdzenia2.63 (ii); jak wy-nika z wcześniej przytoczonych przykładów, w takiej sytuacji funkcja może zarówno mieć ekstremum lokalne, jak i go nie mieć.

Dla ustalenia uwagi, niech a =

√2. Użyjemy wzoru Taylora (najprościej jest w tym przypadku wykorzystać znane rozwinięcia funkcji elementarnych) i napiszemy

h(x, y) = y√ ekstremum w zerze: wyrazy trzeciego rzędu we wzorze Taylora powodują, że h(x, −x

√ 2) zmienia znak w każdym otoczeniu 0 ∈ R, a przecież h(0, 0) = 0. Przypadek a = −

√2 sprawdza się tak samo; Czytelnik łatwo uzupełni szczegóły obliczeń.

Czytelnik może sprawdzić, że kierunek prostej y = −x

2 jest wyznaczony przez wek-tor v ∈ S1 taki, że D2h(0, 0)(v, v) = 0. W innych kierunkach hesjan ma dodatnie warto-ści. Sprawdzaliśmy więc w istocie, jak zachowuje się funkcja h wokół zera “w podejrzanym kierunku” – i to wystarczyło, by stwierdzić brak ekstremum lokalnego. 

Ilustracja do Przykładu2.69. Parametr a =

2. Mamy wówczas h(x, y) = P (x, y)+o(x3) + o(y3) dla x, y → 0, gdzie

P (x, y) = x + y

2

2

+yx2

2

jest wielomianem Taylora rzędu 3 funkcji h wokół zera. Po lewej: poziomice funkcji P , narysowane na płasz-czyźnie R2 (w dziedzinie funkcji). Zbiór punktów w R2, opisany równaniem P (x, y) = 0, to krzywa z wyraź-nym dziobkiem. Po prawej: fragment wykresu funkcji P , tzn. powierzchnia w R3o równaniu z = P (x, y).

Ilustracja do Przykładu2.70. Krzywe g(x, y) = const na płaszczyźnie R2. W punkcie krytycznym (0, 0) spo-tykają się dwa szerokie grzbiety i dwie wąskie, wygięte doliny.

W Przykładzie 2.69 wystarczyło użyć twierdzeń 2.63 i 2.65 (dających automa-tyczne kryteria badania funkcji wokół punktu krytycznego), a w wątpliwym przy-padku zbadać zachowanie funkcji na pro-stych, przechodzących przez punkt kry-tyczny. Podkreślmy jednak, że z zachowa-nia funkcji na poszczególnych takich pro-stych nie wolno wnioskować, że ma ona ekstremum lokalne!

Przykład 2.70. Niech

g(x, y) = (y − x3)(y − 3x3) dla (x, y) ∈ R2. Wtedy

gx(x, y) = 18x5− 12x2y, gy(x, y) = −4x3+ 2y, gxx(x, y) = 90x4− 24xy, gxy(x, y) = −12x2, gyy(x, y) = 2.

Zatem funkcja g ma w zerze (jedyny) punkt krytyczny;

D2g(0, 0) =0, 0 0 2



≥ 0.

Na każdej prostej y = kx jest g(kx, x) = k2x2 + o(x3) dla x → 0, a więc obcięcie funk-cji g do takiej prostej ma w zerze minimum lokalne (właściwe). Na prostej x = 0 jest g(x, y) = g(0, y) = y2(tzn. znów mamy funkcję jednej zmiennej, która ma minimum w ze-rze). Jednak na krzywej y = 2x3 jest g(x, y) = g(x, 2x3) = −x6, a więc w dowolnie małym otoczeniu zera funkcja g przyjmuje nie tylko wartości dodatnie, ale także ujemne.

Zadanie 2.71. Sprawdzić, że funkcja f(x, y) = e−x(xe−x+ cos y), x, y, ∈ R ma nieskoń-czenie wiele punktów krytycznych, a w każdym z nich – maksimum lokalne właściwe. Za pomocą dowolnie wybranego pakietu obliczeń symbolicznych narysować jej wykres i jej poziomice na płaszczyźnie.