Metoda Newtona - Układy równań nieliniowych. Metoda Newtona

9. Układy równań nieliniowych. Metoda Newtona

9.3. Metoda Newtona

W przypadku równania skalarnego, f : R → R, metoda stycznych (zwana też metodą New-tona) rozwiązywania równania f (x) = 0 jest zadana wzorem

x_k+1= x_k− ^{f (x}^k⁾ f0(x_k).

Przez analogię, gdy F : R^N ⊃ D → RN można więc byłoby zdefiniować wielowymiarową

metodę Newtona wzorem

x_k+1 = x_k− F⁰(x_k)⁻¹F (x_k), (9.2) gdzie F⁰(x_k) oznaczałoby macierz pochodnej F w punkcie x_k. Jak za chwilę się przekonamy, jest to rzeczywiście bardzo dobry pomysł, a tak określona metoda zachowuje (z zachowaniem właściwych proporcji) wszystkie cechy metody Newtona znane nam z przypadku skalarnego!

9.3.1. Analiza zbieżności metody Newtona

Wielowymiarową metodę Newtona i różne jej warianty będziemy analizowali przy pewnych dość ogólnych założeniach dotyczących funkcji F : R^N ⊃ D → RN. W skrócie, będziemy je nazywali za [9] założeniami standardowymi :

1. Zbiór D jest otwarty i niepusty, a F jest różniczkowalna w D. 2. Istnieje rozwiązanie x^∗ ∈ D:

F (x^∗) = 0. 3. Pochodna F⁰ : D → L(R^N) jest lipschitzowska ze stałą L:

∃L > 0 kF⁰(x) − F⁰(y)k ¬ Lkx − yk ∀x, y ∈ D,

przy czym norma po lewej stronie nierówności jest normą operatorową indukowaną przez normę wektorową w R^N obecną po prawej stronie, tzn. dla liniowego operatora A : R^N →

R^N,

kAk = sup

x6=0

kAxk kxk ^.

4. Macierz pochodnej w rozwiązaniu, F⁰(x^∗), jest nieosobliwa.

Lematy techniczne

Przez K(x^∗, δ) będziemy oznaczali kulę otwartą o środku w x^∗ i promieniu δ,

K(x^∗, δ) = {x ∈ R^N : kx − x^∗k < δ}.

Lemat 9.1 (użyteczna wersja twierdzenia o wartości średniej). Niech będą spełnione założenia standardowe i niech K będzie otwartą kulą w D. Wtedy dla każdego x, y ∈ K,

F (y) − F (x) =

Z 1 0

F⁰(x + t(y − x)) (y − x) dt.

Dowód. Ustalmy x, y ∈ K. Ponieważ K ⊂ D jest wypukły, to x + t(y − x) dla t ∈ [0, 1] i dla t ∈ [0, 1] jest dobrze określona funkcja g(t) = F (x + t(y − x)).

Na mocy założeń standardowych F⁰(·) jest ciągła na ¯K, zatem także g⁰(t) = F⁰(x + t(y −

x))(y − x) jest ciągła na [0, 1] (i całkowalna). Teza lematu wynika więc z podstawowego

twier-dzenia rachunku różniczkowego, że Z 1

108 9. Układy równań nieliniowych. Metoda Newtona Lemat 9.2 (o lokalnym oszacowaniu funkcji i pochodnej). Przy założeniach standardowych, istnieje dostatecznie małe δ > 0 takie, że dla dowolnego x ∈ K(x^∗, δ) zachodzi:

1. kF⁰(x)k ¬ 2kF⁰(x^∗)k,

2. kF⁰(x)⁻¹k ¬ 2kF⁰(x^∗)⁻¹k,

3. ¹

2kF0(x∗)−1k^{kx − x}

∗k ¬ kF (x)k ¬ 2kF0(x^∗)kkx − x^∗k,

Ćwiczenie 9.1. Wykaż, że przy założeniach standardowych x^∗ musi być izolowanym rozwią-zaniem równania F (x) = 0.

Rozwiązanie. Z lematu9.2o oszacowaniu funkcji, istnieje otoczenie U 3 x^∗ takie, że 1

2kF0(x∗)−1k^{kx − x}

∗k ¬ kF (x)k.

Jeśli więc dla ˜x leżącego w tym otoczeniu F (˜x) = 0, to znaczyłoby to, że k˜x − x^∗k ¬ 0, a więc

x = x^∗. Czyli w U nie ma innych rozwiązań niż x^∗.

Twierdzenie 9.3 (o zbieżności metody Newtona). Przy standardowych założeniach, istnieją C > 0 (dostatecznie duże) i δ > 0 (dostatecznie małe) takie, że jeśli x₀ ∈ K(x∗, δ), to ciąg (x_k) zadany metodą Newtona (9.2) jest dobrze określony,

xk∈ K(x^∗, δ), oraz xk→ x^∗. Co więcej, ciąg ten jest zbieżny kwadratowo:

kx_k+1− x^∗k ¬ Ckx_k− x^∗k2 ∀k ∈ N. (9.3)

Dowód. Dowód będzie opierał się na wykazaniu oszacowania (9.3), pozostałe elementy tezy będą jego konsekwencją.

Na wstępie wybierzmy δ takie, by zachodził lemat 9.2 o oszacowaniu funkcji i pochodnej. Oznaczając e_k = x_k− x∗ mamy ze wzoru Newtona

e_k+1 = e_k− F⁰(x_k)⁻¹F (x_k). Na mocy założeń standardowych i lematu o wartości średniej,

F (x_k) = F (x_k) − F (x^∗) = Z 1 0 F⁰(x^∗+ t(x_k− x^∗))(x_k− x^∗) dt = Z 1 0 F⁰(x^∗+ te_k)e_kdt, zatem e_k+1= e_k− F⁰(x_k)⁻¹ Z 1 0 F⁰(x^∗+ te_k)e_kdt = F⁰(x_k)⁻¹ Z 1 0 F⁰(x_k) − F⁰(x^∗+ te_k) e_kdt.

Korzystając z lipschitzowskości pochodnej i raz jeszcze z lematu 9.2 o oszacowaniu pochodnej, dostajemy ke_k+1k ¬ kF⁰(x_k)⁻¹k Z 1 0 kF⁰(x_k) − F⁰(x^∗+ te_k)k ke_kk dt ¬ 2kF⁰(x^∗)⁻¹k Lke_kk² Z 1 0 (1 − t) dt =: Cke_kk².

Stąd wynika, że jeśli Cδ < 1 oraz x_k∈ K(x∗, δ), to także x_k+1 ∈ K(x∗, δ), a więc ciąg (x_k) jest dobrze określony. Co więcej, gdy Cδ < 1 to

ke_k+1k ¬ Cke_kk² = Cke_kk ke_kk ¬ Cδke_kk,

a więc ciąg e_k jest zbieżny (co najmniej liniowo — a w rzeczywistości co najmniej kwadratowo) do zera.

Ćwiczenie 9.2. Wykaż, że jeśli w założeniach standardowych zastąpić warunek

lipschitzow-skości pochodnej warunkiem

∃α ∈ (0, 1] ∃L > 0 kF⁰(x) − F⁰(y)k ¬ Lkx − yk^α ∀x, y ∈ D,

(czyli założyć, że F⁰ jest w swej dziedzinie h¨olderowska z wykładnikiem α), to metoda Newtona będzie lokalnie zbieżna z wykładnikiem zbieżności co najmniej 1 + α.

Wskazówka. Wystarczy powielić dowód twierdzenia przy standardowych założeniach, modyfiku-jąc oszacowanie kF⁰(x_k) − F⁰(x^∗+ te_k)k.

Ćwiczenie 9.3. Jak, przy założeniach standardowych, oszacować normę błędu, kx_k−x^∗k, przez

normę residuum, kF (x_k)k?

9.3.2. Implementacja metody Newtona

Implementując metodę Newtona, nie będziemy rzecz jasna nigdy explicite wyznaczali ma-cierzy odwrotnej F⁰(x_k)⁻¹, tylko rozwiązywali układ równań z macierzą F⁰(x_k) — tę jednak będziemy już musieli wyznaczyć. Pamiętając także o tym, że metoda Newtona jest metodą ite-racyjną, stosując ją będziemy musieli zadbać o postawienie sensownego kryterium zatrzymania metody. Odkładając na bok pytanie o konkretny warunek stopu (por. rozdział 7.5), możemy schematycznie zapisać algorytm realizujący metodę Newtona w następujący sposób:

Schemat metody Newtona

function Newton(x, F, stop) while not stop do begin

oblicz macierz pochodnej F⁰(x); rozwiąż F0(x)s = F (x);

x = x − s;

end return(x);

Ćwiczenie 9.4. Macierzowe zadanie własne dla symetrycznej macierzy A ∈ R^{N ×N}, znajdowa-nia pary (x, λ) ∈ R^N× R spełniającej

Ax = λx, x 6= 0

można potraktować jako kwadratowe równanie nieliniowe dla F : R^{N +1} → RN +1 danej na przykład wzorem

F (x, λ) = ^{Ax − λx}

1 −¹₂x^Tx

Zdefiniuj metodę Newtona dla F . Wykaż, że jeśli λ jest jednokrotną wartością własną, to metoda Newtona dla F będzie lokalnie zbieżna kwadratowo.

Rozwiązanie. Mamy

F⁰(x, λ) = A − λI −x −xT 0

Zatem metodę Newtona można — jeśli tylko F⁰(x, λ) nieosobliwa — zaimplementować, korzy-stając na przykład ze wzoru Shermana–Morrisona (por. ćwiczenie5.23).

110 9. Układy równań nieliniowych. Metoda Newtona

Zauważmy, że F jest funkcją gładką, jej pochodna jest lipschitzowska ze stałą Lipschitza równą... no właśnie, ile? Mamy

F⁰(x, λ) − F⁰(y, µ) = ^{(µ − λ)I} y − x

(y − x)^T 0 !

zatem

kF⁰(x, λ) − F⁰(y, µ)k₁ = max{|µ − λ| + |(y − x)₁|, . . . , ky − xk₁} ¬ ky − xk₁+ |µ − λ| = k x λ ! − ^y µ ! k₁.

A więc — w normie indukowanej normą k · k₁ — F⁰ jest lipschitzowska ze stałą równą 1. Pozostaje jeszcze sprawdzić, czy w rozwiązaniu — parze własnej x^∗, λ^∗— macierz pochodnej jest nieosobliwa. Ponieważ dla macierzy symetrycznej A = QΛQ^T, gdzie Λ jest macierzą diagonalną z wartościami własnymi macierzy A, a kolumny macierzy ortogonalnej Q są wektorami własnymi odpowiadającymi tym wartościom własnym, to

QT 1 ! F⁰(x, λ) Q 1 ! = ^{Λ − λI} QTx x^TQ 0 ! .

Niech λ^∗ = λ_i. Wtedy x^∗ = Cq_i dla pewnej stałej C. Mamy więc, że Λ − λ^∗I jest macierzą

diagonalną, która na diagonali ma zero jedynie na i-tej pozycji (na mocy założenia, że λ^∗ jest pojedynczą wartością własną) oraz Q^Tx = Ce_i, gdzie e_i oznacza i-ty wektor jednostkowy. Nietrudno sprawdzić wprost, że taka macierz jest pełnego rzędu.

Ćwiczenie 9.5 (Metoda Schultza wyznaczania macierzy odwrotnej, [15]). Niech A będzie ma-cierzą nieosobliwą i rozważmy iterację

X_k+1= X_k+ X_k(I − AX_k),

startującą z macierzy kwadratowej X₀. Wykaż, że jeśli kI − AX₀k < 1, to X_k → A−1 gdy

k → ∞.

Wskazówka. Wykaż, że kI − AX_k+1k = kI − AX_kk2, a metoda jest w rzeczywistości metodą Newtona zastosowaną do równania macierzowego F (X) = A − X⁻¹ = 0.

Przykład 9.4 (Metoda Newtona dla równania Allena–Cahna). Przypomnijmy (zob.

przy-kład 9.1), że równanie nieliniowe, które nas interesuje w przypadku stacjonarnym ma postać

F (U_N) = P_NU_N + f (U_N), a w przypadku ewolucyjnym —

F (U_N) = U_N + τ (P_NU_N+ f (U_N)). Oba przypadki możemy zatem ogarnąć, definiując funkcję

Fτ,α(U_N) = αU_N + τ (P_NUN + f (U_N)),

która dla α = 1 i τ 1 daje nam przypadek ewolucyjny, a dla α = 0 i τ = 1 redukuje się do przypadku stacjonarnego równania Allena–Cahna.

Wystarczy więc tylko wyznaczyć pochodną F_τ,α⁰ (U_N). Ponieważ (traktując f jako funkcję na R^N²)

to ∂fj ∂u_k^(U^N^{) =} ( 1 − 3u²_j, k = j, 0, k 6= j, zatem ostatecznie F_τ,α⁰ (U_N) V = (αI + τ (P_N+ diag(1 − 3u²_j))) V.

Przykład 9.5 (Numeryczne eksperymenty z metodą Newtona dla równania Allena–Cahna).

Dla uproszczenia, w eksperymentach numerycznych dotyczących działania różnych metod roz-wiązywania równania Allena–Cahna opisywanego w przykładzie 9.1, będziemy rozważać dys-kretyzacje jednowymiarowego stacjonarnego równania Allena–Cahna,

(T_Nu)j+ δu_j(1 − u²_j) = g_j, j = 1, . . . , N,

gdzie δ = 10 oraz g_j = j/(N + 1). %

% rozwiazania zadania z macierza rozrzedzona %

disp(’Matematyka obliczeniowa II’);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% function [x, resid, info, output] = newton(nazwa f, nazwa df, x0, atol, rtol, step, maxit)

% [x, resid, info, output] = newton(nazwa f, x0, atol, rtol, step, maxit)

To tylko fragment skryptu Octave. Możesz go uruchomić na _http: //mst.mimuw.edu.pl/lecture.php?lecture=mo2&part=Ch9.

Ćwiczenie 9.6. Przeprowadź podobne eksperymenty numeryczne dla równania Allena–Cahna

10. Wariacje na temat metody Newtona

Podstawowy element metody Newtona — rozwiązywanie równania zlinearyzowanego — w przypadku, gdy N jest duże, może stanowić wąskie gardło całego procesu iteracyjnego. Dla-tego w tym i następnym rozdziale poszukamy skutecznych metod ominięcia Dla-tego ograniczenia; jednak na początek przytoczymy inną wersję twierdzenia o zbieżności, która (przy silniejszych założeniach) zagwarantuje nam także istnienie rozwiązań.

W dokumencie Matematyka obliczeniowa II – MIM UW (Stron 107-112)