Metody numeryczne – Wykład 5 – Metody rozwiązywania równań nieliniowych jednej zmiennej

(1)

Metody numeryczne – Wykład 5 – Metody rozwiązywania równań nieliniowych

jednej zmiennej

Marek Bazan

III rok - Elektornika

Semestr zimowy 2020/2021

(2)

Plan zajęć

1. Sformułowanie problemu 2. Zbieżność metod iteracyjnych 3. Metoda bisekcji

4. Metoda siecznych 5. Meoda stycznych

6. Szukanie miejsc zerowych wielomianu

(3)

Sformułowanie problemu

Dla funkcji ciągłej f : R → R znaleźć x, które jest jednym z rozwiązań lub x -y, które stanowią wszystkie rozwiązania problemu:

f (x ) = 0 przy czym f ∈ C⁰ ew. f ∈ C¹.

Na tym wykładzie powiemy o dwóch iteracyjnych metodach stacjonarnych - czyli takich dla których, każde przybliżenie x_k konstruowane jest wg tej samej reguły. Czyli

x_k+1 = ϕ(x_k, x_k−1, . . . , x_k−n; R(x_k, x_k−1, . . . , x_k−n, f )) dla k = n, n + 1, . . . , gdzie ϕ jst pewny operatorem, R oznacza zbiór informacji o funkcji f , z którego w każdym kroku korzysta ϕ.

Powiemy rónież o jednej metodzie nie stacjonarnej.

(4)

Zbieżność i złożoność obliczeniowa metod iteracyjnych

Definicja 1 (kula zbieżności) Jeżeli dla każdej funkcji f należącej do pewnej klasy F o zerze α ∈ Dx(f ) (dziedzina funkcji f ) istnieje liczba dodatnia Γ = Γ(ϕ; f ) taka, że dla każdego układu różnych przybliżeń początkowych należących do kuli

S = S (ϕ; f ) = {x ∈ C^N : ||x − α|| < Γ} ciąg {x_k} generowany metodą ϕ jest zbieżny do α, to mówimy, że metoda ϕ jest zbieżna w klasie F a S nazywamy kulą zbieżności ϕ dla funkcji f .

(5)

Zbieżność i złożoność obliczeniowa metod iteracyjnych (2)

Definicja 2 (wykładnik zbieżności) Wykładnikiem zbieżności metody iteracyjnej ϕ nazywamy najwększą liczbę p = p(ϕ) 1 taką, że dla każdej dostatecznie regularnej funkcji f o zerze prostym α ∈ Dx zachodzi równość

k→∞lim

||e_k+1||

||e_k||^p < ∞, (1)

gdzie e_k = x_k − α, a x_k jest ciągiem generowanym przez metodę ϕ dla funkcji f .

Nierówność (1) z definicji jest równoważna następującym zależnościom:

||e_k+1|| = A_k||e_k||^p, Ak = Ak(ϕ; f ) (2) oraz lim_k→∞sup A_k < ∞.

(6)

Zbieżność i złożoność obliczeniowa metod iteracyjnych (2)

Z (2) otrzymujemy nierówność

||e_k+1|| = A||e_k||^p, A = A(ϕ, f )^def= sup A_k. (3) W przypadku p = 1 z nierówności (3) wynika dla każdego k następująca zależność

||e_k|| ¬ A^k||e₀||. (4)

Jeżli A ∈ [0, 1), to mówimy, że metoda jest zbieżna liniowo z ilorazem A.

(7)

Zbieżność i złożoność obliczeniowa metod iteracyjnych (3)

Jeżeli natomiast p > 1, to mówimy, że zbieżność jest ponadliniowa.

Wówczas z nierówności (1) otrzymujemy

||e_k|| ¬ A^1+p+···+p^k−1||e₀||^p^k = (A^1/(p−1)||e₀||)^p^k−1||e₀|| (5) Porównując nierówności (4) i (5) widzimy, że jeżeli tylko

A^1/(1−p)||e₀|| nie jest zbyt bliskie 1 to redukcja błędu w przypadku p > 1 jest znacznie szybsza niż dla przypadku p = 1.

(8)

Metoda bisekcji

Niech f ∈ C⁰[a, b]. Załóżmy, że f (a)f (b) < 0. W metodzie bisekcji konstruujemy ciągłej {x_k} zdefniowany algorytmem

Dane: > 0 oraz a, b ∈ R takie, że f (a)f (b) < 0;

z₀= a;

y0 = b;

dla k = 0, 1, . . .

x_k = (z_k+ y_k)/2

Jeśli |f (xk)| < to xk jest rozwiązaniem. KONIEC.

Jeśli f (x_k) · f (z_k) > 0 to z_k+1= x_k; y_k+1 = y_k w przeciwnym przypadku z_k+1 = z_k; y_k+1 = x_k

(9)

Metoda bisekcji (2)

Zachodzą następujące zależności yk − z_k = yk−1− z_k−1

2 = · · · = 1

2^k(y0− z₀) z których wynika, że metoda jest zbieżna lioniwo tzn.

p = 1 z ilorazem

A = 1 2.

(10)

Metoda siecznych

Metoda siecznych korzysta ze standardowej informacji

R(x_k, x_k−1) = {f (x_k), f (x_k−1)} i jest metodą interpolacyjną. Jeśli x_k−1 i x_k są kolejnymi przybliżeniami miejsca zerowego α to k + 1 przybliżenie równe jest zeru wielomianu W_k stopnia pierwszego interpolującego funkcję f w punktach x_k−1 i x_k tzn

Wk(xk−j) = f (xk−j) gdzie j = {0, 1}

Wielomian W_k(x ) zapisujemy

Wk(x ) = f (xk) − f (xk−1)

x_k − x_k−1 (x − xk) + f (xk). (6)

(11)

Metoda siecznych (2)

Metoda przyjmuje więc postać:

x_k+1 = x_k − x_k − x_k−1

f (xk) − f (xk−1)f (x_k), (7) przy założeniu, że f (x_k) − f (x_k−1) 6= 0.

Ponadto wykładnik zbieżności tej metody to p = 1 +√

5 2 natomiast promień kuli zbieżności to

A = 2f⁰(α) f⁰⁰(α).

(12)

Metoda stycznych (Newtona)

Metoda stycznych korzysta ze standardowej informacji

R(x_k, x_k−1) = {f (x_k), f⁰(x_k)} i jest metodą interpolacyjną (użyta jest interpolacja Hermite’a). Jeśli x_k jest kolejnym przybliżeniem miejsca zerowego α to k + 1 przybliżenie równie jest zeru wielomianu Hermite’a W_k stopnia pierwszego interpolującego funkcję f i jej pochodną w punkci x_k tzn

W_k^{(j )}(x_k) = f^{(j )}(x_k) gdzie j = {0, 1}

Wielomian Wk(x ) zapisujemy

W_k(x ) = f⁰(x_k)(x − x_k) + f (x_k). (8)

(13)

Metoda stycznych (2)

Metoda przyjmuje więc postać:

x_k+1= x_k − f (x_k)

f⁰(xk). (9)

przy założeniu, że f⁰(x_k) 6= 0.

Ponadto wykładnik zbieżności tej metody to p = 2

natomiast promień kuli zbieżności to A = 2f⁰(α)

f⁰⁰(α).

(14)

Zera wielomianów - lokalizacja zer rzeczywistych

Problem lokalizacji zer wielomianu

f (x ) = a₀xⁿ+ a₁xⁿ⁻¹+ · · · + a_n−1x + a_n, a₀6= 0. (10) można ograniczyć do znalezienia kresu górnego R dodatnich zer tego wielomianu.

Mając taką metodę możemy wprowadzić trzy pomocnicze równania f1(x ) = xⁿf

1 x

= 0, (11)

f2(x ) = f (−x ) = 0, (12)

f3(x ) = xⁿf

−1 x

= 0, (13)

dla których kresy górne zer dodatnich są odpowiednio równe R₁, R₂, R₃, to wszystkie zera wielomianu (10) będą leżały w przedziale (1/R1, R) a ujemne w przedziale (−R2, −1/R3)

(15)

Zera wielomianów - lokalizacja zer rzeczywistych (2)

Twierdzenie (Lagrange’a) Niech a₀6= 0 i a_k (k 1) będzie pierwszym ujemnym współczynnikiem wielomianu (10). Wszystkie dodatnie zera tego wielomianu są mniejsze niż

R = 1 + ^k s A

|a₀|

gdzie A oznacza maksimum modułu ujemnych współczynników wielomianu. Jeśli wszystkie współczynniki wielomianu są nieujemne, to nie ma on zer dodatnich.m

(16)

Zera wielomianów - liczba zer rzeczywistych w przedziale

Liczbę zer rzeczywistych wielomianu

f (x ) = a₀xⁿ+ a₁xⁿ⁻¹+ · · · + a_n−1x + a_n, a₀6= 0. (14) w danym przedziale [a, b] wyznaczamy budując ciąg Sturma f₀(x ) ≡ f (x )

f1(x ) = f⁰(x )

f₂(x ) - jest resztą z dzialania f₀(x ) przez f₁(x ) f₃(x ) - jest resztą z dzialania f₁(x ) przez f₂(x ) f4(x ) - jest resztą z dzialania f2(x ) przez f3(x ) . . .

Zakładamy, że f_p+1(x ) ≡ 0, a f_p(x ) jest ostatnią resztą różną od zera.

Przykłady można znaleźć w http://www.algorytm.org/

procedury-numeryczne/ciag-sturma.html.

Jak dzielić wielomian przez wielomian

(https://en.wikipedia.org/wiki/Polynomial_greatest_

common_divisor#Euclidean_division)

(17)

Zera wielomianów - liczba zer rzeczywistych w przedziale (2)

Oznaczmy przez N(x0) liczbę zmian znaku w ciągu Sturma w punkcie x = x₀, w którym opuszczamy zera.

Twierdzenie (Sturma). Jeżeli ciąg (fi(x )), i = 0, 1, . . . , p, jest ciągiem Sturma na przedziale (a, b) i f₀(a) · f₀(b) 6= 0, to liczba różnych zer rzeczywistych wielomianu f (x ) leżących w tym przedziale jest równa N(a) − N(b).

(18)

Metody numeryczne – Wykład 5 – Metody rozwiązywania równań nieliniowych jednej zmiennej