Kwadratury Gaussa - Trzynaście Wykładów z Matematyki Obliczeniowej

10.3 Kwadratury Gaussa

Dla dowolnej n, niech x^∗₀, x^∗₁, . . . , x^∗_nbędą (różnymi) zerami (n+1)-szego wielomianu pn+1w ciągu wielomianów ortogonalnych w przestrzeni uni-tarnej L^2,ρ(a, b), tzn.

pn+1(x) = (x − x^∗0)(x − x^∗1) · · · (x − x^∗n). (10.1) Ponieważ x^∗_j leżą w przedziale (a, b), możemy mówić o kwadraturze interpolacyjnej opartej na tych węzłach.

Deﬁnicja 10.3 Kwadraturę interpolacyjną Q^GS_n opartą na zerach wie-lomianu ortogonalnego pn+1 nazywamy kwadraturą Gaussa.

Okazuje się, że właśnie kwadratury Gaussa mają najwyższy rząd.

Dokładniej, mamy następujące twierdzenie.

Twierdzenie 10.2 Kwadratura Gaussa Q^GS_n ma najwyższy rząd spo-śród wszystkich kwadratur opartych na węzłach o łącznej krotności n+1, oraz

rz(Q^GS_n ) = 2n + 2.

Dowód Wobec Lematu 10.1(ii) wystarczy pokazać, że kwadratura Q^GS_n jest dokładna dla każdego wielomianu stopnia nie większego niż 2n + 1.

Niech f ∈ Π²ⁿ⁺¹. Niech wf ∈ Πⁿ będzie wielomianem interpolującym f w węzłach-zerach x^∗₀, . . . , x^∗_n wielomianu pn+1. Jeśli deg f ≤ n to oczywiście wf = f i Q^GS_n (f) = Sρ(wf) = Sρ(f). Jeśli zaś

n+ 1 ≤ deg f ≤ 2n + 1,

to f − w^f jest wielomianem stopnia tego samego co f i zeruje się w x^∗_j, 0 ≤ j ≤ n. Stąd

f(x) − w^f(x) = (x − x^∗0)(x − x^∗1) · · · (x − x^∗n)g(x), gdzie g jest wielomianem,

deg g = deg f − (n + 1) ≤ (2n + 1) − (n + 1) = n.

124 ROZDZIAŁ 10. CAŁKOWANIE A APROKSYMACJA Korzystając z (10.1) i faktu, że pn+1jest prostopadły do Πn, ostatecznie otrzymujemy

Sρ(f) − Q^GSn (f) = ^Z ^b

a (f(x) − w^f(x))ρ(x) dx

= ^Z ^b

a (x − x^∗0) · · · (x − x^∗n)g(x)ρ(x) dx

= ^Z ^b

a pn+1(x)g(x)ρ(x) = hpⁿ⁺¹, gi = 0, co kończy dowód. 2

Zajmiemy się teraz błędem kwadratur Gaussa. Pokażemy, że również ze względu na błąd mają one dobre własności.

Twierdzenie 10.3 Jeśli f ∈ C²ⁿ⁺²([a, b]) to błąd kwadratury Gaussa Q^GS_n wyraża się wzorem

S_ρ(f) − Q^GSn (f) = kpⁿ⁺¹k²f⁽²ⁿ⁺²⁾(ξ) (2n + 2)!, gdzie ξ∈ [a, b]. Stąd, w szczególności,

max

f ∈F_M²ⁿ⁺¹([a,b])|S^ρ(f) − Q^GSn (f)| = Mkpⁿ⁺¹k² (2n + 2)! .

Dowód Niech wf ∈ Πnbędzie wielomianem interpolującym f w zerach x^∗_j wielomianu pn+1. Niech ˜w_f ∈ Π2n+1 będzie z kolei wielomianem (Hermite’a) interpolującym f w dwukrotnych węzłach x^∗_j, tzn. takim, że ˜wf(x^∗_j) = f(x^∗_j) i ˜w_f^′(x^∗_j) = f^′(x^∗_j), 0 ≤ j ≤ n. Ponieważ rz(Q^GSn ) = 2n + 2 to Q^GS_n ( ˜w_f) = Sρ( ˜w_f), a stąd i ze wzoru na błąd interpolacji Hermite’a mamy

Sρ(f) − Q^GSn (f) = Sρ(f) − Q^GSn (wf) = Sρ(f) − Q^GSn ( ˜wf)

= Sρ(f) − S^ρ( ˜wf) = ^Z ^b

a (f(x) − ˜wf(x))ρ(x) dx

= ^Z ^b

a (x − x^∗0)²· · · (x − x^∗n)²f(x^∗₀, . . . , x^∗_n, x)ρ(x) dx

= ^Z ^b

a p²_n+1(x)ρ(x)f(x^∗₀, . . . , x^∗_n, x) dx.

10.3. KWADRATURY GAUSSA 125 Ponieważ funkcja p²_n+1(x)ρ(x) jest prawie wszędzie dodatnia, możemy teraz zastosować twierdzenie o wartości średniej, aby ostatecznie otrzy-mać

Sρ(f) − Q^GSn (f) = f⁽²ⁿ⁺²⁾(ξ) (2n + 2)!

Z _b

a p²_n+1(x)ρ(x) dx

= f⁽²ⁿ⁺²⁾(ξ)

(2n + 2)! kpn+1k², co kończy dowód. 2

Na końcu, zwrócimy jeszcze uwagę na inną, bardzo ważną własność kwadratur Gaussa, a mianowicie, że ich współczynniki są dodatnie.

Rzeczywiście, zapisując

Q^GS_n (f) = ^Xⁿ

j=0

ajf(xj) i podstawiając

f_j(x) = (x − x^∗0)²· · · (x − x^∗j−1)²(x − x^∗j+1)²· · · (x − x^∗n)² mamy, że fj ∈ Π²ⁿ i fj jest prawie wszędzie dodatnia. Stąd

0 < Sρ(fj) = Q^GS_n (fj) = ajfj(x^∗_j)

i aj > 0, bo fj(x^∗_j) > 0. Przypomnijmy, że dodatniość współczynni-ków kwadratury ma duże znaczenie przy numerycznym ich obliczaniu, zwłaszcza gdy funkcja podcałkowa f ma stały znak, zob. Rozdział 2.5.2.

Mimo niewątpliwych zalet kwadratur Gaussa, ich stosowalność ogra-niczają trudności w wyliczeniu pierwiastków wielomianów ortogonal-nych, gdy stopień wielomianu jest duży. Wyjątkiem są tutaj kwadra-tury interpolacyjne oparte na zerach wielomianów Czebyszewa, zob. U.

10.3.

Uwagi i uzupełnienia

U. 10.1 Pokażemy teraz, że wielomiany ortogonalne {pk}k≥0 w danej prze-strzeni L2,ρ(a, b) spełniają następującą formulę trójczłonową. Załóżmy dla

126 ROZDZIAŁ 10. CAŁKOWANIE A APROKSYMACJA uproszczenia, że współczynnik przy x^k w wielomianie pk jest dla każdego k jednością. Wtedy istnieją liczby β_k (dla k ≥ 1) i γk > 0 (dla k≥ 2) takie, że

p₀(x) = 1,

p₁(x) = (x − β1), (10.2)

p_k(x) = (x − βk)p_k−1(x) − γkp_k−2(x), k≥ 2.

Aby to pokazać zauważmy, że p_k można dla k ≥ 1 przedstawić w postaci rozwinięcia

p_k(x) = (x − ck−1)p_k−1(x) +

k−2X

j=0

c_jp_j(x).

Mnożąc skalarnie obie strony tego równania przez p_s dla 0 ≤ s ≤ k − 3, otrzymujemy

0 = hpk(x), ps(x)i = h(x − ck−1)pk−1(x), ps(x)i + cshps(x), ps(x)i.

Wobec tego, że (x−ck−1)p_s(x) jest wielomianem stopnia mniejszego niż k−1, mamy

h(x − ck−1)pk−1(x), ps(x)i = hpk−1(x), (x − ck−1)ps(x)i = 0,

a stąd c_shps(x), p_s(x)i = 0 i cs = 0. Możemy więc napisać, że dla k = 1 mamy p1(x) = (x − β1), a dla k ≥ 2,

p_k(x) = (x − βk)pk−1(x) − γkp_k−2(x), (10.3) gdzie β_k = c_k−1 i γ_k = c_k−2. Aby jawnie wyznaczyć β_k i γ_k, pomnożymy skalarnie obie strony równania (10.3) kolejno przez pk−1i pk−2. Otrzymujemy

0 = hpk(x), pk−1i

= h(x − βk)p_k−1(x), p_k−1(x)i − γkhpk−2(x), p_k−1(x)i

= hxpk−1(x), p_k−1(x)i − βkhpk−1(x), p_k−1(x)i, czyli

β_k = hxp_k−1(x), p_k−1(x)i hpk−1(x), p_k−1(x)i , oraz

0 = hpk(x), p_k−2(x)i

= h(x − βk)p_k−1(x), p_k−2(x)i − γkhpk−2(x), p_k−2(x)i

= hpk−1(x), xpk−2(x)i − γkhpk−2(x), pk−2(x)i,

10.3. KWADRATURY GAUSSA 127 a stąd i z równości hpk−1(x), xpk−2(x)i = hpk−1(x), pk−1(x)i,

γ_k = hp_k−1(x), pk−1(x)i hpk−2(x), pk−2(x)i.

Zauważmy, że z formuły trójczłonowej wynika w szczególności algorytm wyznaczenia ciągu wielomianów ortogonalnych. Wystarczy bowiem wyzna-czać kolejne współczynniki β_ki γ_k(obliczając odpowiednie iloczyny skalarne hxpk(x), pk(x)i i hpk(x), pk(x)i) i stosować wzór rekurencyjny (10.2). Do-dajmy jeszcze, że w obliczeniach numerycznych najlepiej jest przechowywać informację o ciągu {pk}k≥0 po prostu w postaci liczb β_k i γ_k.

U. 10.2 Wygodnie jest posłużyć się wielomianami ortogonalnymi w przy-padku, gdy chcemy znaleźć najlepszą aproksymację danej funkcji f wielomia-nem ustalonego stopnia n, i błąd mierzymy w normie przestrzeni L2,ρ(a, b).

Rzeczywiście, jak wiadomo, najlepszą aproksymacją dla f w przestrzeni Πn

jest jej rzut prostopadły na Πn. Ponieważ n + 1 początkowych wielomianów ortogonalnych p_k, 0 ≤ k ≤ n, tworzy bazę w Πn, rzut ten wyraża się wzorem

w_f^∗ = Xn k=0

hf, pki hpk, pkip_k.

U. 10.3 Zachodzi następujące twierdzenie Łuzina. Niech przedział [a, b] bę-dzie skończony. Niech Qn(f) =^Pⁿ_j=0a⁽ⁿ⁾_j f (x⁽ⁿ⁾_j ) będzie takim ciągiem kwa-dratur, że:

(i) wszystkie współczynniki a⁽ⁿ⁾_j są dodatnie,

(ii) rząd kwadratur Qn rośnie do nieskończoności gdy n → ∞.

Wtedy ciąg Q_n(f) zbiega do ^R_a^bf (x)dx dla każdej funkcji ciągłej f .

Zauważmy, że twierdzenie to stosuje się do ciągu kwadratur Gaussa Q^GS_n , ale nie do ciągu kwadratur Newtona-Cotesa Q^{N C}_m , ponieważ w tych ostatnich pojawiają się dla dużych n współczynniki ujemne.

W praktyce, najczęściej stosuje się ciąg kwadratur interpolacyjnych opar-tych na zerach kolejnych wielomianów Czebyszewa, ponieważ zera te dane są jawnie i “zagęszczają się”, tzn. zera wielomianu Czebyszewa T_ksą też zerami wielomianu T2k. Powstające w ten sposób kwadratury noszą nazwę formuł Clanshow-Curtis’a. Są one w pewnym sensie uniwersalne, bowiem posiadają optymalną szybkość zbieżności n^−(r+1) w klasach F_M^r ([a, b]) dla dowolnych r i M .

128 ROZDZIAŁ 10. CAŁKOWANIE A APROKSYMACJA U. 10.4 Jeśli przedział całkowania jest skończony i waga jest jednostkowa to kwadratury Gaussa (a dokładniej kwadratury Legendre’a) można użyć do tworzenia kwadratur złożonych ¯Q^GS_r,k, gdzie k oznacza liczbę podprzedzia-łów. Łatwo widać, że dla f ∈ F_M^2r+1([a, b]), błąd takiej kwadratury można

czyli jest on porównywalny do błędu “zwykłej” złożonej kwadratury interpo-lacyjnej. Jednak złożona kwadratura Legendre’a korzysta z dwa razy mniej-szej liczby węzłów.

U. 10.5 Błąd złożonej kwadratury Legendre’a w klasie F_M^2r+1([a, b]) można podać dokładnie. Wystarczy wykorzystać wzory z Ćw. 10.4 i 10.5, aby otrzy-mać

(a) jeśli kwadratura jest dokładna dla dowolnych n + 1 wielomianów tworzą-cych bazę w Π_n, to jest ona rzędu co najmniej n + 1, oraz

(b) jeśli kwadratura jest rzędu n + 1 to jest ona niedokładna dla każdego wielomianu stopnia dokładnie n + 1.

Ćw. 10.2 Uzasadnić, że kwadratura prostokątów jest kwadraturą Legen-dre’a, natomiast żadna z kwadratur Newtona-Cotesa Q^{N C}_n nie jest kwadra-turą Gaussa.

Ćw. 10.3 Załóżmy, że dane są liczby β_k i γ_k deﬁniujące ciąg wielomia-nów ortogonalnych przez formułę trójczłonową. Zaproponować ekonomiczny (tzn. o koszcie proporcjonalnym do n) algorytm obliczania wartości n-tego wielomianu ortogonalnego w danym punkcie x, wykorzystujący formułę trój-członową.

10.3. KWADRATURY GAUSSA 129

Wskazówka. Wykorzystać fakt, że dla n-tego wielomianu Legendre’a mamy R₁

będzie kwadraturą interpolacyjną opartą na zerach (n+1)-ezego wielomianu Legendre’a. Niech −∞ < a < b < ∞. Pokazać, że wtedy kwadratura

Q˜^GS_n (f) = b− a

jest kwadraturą Gaussa opartą na n + 1 węzłach, dla całki na przedziale (a, b) z wagą jednostkową. Ponadto, jeśli f ∈ C⁽²ⁿ⁺²)([a, b]), to ortogonalnego Legendre’a (tzn. na przedziale [−1, 1] z wagą 1). Niech dla 0 ≤ j ≤ n,

w_j = ^Z ¹

−1

(x − x0) · · · (x − xj−1)(x − xj+1) · · · (x − xn) (xj− x0) · · · (xj − xj−1)(xj− xj+1) · · · (xj− xn)dx.

Pokazać, że jeśli f i g są wielomianami stopnia nie większego niż n, to ich iloczyn skalarny w L2,1(−1, 1),

hf, gi =

130 ROZDZIAŁ 10. CAŁKOWANIE A APROKSYMACJA

Rozdział 11

Iteracje dla równań liniowych

Algorytmy rozwiązywania układów równań liniowych postaci A~x = ~b,

gdzie A jest nieosobliwą macierzą rzeczywistą n × n, a ~b jest wektorem rzeczywistym w Rⁿ, które rozpatrywaliśmy w Rozdziałach 3, 4 i 5, na-leżą do grupy algorytmów dokładnych albo bezpośrednich. To znaczy, że po wykonaniu skończonej liczby dopuszczalnych operacji elementarnych dostajemy w arytmetyce idealnej dokładne rozwiązanie

~x^∗ = A⁻¹~b.

W tym rozdziale zajmiemy się algorytmami iteracyjnymi rozwiązy-wania układów równań liniowych. Polegają one na tym, że, startując z pewnego przybliżenia początkowego ~x0, konstruuje się ciąg kolejnych przybliżeń

~xk = Φk(A,~b; ~x0), k = 1, 2, . . . , które w granicy osiągają rozwiązanie dokładne,

k→∞lim ~xk = ~x^∗.

131

132 ROZDZIAŁ 11. ITERACJE DLA RÓWNAŃ LINIOWYCH

11.1 Kiedy stosujemy iteracje?

Jasne jest, że algorytmy iteracyjne stosujemy wtedy, gdy są one konku-rencyjne w stosunku do algorytmów bezpośrednich. Dlatego przekształ-cenia Φk należy wybierać tak, aby kolejne przybliżenia można było ła-two obliczać i jednocześnie kolejne błędy k~x^k− ~x^∗k szybko zbiegały do zera.

Zwykle zakłada się również, że dokładne rozwiązanie ~x^∗ jest punk-tem stałym przekształcenia Φk(A,~b; ·). Wtedy kolejne błędy spełniają zależność

~xk− ~x^∗ = Φk(A,~b; ~x0) − Φ^k(A,~b; ~x^∗).

Jeśli teraz Φk(A,~b; ·) są lipschitzowskie ze stałymi m^k <+∞, tzn. dla pewnej normy wektorowej k · k mamy

kΦk(~x) − Φ^k(~y)k ≤ m^kk~x − ~yk, ∀~x, ~y, to

k~x^k− ~x^∗k ≤ m^kk~x⁰− ~x^∗k.

Warunek limk→∞mk = 0 jest więc dostateczny na to, aby metoda była zbieżna dla dowolnego przybliżenia początkowego ~x0, przy czym szyb-kość zbieżności zależy od tego, jak szybko mk maleją do zera. Dla więk-szości stosowanych metod Φk jest funkcją liniową błędu początkowego, tzn.

Φk(A,~b; ~x0− ~x^∗) = Mk(~x0− ~x^∗),

gdzie Mk jest pewną macierzą. Wtedy jako mk można przyjąć normę tej macierzy,

mk = kM^kk = sup

k~xk=1kMk~xk.

Dla ilustracji, rozpatrzmy ogólną metodę iteracji prostej, w której

~xk = B~xk−1 + ~c, (11.1) dla pewnej macierzy B wymiaru n × n i wektora ~c ∈ Rⁿ. W tym przypadku

~xk− ~x^∗ = B^k(~x0− ~x^∗),

11.1. KIEDY STOSUJEMY ITERACJE? 133 a stąd i z nierówności kB^kk ≤ kBk^k, mamy

k~xk− ~x^∗k ≤ kBk^kk~x0− ~x^∗k.

Warunkiem dostatecznym zbieżności iteracji prostych jest więc kBk <

1. Mówimy, że metoda jest zbieżna liniowo z ilorazem kBk.

Przykład 11.1 Rozkładając macierz A = (ai,j)ⁿ_i,j=1 na sumę A = D + C,

gdzie D jest macierzą diagonalną składającą się z wyrazów stojących na głównej przekątnej macierzy A, układ A~x = ~b jest równoważny układowi

D~x = −C~x + ~b,

a stąd (o ile na przekątnej macierzy A nie mamy zera) otrzymujemy metodę iteracyjną

~xk = B~xk−1 + ~c,

gdzie B = −D⁻¹C i ~c = D⁻¹~b, zwaną metodą Jacobiego.

W metodzie Jacobiego warunek dostateczny zbieżności, kBk < 1, jest spełniony wtedy, gdy macierz A ma dominującą przekątną, tzn.

gdy

2|a^i,i| >

Xn j=1

|ai,j|, 1 ≤ i ≤ n. (11.2) Rzeczywiście, ponieważ wyraz (i, j) macierzy D⁻¹C wynosi 0 dla i = j i ai,j/ai,i dla i 6= j, to

kD⁻¹Ck∞ = max

1≤i≤n

Xn j=1,j6=i

|ai,j|/|ai,i|

= max

1≤i≤n

Xn j=1

|ai,j|/|ai,i| − 1 < 1, przy czym ostatnia nierówność wynika z (11.2).

Inne przykłady iteracji prostych podane są w U. 11.3 i Ćw. 11.2.

Zastanówmy się teraz nad złożonością metod iteracyjnych. Ponieważ możemy jedynie znaleźć pewne przybliżenie rozwiązania dokładnego ~x^∗,

134 ROZDZIAŁ 11. ITERACJE DLA RÓWNAŃ LINIOWYCH przez złożoność metody będziemy rozumieli koszt kombinatoryczny ob-liczenia ~xkz zadaną dokładnością ε > 0. Dla uproszczenia założymy, że medoda jest zbieżna liniowo z ilorazem m. Zauważmy, że aby zreduko-wać błąd początkowy do ε > 0, wystarczy wykonać k = k(ε) iteracji, gdzie k spełnia

m^kk~x0− ~x^∗k ≤ ε, czyli

k ≥ log(1/ε) − log(1/k~x⁰ − ~x^∗k)

log(1/m) .

Liczba ta zależy więc w istotny sposób od błędu początkowego i (przede wszystkim) od stałej Lipschitza m, natomiast zależność od dokładności εi wymiaru n układu jest dużo mniej istotna. Zakładając, że koszt jed-nej iteracji wynosi c = c(n) (zwykle c(n) jest tym mniejszy, im mniejsza jest liczba niezerowych elementów macierzy A), złożoność metody jest proporcjonalna do

c(n) log(1/ε) log(1/m).

Stąd oczywisty wniosek, że metody iteracyjne warto stosować zamiast metod bezpośrednich w przypadku gdy

• wymiar n układu A~x = ~b jest “duży”, oraz

• macierz A układu jest “rozrzedzona”, tzn. ma stosunkowo nie-wielką liczbę elementów niezerowych, np. proporcjonalną do n.

Układy o tych własnościach powstają często przy numerycznym roz-wiązywaniu równań różniczkowych cząstkowych.

Zaletą metod iteracyjnych jest również ich prostota, przez co są one łatwe do zaprogramowania.

W dokumencie Trzynaście Wykładów z Matematyki Obliczeniowej (Stron 128-139)