Uwarunkowanie macierzy, a błąd w ﬂ ν - Trzynaście Wykładów z Matematyki Obliczeniowej

Pokazaliśmy, że eliminacja Gaussa jest numerycznie poprawna w klasie macierzy A ∈ R^n×n takich, że

cond(A) ≤ M,

gdzie M < ∞ jest jakąkolwiek stałą niezależną od A. Okazuje się, że wielkość uwarunkowania macierzy, cond(A), ma też zasadniczy wpływ na błąd zadania rozwiązywania układu równań. Rzeczywiście, mamy bowiem następujące twierdzenie. (Poniżej norma wektorowa jest do-wolna, ale ustalona, a norma macierzowa jest przez nią indukowana, zob. U. 1.2.)

Twierdzenie 4.3 Niech E i ~e będą zaburzeniami odpowiednio macie-rzy A i wektora ~b takimi, że

kEk ≤ K¹νkAk i k~ek ≤ K²νk~bk, Jeśli

K₁νcond(A) < 1

to układ zaburzony (A + E)~x = (~b + ~e) ma jednoznaczne rozwiązanie ~z^∗ spełniające

k~z^∗− ~x^∗k ≤ (K1+ K2) ν cond(A)

1 − K¹νcond(A)k~x^∗k.

4.4. UWARUNKOWANIE MACIERZY, A BŁĄD W FLν 47 Dowód Zauważmy najpierw, że jeśli F jest macierzą taką, żekF k < 1 to macierz (I − F ) (gdzie I jest macierzą identycznościową) jest nie-osobliwa oraz

k(I − F )⁻¹k ≤ 1

1 − kF k. (4.8)

Rzeczywiście, gdyby (I−F ) była osobliwa to istniałby niezerowy wektor

~x taki, że (I − F )~x = 0, co implikuje kF~xk/k~xk = 1 i w konsekwencji kF k ≥ 1. Aby pokazać (4.8) zauważmy, że

1 = kIk = k(I − F )(I − F )⁻¹k

≥ k(I − F )⁻¹k − kF k k(I − F )⁻¹k

= (1 − kF k) k(I − F )⁻¹k, skąd bezpośrednio wynika (4.8).

Po podstawieniu F = −A⁻¹E mamy teraz

kF k ≤ kA⁻¹k kEk ≤ K1νkAk kA⁻¹k < 1,

co wobec równości A + E = A(I + A⁻¹E) daje, że macierz (A + E) jest nieosobliwa i układ zaburzony ma jednoznaczne rozwiązanie ~z^∗. Przedstawmy to rozwiązanie w postaci ~z^∗ = ~x^∗+ (~z^∗− ~x^∗). Rozpisując układ zaburzony i wykorzystując równość A~x^∗ = ~b otrzymujemy, że (A + E)(~z^∗− ~x^∗) = ~e − E~x^∗, czyli

~z^∗− ~x^∗ = (I + A⁻¹E)⁻¹A⁻¹(~e − E~x^∗), a stąd

k~z^∗− ~x^∗k ≤ k(I + A⁻¹E)⁻¹k kA⁻¹k (k~ek + kEk k~x^∗k

≤ kA⁻¹k

1 − K¹νkAk kA⁻¹k

K2νk~bk + K1νkAk k~x^∗k

≤ kAk kA⁻¹k

1 − K¹νkAk kA⁻¹k(K1+ K2) ν k~x^∗k, co kończy dowód. 2

Podsumowując Twierdzenia 4.2 i 4.3 otrzymujemy wniosek, który jest końcowym wynikiem tego rozdziału.

48 ROZDZIAŁ 4. ANALIZA BŁĘDÓW W ELIMINACJI GAUSSA Wniosek 4.2 Niech A będzie macierzą nieosobliwą. Dla dostatecznie silnej arytmetyki,

ν K(n) cond(A) ≪ 1

(gdzie K(n) jest pewną stłą niezależną od A i ν), eliminacja Gaussa z wyborem elementu głównego w kolumnie, zastosowana do rozwiązania układu A~x = ~b, jest w ﬂ_ν wykonalna i daje wynik ﬂ_ν(~x^∗) spełniający nierówność

kﬂν(~x^∗) − ~x^∗k ˜≤ K(n) ν cond(A) k~x^∗k. 2

Uwagi i uzupełnienia

U. 4.1 Jak zauważyliśmy w dowodzie Twierdzenia 4.1 stała kumulacji K(n) zależy zasadniczo od wzrostu maksymalnego elementu Gkw macierzach A^(k) powstających w kolejnych krokach eliminacji. Okazuje się, że uzyskane, pe-symistyczne oszacowanie G = max_kG_k ≤ 2ⁿ⁻¹G₀ jest praktycznie nie spo-tykane, choć teoretycznie może być osiągnięte. Przykładem jest macierz



U. 4.2 Eliminacja Gaussa bez przestawień wierszy jest numerycznie po-prawna, gdy element maksymalny w kolejnych macierzach A^(k) wzrasta w sposób niezależny od A. Na przykład, gdy Gk≤ mGk−1 to G ≤ m^k−1G₀ i w Twierdzeniu 4.1 mamy K(n) = 2n²m^k−1. Ma to miejsce wtedy gdy A jest symetryczna i dodatnio określona, albo ma dominującą główną przekątną, zob. U. 4.3 oraz Ćw. 4.5 i 4.6.

U. 4.3 Dla macierzy symetrycznych i dodatnio określonych, A = A^T > 0, eliminacja Gaussa jest wykonalna bez przestawień wierszy, zob. U. 3.7. W klasie tych macierzy eliminacja bez przestawień wierszy jest też numerycz-nie poprawna, a więc w szczególności algorytm Banachiewicza-Choleskiego

4.4. UWARUNKOWANIE MACIERZY, A BŁĄD W FLν 49 jest numerycznie popeawny. Wykażemy to pokazując, że maksymalny ele-ment w kolejnych macierzach A^(k) wzrasta co najwyżej dwukrotnie, tzn.

G_k ≤ 2Gk−1, 1 ≤ k ≤ n. W tym celu wykorzystamy fakt, że dla dowolnej symetrycznej i dodatnio określonwj macierzy B = (bi,j) mamy bi,i > 0, oraz spełniona jest nierówność

b²_i,j < bi,ibj,j, ∀i, j (4.9) (zob. Ćw. 4.1). Jak wykazaliśmy w U. 3.7, każda z macierzy A^(k) jest syme-tryczna i dodatnio określona, Stąd

|a^(k)i,j| = |a^(k−1)i,j − li,ka^(k−1)_k,j |

≤ |a^(k−1)_i,j | + |a^(k−1)_i,k |

|a^(k−1)_k,k ||a^(k−1)_k,j |

≤ r

a^(k−1)_i,i a^(k−1)_j,j + q

a^(k−1)_i,i a^(k−1)_k,k q

a^(k−1)_k,k a^(k−1)_j,j a^(k−1)_k,k

= 2 r

a^(k−1)_i,i a^(k−1)_j,j ≤ 2 max(a^(k−1)_i,i , a^(k−1)_j,j ), a w konsekwencji Gk≤ 2Gk−1.

Ćwiczenia

Ćw. 4.1 Wykazać, że macierz symetryczna 2 × 2 a c

c b

jest dodatnio określona wtedy i tylko wtedy, gdy a > 0 i ab > c². Wywnio-skować stąd nierównosc (4.9) dla macierzy symetrycznych i dodatnio określo-nych dowolnego wymiaru. Ponadto, największy co do modułu element takiej macierzy leży na głównej diagonali.

Ćw. 4.2 Wykazać, że macierz A jest dodatnio określona wtedy i tylko wtedy gdy dla każdego ~x ∈ Rⁿ wektory A~x i ~x tworzą w Rⁿ kąt ostry.

50 ROZDZIAŁ 4. ANALIZA BŁĘDÓW W ELIMINACJI GAUSSA Ćw. 4.3 Pokazać, że jeśli eliminację Gaussa z wyborem elementu głównego w kolumnie zastosujemy do macierzy trójdiagonalnej, to wzrost elementu maksymalnego macierzy nie będzie zależał od n. Dokładniej,

maxi,j,k |a^(k)_i,j| ≤ 2 max

i,j |ai,j|.

Ćw. 4.4 Pokazać, że dla macierzy Hessenberga (ai,j = 0 dla i ≥ j + 2) eliminacja Gaussa z wyborem elementu głównego w kolumnie daje

maxi,j,k |a^(k)i,j| ≤ (k + 1) max

i,j |ai,j|.

Ćw. 4.5 Pokazać numeryczną poprawność algorytmu przeganiania z U. 3.6.

Ćw. 4.6 Wykazać numeryczną poprawność eliminacji Gaussa bez przesta-wień wierszy dla macierzy z dominującą przekątną, tzn. gdy

2|ai,i| >

Xn j=1

|ai,j|, 1 ≤ i ≤ n.

Wskazówka. Zauważyć, że maxi,j|a^(k)i,j| ≤ 2 maxi,j|a^(k−1)i,j |.

Ćw. 4.7 Jeśli

(A + E)~z = ~b, (4.10)

gdzie kEkp ≤ KνkAkp, to oczywiście dla residuum ~r = ~b − A~z mamy k~rkp ≤ KνkAkpk~zkp. (4.11) Pokazać, że dla p = 1, 2, ∞ zachodzi też twierdzenie odwrotne, tzn. jeśli spełniony jest warunek (4.11) to istnieje macierz pozornych zaburzeń E taka, że kEkp ≤ KνkAkp oraz spełniona jest równość (4.10).

Wskazówka. Rozpatrzyć E = ~r(sgn zi)^T_1≤i≤n/k~zk1dla p = 1, E = ~r~z^T/k~zk²2

dla p = 2, oraz E = ~r(sgn zk)~e^T_k/k~zk∞dla p = ∞, gdzie k jest indeksem dla którego |zk| = k~zk∞.

Rozdział 5

Zadanie wygładzania liniowego

W tym rozdziale zajmiemy się zadaniem wygładzania liniowego, na-zywanym też liniowym zadaniem najmniejszych kwadratów. Jest ono uogólnieniem zadania rozwiązywania kwadratowych układów równań liniowych do przypadku, gdy układ jest nadokreślony.

5.1 Układ normalny

Niech A będzie daną macierzą o m wierszach i n kolumnach, A ∈ R^m×n, taką, że

m ≥ n = rank(A),

albo równoważnie, taką że jej wektory kolumny są liniowo niezależne.

Niech także dany będzie wektor ~b ∈ R^m. Jasne jest, że wtedy układ równań A~x = ~b nie zawsze ma rozwiązanie - mówimy, że układ jest nadokreślony.

Zadanie wygładzania liniowego polega na znalezieniu wektora ~x^∗ ∈ Rⁿ, który minimalizuje wektor residualny ~r = ~b −A~x w normie drugiej, tzn.

k~b − A~x^∗k² = min

x∈Rⁿk~b − A~xk².

Przykład 5.1 Przypuśćmy, że dla pewnej funkcji f : [a, b] → R ob-serwujemy jej wartości fi (dokładne lub zaburzone) w punktach ti,

52 ROZDZIAŁ 5. ZADANIE WYGŁADZANIA LINIOWEGO 1 ≤ i ≤ m. Funkcję tą chcielibyśmy przybliżyć inną funkcją w nale-żącą do pewnej n wymiarowej przestrzeni liniowej W , np. przestrzeni wielomianów stopnia mniejszego niż n. Jakość przybliżenia mierzymy wielkością

j=1cjwj(t), sprowadzamy problem do minimalizacji

względem cj, a więc do zadania wygładzania liniowego. Rzeczywiście, kładąc A = (ai,j) ∈ R^m×n z ai,j = wj(ti), ~b = (fi)^m_i=1 i ~x = (cj)ⁿ_j=1, wielkość (5.1) jest równa k~b − A~xk²2.

Lemat 5.1 Zadanie wygładzania liniowego ma jednoznaczne rozwiąza-nie ~x^∗, które spełnia układ równań

A^TA~x = A^T~b. (5.2)

Dowód Niech P ⊂ R^mbędzie obrazem A jako odwzorowania liniowego z Rⁿ w R^m,

P = { A~x : ~x ∈ Rⁿ}.

Ponieważ kolumny macierzy A są liniowo niezależne, tworzą one bazę w P . Stąd dim(P ) = n i odwzorowanie A : Rⁿ → P jest różnowar-tościowe. Ponadto przestrzeń R^m z normą drugą jest przestrzenią uni-tarną. Residuum jest więc minimalizowane dla wektora ~x^∗ ∈ Rⁿ ta-kiego, że A~x^∗ jest rzutem prostopadłym wektora ~b na podprzestrzeń P . (Przypomnijmy, że skończony wymiar P zapewnia, że taki rzut istnieje i jest wyznaczony jednoznacznie.) Równoważnie można powiedzieć, że residuum ~b − A~x^∗ jest prostopadłe do P ,

(A~x)^T(~b − A~x^∗) = 0, ∀~x ∈ Rⁿ, albo

x^T( ~A^T~b − A^TA~x^∗) = 0. ∀~x ∈ Rⁿ.

5.1. UKŁAD NORMALNY 53 Otrzymaliśmy więc, że wektor A^T~b − A^TA~x^∗ jest prostopadły w Rⁿdo każdego innego wektora. Ponieważ jedynym wektorem o tej własności jest wektor zerowy, to A^TA~x^∗ = A^T~b. 2

Zauważmy, że jeśli macierz A jest kwadratowa, m = n, to rozwią-zaniem jest ~x^∗ = A⁻¹~b i residuum jest zerem. Zadanie wygładzania li-niowego jest więc uogólnieniem rozwiązywania kwadratowych układów równań liniowych.

Równanie (5.2) nazywa się układem normalnym. Może ono nam sugerować sposób rozwiązania zadania wygładzania liniowego. Wystar-czy bowiem pomnożyć macierz A^T przez A i rozwiązać układ normalny.

Zauważmy ponadto, że macierz A^TAjest symetryczna i dodatnio okre-ślona, bo (A^TA)^T = A^TAi dla ~x 6= 0 mamy ~x^T(A^TA)~x = (A~x)^T(A~x) = kA~xk² >0, przy czym ostatnia nierówność wynika z faktu, że kolumny macierzy A są liniowo niezależne i dlatego A~x 6= ~0. Przy mnożeniu A^T przez A wystarczy więc obliczyć tylko elementy na głównej przekątnej i pod nią, a do rozwiązania równania z macierzą A^TA można zastoso-wać algorytm Banachiewicza-Choleskiego opisany w U. 3.7. Jak łatwo się przekonać, koszt takiego algorytmu wynosi n²(k + n/3), przy czym dominuje koszt mnożenia obliczenia macierzy A^TA.

Ma on jednak pewne wady. Mnożenie macierzy powoduje w ﬂ_ν po-wstanie “po drodze” dodatkowych błędów, które mogą nawet zmienić rząd macierzy. Na przykład, dla macierzy

A =

54 ROZDZIAŁ 5. ZADANIE WYGŁADZANIA LINIOWEGO Poniżej przedstawimy inną metodę rozwiązywania zadania wygła-dzania liniowego, która oparta jest na specjalnych przekształceniach zwanych odbiciami Hauseholdera.

W dokumencie Trzynaście Wykładów z Matematyki Obliczeniowej (Stron 51-59)