Rozwiązywanie algebraicznych układów równań liniowych metodami bezpośrednimi

(1)

1

Rozwiązywanie algebraicznych układów równań liniowych

metodami bezpośrednimi

(2)

Plan wykładu:

1. Definicje macierzy, norm etc.

2. Metoda eliminacji Gaussa, Jordana 3. Rozkład LU metodą Gaussa

4. Układy równań z macierzą symetryczną. Rozkłady: LDL^T, LL^T 5. Układy równań z macierzą trójdiagonalną

6. Iteracyjne poprawianie rozwiązań

7. Układy liniowe nadokreślone, układ normalny równań, metody ortogonalizacji

(3)

3 Pojęcia podstawowe

Macierz jest uporządkowanym układem mxn liczb rzeczywistych lub zespolonych A=(a_ij) (i=1,..,m; j=1,...,n)

Jeśli m=n to A jest kwadratowa stopnia n.

Macierz diagonalna D=(_ij d_ij)

Macierz jednostkowa I=(_ij)

A

_m_£n

= 2 6 6 4

a

₁₁

a

₁₂

: : : a

_1n

a

₂₁

a

₂₂

: : : a

_2n

: : : : : : : : : : : : a

m1

a

m2

: : : a

mn

3 7 7 5

D = 2 6 6 4

d

₁

0 : : : 0 0 d

₂

: : : 0 : : : : : : : : : : : :

0 0 : : : d

_n

3 7 7 5

(A

^T

)

^T

= A (®A)

^T

= ®A

^T

(A + B)

^T

= A

^T

+ B

^T

(AB)

^T

= B

^T

A

^T

(Ax)

^T

= x

^T

A

^T

Transpozycja - A=(a_ij) to A^T=(a_ji)

Ślad macierzy A=A_nxn

tr(A) = X

n

i=1

a

_ii

tr(A

^T

) = tr(A)

(4)

Jeśli

to macierz jest nieosobliwa i dla takiej macierzy istnieje macierz odwrotna A^-1

Macierz symetryczna

Macierz ortogonalna Q=Q_m_x_n

Macierz idempotentna

det(A) 6= 0

AA

^¡1

= A

^¡1

A = I (AB)

^¡1

= B

^¡1

A

^¡1

A

^T

= A

Q

^T

Q = I

Macierz trójkątna lewa (dolna)

Macierz trójkątna prawa (górna)

Sumy, iloczyny i odwrotności macierzy trójkątnych tego samego rodzaju są macierzami trójkątnymi.

Wyznacznik macierzy trójkątnej

L = 2 6 6 4

l

₁₁

0 : : : 0 l

₂₁

l

₂₂

: : : 0 : : : : : : : : : : : : l

n1

l

n2

: : : l

nn

3 7 7 5

R = 2 6 6 4

r

₁₁

r

₁₂

: : : r

_1n

0 r

₂₂

: : : r

_2n

: : : : : : : : : : : : 0 0 : : : r

nn

3 7 7 5

det(L) = l

11

l

22

: : : l

nn

Q

^¡1

Q = I

Q

^T

= Q

^¡1

(5)

5 Macierzą hermitowską nazywamy macierz, która

po transpozycji i sprzężeniu zespolonemu jej elementów jest równa macierzy pierwotnej

Elementy diagonalne macierzy hermitowskiej są rzeczywiste (pozostałe mogą być zespolone lub rzeczywiste).

Macierzą dodatniookreśloną nazywamy macierz rzeczywistą lub hermitowską o własności:

Macierz dodatnio określona jest zawsze odwracalna.

Macierz odwrotna jest również dodatnio określona.

Przestrzenią liniową (wektorową) nad ciałem liczb rzeczywistych (zespolonych) nazywamy zbiór obiektów (wektorów) z określonym działaniem

dodawania elementów przestrzeni oraz mnożenia ich przez liczbę i oznaczamy R^N (C^N).

Aksjomaty: łączność, przemienność, element neutralny, element odwrotny,....

A

^H

= ¡

A

^T

¢

¤

Uporządkowany zbiór liczb rzeczywistych (zespolonych) tworzy wektor

Przestrzeń wektorowa będąca zbiorem takich obiektów ma wymiar n.

Dowolny zbiór n wektorów liniowo niezależnych w R^N

tworzy bazę przestrzeni. Każdy element przestrzeni można zapisać jako kombinację liniową elementów bazy

Podprzestrzeń linową R w R^N tworzy zbiór wszystkich wektorów

Macierz możemy traktować jako obiekt

zbudowany z wektorów ( wektory wierszowe lub kolumnowe).

Rzędem macierzy A=A_mxn

nazywamy największą liczbę niezależnych liniowo wektorów wierszowych lub kolumnowych. Jeśli r=m=n to macierz jest nieosobliwa.

(6)

Normy wektorów i macierzy

Normy wprowadza się w celu ilościowego określania własności wektorów i macierzy.

Normą wektora nazywamy funkcję, która

każdemu elementowi w R^N przyporządkowuje liczbę rzeczywistą. Dla dowolnych

norma wektora musi spełniać następujące aksjomaty:

Dla n-wymiarowego wektora

najczęściej stosowane są normy z rodziny L_P:

- norma pierwsza

Dla dowolnego wektora x w przestrzeni Rⁿ

prawdziwe są poniższe relacje pomiędzy normami:

Normy macierzy

Własności norm macierzy

Normy zgodne – norma macierzy indukowana przez normę wektora

® 2 R

kxk

1

· kxk

²

· kxk

¹

· p

n kxk

²

· nkxk

1

(7)

7 Macierz o m wierszach i n kolumnach można

traktować jako operator liniowy przekształcający przestrzeń R^m w Rⁿ. Normę takiej macierzy można określić przy użyciu wektorów:

gdzie: p i q oznaczają normy wektorów w

przestrzeniach Rⁿ i w R^m. Mówimy, że norma ||A||_pq jest normą indukowaną przez normy ||.||_p oraz ||.||_q. Dla p=q oznaczając

możemy określić następujące normy macierzy - maksymalna suma modułów w kolumnie

- norma spektralna

kAk

^p

= kAk

^pq

kAk

¹

= max

j=1;2;:::;n

X

m i=1

ja

^ij

j

kAk

²

= ( max

i=1;:::;n

¸

_i

(AA

^T

))

¹⁼²

kAk

1

= max

i=1;2;:::;n

X

n j=1

ja

^ij

j

kAk

¹1

= max

i;j

ja

^ij

j

- maksymalna suma modułów w wierszu

- maksymalny moduł elementu

W przestrzeniach z normą ||⋅||₂ często używa się euklidesowej (Frobeniusa) normy macierzy:

która nie jest indukowana żadną normą ale spełnia ona z normą ||⋅||2 warunek zgodności:

Normy macierzy mają istotne znaczenie w analizie błędów (np. błędów rozwiązania układów równań liniowych).

kAk

^E

= v u u t

X

m i=1

X

n j=1

a

²_ij

(8)

Szukamy rozwiązania układu równań liniowych w postaci:

Powyższy układ równań można zapisać w postaci macierzowej:

gdzie:

- macierz współczynników układu

- szukany wektor - wektor wyrazów rozwiązań wolnych

a

₁₁

x

₁

+ a

₁₂

x

₂

+ : : : + a

_1n

x

_n

= b

₁

a

₂₁

x

₁

+ a

₂₂

x

₂

+ : : : + a

_2n

x

_n

= b

₂

: : : : : : : : : : : : : : : : : : : : : : : : : : : = : : : a

n1

x

1

+ a

n2

x

2

+ : : : + a

nn

x

n

= b

n

A = 2 6 6 4

a

₁₁

a

₁₂

: : : a

_1n

a

₂₁

a

₂₂

: : : a

_2n

: : : : : : : : : : : : a

n1

a

n2

: : : a

nn

3 7 7 5

Warunek rozwiązywalności układu niejednorodnego:

R(A) – podprzestrzeń liniowa rozpięta na wektorach kolumnowych macierzy A

Dla

warunek rozwiązywalności układu jest spełniony dla każdego b i rozwiązanie ma postać

Jeśli rank(A)=r<n to rozwiązania tworzą rozmaitość (n-r) wymiarową.

R(A) = R

_n

(9)

9 Układ równań z macierzą trójkątną

Zakładamy, że elementy leżące na diagonali są niezerowe.

Rozwiązanie układu można znaleźć posługując się wzorem rekurencyjnym, zaczynając od elementu x_n:

W celu wyznaczenia wszystkich składowych wektora rozwiązania x należy wykonać:

- M operacji mnożenia i dzielenia

- D operacji dodawania i odejmowania

a

11

x

1

+ a

12

x

2

+ : : : + a

1n

x

n

= b

1

a

₂₂

x

₂

+ : : : + a

_2n

x

_n

= b

₂

: : : : : : : : : : : : : : : : : :

a

_nn

x

_n

= b

_n

M = 1

2 n

²

+ 1 2 n

D = 1

2 n

²

¡ 1 2 n x

_n

= b

_n

a

nn

x

_i

= b

_i

¡ a

ⁱⁱ⁺¹

x

_i+1

¡ : : : ¡ a

ⁱⁿ

x

_n

a

_ii

(10)

Uwarunkowanie zadania - rozwiązania układu równań

Wpływ błędów zaokrągleń na wynik można oszacować analizując zaburzenia danych: A,b a) zaburzamy wektor b:

b) zaburzamy elementy macierzy A:

ostatnią nierówność zapisujemy w postaci

·(A) = jjAjj ¢ jjA

^¡1

jj

gdzie

jest wskaźnikiem uwarunkowania macierzy Korzystając z wyniku (a) oraz nierówności

dostajemy oszacowanie na błąd względny rozwiązania:

Wniosek - duży wskaźnik uwarunkowania macierzy może powodować duże względne zaburzenia

rozwiązania nawet dla małych zaburzeń wektora danych. Zadanie jest wówczas źle uwarunkowane.

(11)

11 Metoda eliminacji Gaussa rozwiązania układu

równań liniowych. Metoda jest dwuetapowa:

1) Eliminacja zmiennych. Układ pierwotny:

Odejmujemy od i-tego wiersza (i=2,3,...,n) wiersz pierwszy pomnożony przez współczynnik

Z równań i=2,3,..,n wyeliminowana została zmienna x₁.

a

⁽¹⁾₁₁

x

₁

+ a

⁽¹⁾₁₂

x

₂

+ : : : + a

⁽¹⁾_1n

x

_n

= b

⁽¹⁾₁

a

⁽¹⁾₂₁

x

₁

+ a

⁽¹⁾₂₂

x

₂

+ : : : + a

⁽¹⁾_2n

x

_n

= b

⁽¹⁾₂

: : : : : : : : : : : : : : : : : : : : : : : : : : : = : : : a

⁽¹⁾_n1

x

₁

+ a

⁽¹⁾_n2

x

₂

+ : : : + a

⁽¹⁾_nn

x

_n

= b

⁽¹⁾_n

l

_i1

= a

⁽¹⁾_i1

a

⁽¹⁾₁₁

a

⁽²⁾₁₁

x

1

+ a

⁽²⁾₁₂

x

2

+ : : : + a

⁽²⁾_1n

x

n

= b

⁽²⁾₁

a

⁽²⁾₂₂

x

2

+ : : : + a

⁽²⁾_2n

x

n

= b

⁽²⁾₂

: : : : : : : : : : : : : : : : : : : : : = : : :

a

⁽²⁾_n2

x

2

+ : : : + a

⁽²⁾_nn

x

n

= b

⁽²⁾_n

Powtarzamy operację, ale odejmujemy od i-tego wiersza (i=3,4,...,n) wiersz drugi pomnożony przez współczynnik

Postępując dalej w ten sposób eliminujemy z każdego następnego równania jedną zmienną.

Eliminację kończymy po (n-1) krokach, gdy uzyskamy trójkątny układ równań w postaci:

l

i2

= a

⁽²⁾_i2

a

⁽²⁾₂₂

a

⁽ⁿ⁾₁₁

x

₁

+ a

⁽ⁿ⁾₁₂

x

₂

+ : : : + a

⁽ⁿ⁾_1n

x

_n

= b

⁽ⁿ⁾₁

a

⁽ⁿ⁾₂₂

x

₂

+ : : : + a

⁽ⁿ⁾_2n

x

_n

= b

⁽ⁿ⁾₂

: : : : : : : : : : : : = : : :

a

⁽ⁿ⁾_nn

x

_n

= b

⁽ⁿ⁾_n

(12)

2) Etap drugi nazywany jest postępowaniem odwrotnym.

Rozwiązanie (kolejne składowe wektora x) znajdujemy stosując wzór rekurencyjny dla macierzy trójkątnej. Wyznaczenie rozwiązania metodą Gaussa wymaga wykonania:

- M op. mnożenia i dzielenia

- D op. dodawania i odejmowania

Metoda eliminacji w tej postaci jest niestabilna numerycznie – problem dzielenia przez 0 lub liczbę bliską zeru. Rozwiązanie:

a) częściowy wybór elementów głównych b) pełny wybór elementów głównych

Częściowy wybór elementów głównych W k-tym kroku szukamy elementu

M = 1

3 n

³

+ n

²

¡ 1 3 n

D = 1

3 n

³

+ 1

2 n

²

¡ 5 6 n

Pełny wybór elementów głównych W k-tym kroku szukamy elementu

i przestawiamy wiersze: k i r oraz kolumny: k i s

ja

^(k)rs

j = max

k·i;j·n;

ja

^kij

j

r k

k s

(13)

13 Stosując wybór elementu głównego

rozwiązanie otrzymujemy zawsze.

W trakcie wyboru elementu głównego należy zmienić także kolejność w x i b.

Modyfikacji tej można nie stosować dla:

a) macierzy z dominującą przekątną

b) macierzy symetrycznej i jednocześnie dodatniookreślonej

Metoda eliminacji Jordana (eliminacji zupełnej)

W układzie równań:

równanie pierwsze dzielimy obustronnie przez współczynnik:

ja

ⁱⁱ

j ¸

X

n j=1;j6=i

ja

^i;j

j (i = 1; : : : ; n)

a

⁽¹⁾₁₁

x

₁

+ a

⁽¹⁾₁₂

x

₂

+ : : : + a

⁽¹⁾_1n

x

_n

= b

⁽¹⁾₁

a

⁽¹⁾₂₁

x

₁

+ a

⁽¹⁾₂₂

x

₂

+ : : : + a

⁽¹⁾_2n

x

_n

= b

⁽¹⁾₂

: : : : : : : : : : : : : : : : : : : : : : : : : : : = : : : a

⁽¹⁾_n1

x

₁

+ a

⁽¹⁾_n2

x

₂

+ : : : + a

⁽¹⁾_nn

x

_n

= b

⁽¹⁾_n

w

₁

= a

⁽¹⁾₁₁

Następnie odejmujemy od i-tego wiersza (i=2,3,...,n) wiersz pierwszy przemnożony przez

i otrzymujemy

Podobnie postępujemy z równaniem drugim. Dzielimy je przez

Następnie od i-tego wiersza (i=1,3,4,...,n) odejmujemy wiersz drugi pomnożony przez współczynnik:

w

1i

= a

⁽¹⁾_i1

x

₁

+ a

⁽²⁾₁₂

x

₂

+ : : : + a

⁽²⁾_1n

x

_n

= b

⁽²⁾₁

a

⁽²⁾₂₂

x

2

+ : : : + a

⁽²⁾_2n

x

n

= b

⁽²⁾₂

: : : : : : : : : : : : : : : : : : : : : = : : :

a

⁽²⁾_n2

x

₂

+ : : : + a

⁽²⁾_nn

x

_n

= b

⁽²⁾_n

w

₂

= a

⁽²⁾₂₂

w

2i

= a

⁽²⁾_i2

(14)

Otrzymujemy zmodyfikowany układ równań:

Po przeprowadzeniu (n-1) eliminacji zmiennych układ równań ma poniższą postać:

czyli gotowe rozwiązanie. Liczba operacji:

x

₁

+ 0 ¢ x

²

+ a

⁽³⁾₁₃

x

₃

+ : : : + a

⁽³⁾_1n

x

_n

= b

⁽³⁾₁

x

2

+ a

⁽³⁾₂₃

x

3

+ : : : + a

⁽³⁾_2n

x

n

= b

⁽³⁾₂

: : : : : : : : : : : : : : : : : : : : : = : : :

a

⁽³⁾_n3

x

₃

+ : : : + a

⁽³⁾_nn

x

_n

= b

⁽³⁾_n

x

₁

= b

⁽ⁿ⁾₁

x

₂

= b

⁽ⁿ⁾₂

: : : = : : :

x

n

= b

⁽ⁿ⁾_n

Rozkład LU metodą Gaussa-Crouta(GCW) Metodę Gaussa można użyć do znalezienia takich macierzy L i U, które z macierzą A związane są relacją:

Procedura wyznaczania elementów tych macierzy nosi nazwę rozkładu LU.

Sposób postępowania (wykorzystujemy

metodę eliminacji Gaussa):

1) mnożenie wiersza pierwszego przez czynnik

i odjęcie go od i-tego wiersza (i=2...n), zastępujemy mnożeniem przez macierz:

A = L ¢ U

l

_i1

= a

⁽¹⁾_i1

a

¹₁₁

L

⁽¹⁾

= 2 6 6 6 6 4

1 0 : : : : : : 0

¡l

²¹

1 0 : : : 0

¡l

³¹

0 1 0 0

: : : : : : : : : 1 0

¡l

ⁿ¹

0 0 : : : 1

3 7 7

7 7

5

(15)

15 Macierze L⁽ⁱ⁾ są nieosobliwe (można znaleźć dla każdej macierz odwrotną). Przemnażając obie strony

powyższych równań przez (L^(n-1))^-1, (L^(n-2))^-1...., otrzymamy:

wprowadzamy oznaczenia

Jak znaleźć macierze (L⁽ⁱ⁾)^-1? Eliminacja zmiennej z równań (i=3,4,...,n)

wygląda podobnie. Mnożymy wiersze

zmodyfikowanego układu równań o indeksach i=3,4,...,n przez czynnik

i odejmujemy od nich wiersz drugi. Operację tą można przeprowadzić mnożąc układ równań obustronnie przez macierz L⁽²⁾:

Zapis macierzowy operacji:

Po wykonaniu (n-1) takich operacji dostajemy

l

i2

= a

⁽²⁾_i2

a

²₂

L

⁽²⁾

= 2 6 6 6 6 4

1 0 : : : : : : 0

0 1 0 0 : : :

0 ¡l

³²

1 0 0

: : : : : : : : : 1 0

0 ¡l

ⁿ²

0 0 1

3 7 7 7 7 5

L

⁽¹⁾

= 2 6 6 4

1 0 : : : 0

¡l

²¹

1 : : : 0 : : : : : : 1 0

¡l

ⁿ¹

0 : : : 1 3 7 7 5

³ L

⁽¹⁾

´

_¡1

= 2 6 6 4

1 0 : : : 0 l

21

1 : : : 0 : : : : : : 1 0 l

n1

0 : : : 1

3 7 7 5 L = (L

⁽¹⁾

)

^¡1

(L

⁽²⁾

)

^¡1

: : : (L

⁽ⁿ^¡1)

)

^¡1

U = A

⁽ⁿ⁾

=

µ

L

⁽ⁿ^¡1)

L

⁽ⁿ^¡2)

: : : L

⁽¹⁾

¶

A

⁽¹⁾

A = L ¢ U

(16)

Dysponując macierzami L i U można rozwiązać układ równań:

poprzez rozwiązanie 2 układów równań

Rozwiązanie każdego z równań wiąże się z nakładem obliczeń jak dla układu z macierzą trójkątną (~1n²).

Rozkład LU (eliminacja Gaussa) to nakład rzędu

~0.5n³. Sprawdzenie

macierz L jest macierzą dolną z jedynkami na diagonali:

macierz U jest macierzą górną z

niezerowymi elementami na diagonali:

L

⁽ⁱ⁾

³

L

⁽ⁱ⁾

´

_¡1

= I

L = (L

⁽¹⁾

)

^¡1

(L

⁽²⁾

)

^¡1

: : : (L

⁽ⁿ^¡1)

)

^¡1

L =

2 6 6 6 6 4

1 0 : : : : : : 0 l

21

1 0 : : : 0 l

31

l

32

1 0 0 : : : : : : : : : 1 0 l

n1

l

n2

l

n3

: : : 1

3 7 7 7 7 5

U = 2 6 6 6 6

u

11

u

12

u

13

: : : u

1n

0 u

22

u

23

: : : u

2n

0 0 u

33

: : : u

nn

3 7 7

7 7

(17)

17 Jaki jest wektor reszt rozwiązania?

Norma maksymalna wektora reszt może być mała nawet dla źle uwarunkowanych macierzy.

Zalety:

1) Duża wydajność dla dużej liczby równań. Rozkład LU opłaca się stosować w przypadku rozwiązywania wielu układów równań z tą samą macierzą współczynników układu A. Każdy układ równań różni się wtedy tylko wektorem wyrazów wolnych. Rozkład LU wykonuje się w takim przypadku tylko raz (ilość operacji ~n³).

Rozwiązanie pojedynczego układu równań można znaleźć przy zastosowaniu algorytmu postępowania odwrotnego (ilość operacji ~n²).

2) Oszczędność zajmowanej pamięci. Elementy macierzy L i U mogą zostać zapisane w macierzy A.

3) Jeśli macierz A jest symetryczna i dodatniookreślona to nie trzeba dokonywać wyboru elementów

podstawowych.

(18)

Układy równań z macierzą symetryczną.

Rozkład LDL^T

Oznaczmy rozkład LU jako:

Szukamy rozkładu macierzy A w postaci:

gdzie: L – macierz trójkątna dolna z jedynkami na diagonali, D – macierz diagonalna z elementami diagonalnymi macierzy , U – macierz trójkątna górna z jedynkami na diagonali

Wykorzystujemy symetrię macierzy

co prowadzi do rozkładu dla macierzy symetrycznych:

Rozwiązanie układu Ax=b:

A = LU

A = LDU

A = LDL

^T

Elementy rozkładu wyznaczamy rekurencyjnie

a dla i=2,3,...,n oblicza się na przemian:

Nakład obliczeń:

Zalety:

- nakład obliczeń dwukrotnie mniejszy niż w GCW

d

1

= a

11

l

ij

= a

ij

¡ P

j¡1

k=1

c

ik

l

jk

d

j

c

ij

= d

j

l

ij

; j = 1; 2; : : : ; i ¡ 1

d

_i

= a

_ii

¡

i¡1

X

k=1

c

_ik

l

_ik

M = 1

6 n

³

+ n

²

¡ 7 6 n D = 1

6 n

³

¡ 1 6 n

U ¹

U

^T

DL

^T

= A

^T

= A ) U = L

^T

(19)

19 Rozkład LL^T

(Banachiewicza-Cholesky'ego)

Jeśli macierz A jest macierzą symetryczną dodatnio określoną wówczas można dokonać następującego rozkładu:

Macierz L jest macierzą trójkątną dolną z elementami na diagonali mogącymi

się różnić od 1. Macierz

spełnia warunek

więc rozkład ten nie jest jednoznaczny. Jeśli jednak liczby na diagonali macierzy L są

dodatnie wówczas rozkład jest jednoznaczny, a elementy macierzy wyznaczamy ze wzorów:

A = LL

^T

A = ¹ L ¹ L

^T

l

ii

= v u

u ta

ii

¡

i¡1

X

k=1

l

²_ik

; i = 1; 2; : : : ; n

l

ji

= a

ji

¡ P

i¡1

k=1

l

jk

l

ik

l

ii

; j = i + 1; i + 2; : : : ; n

Nakład obliczeń:

Przykład

n ¡ p

D = 1

6 n

³

+ 1

2 n

²

+ 1 3 n

A = 2

4 4 2 2 2 5 3 2 3 6

3 5

i = 1 : l

11

= 2; l

21

= 1; l

31

= 1 i = 2 : l

22

= 2; l

32

= 1

i = 3 : l

33

= 2

A =

2 4 4 2 2 2 5 3 2 3 6

3 5

= 2

4 2 0 0 1 2 0 1 1 2

3 5 ¢

2 4 2 1 1 0 2 1 0 0 2

3 5 L = ¹ ¡L

M = 1

6 n

³

+ 1

2 n

²

¡ 2

3 n

(20)

Inne zastosowania rozkładu LU.

Obliczanie wyznacznika

Aby obliczyć wyznacznik macierzy A możemy posłużyć się rozkładem

Wyznacznik macierzy U jest iloczynem elementów stojących na diagonali tej macierzy (n-1 operacji mnożenia).

Odwracanie macierzy

Aby znaleźć przy pomocy macierzy L i U macierz odwrotną A

^-1

należy rozwiązać n układów równań:

A = LU

det(L) = 1

det(A + E) = det(LU )

= det(L)det(U ) = det(U )

Rozwiązania układów równań x

⁽ⁱ⁾

stanowią kolumny macierzy odwrotnej A

^-1

(po

uwzględnieniu ewentualnych przestawień wierszy wynikających z wyboru elementu podstawowego).

Przykład

Znaleźć macierz A

^-1

jeśli macierz A jest zdefiniowana:

A = 2

4 1 0 1 3 3 0 0 2 2

3 5

P = 2 4

2 3

3 5 L =

2 4

1 0 0

0 1 0

1

3

¡

¹₂

1 3

5 U = 2

4 3 3 0 0 2 2 0 0 2

3 5

x

⁽¹⁾

= 2

4 1=6 1=6

¡1=6 3

5 x

⁽²⁾

= 2

4 ¡1=4 1=4 1=4

3 5

x

⁽³⁾

= 2

4 1=2

¡1=2

3

5

(21)

21 Układy równań z macierzą trójdiagonalną

Szukamy rozwiązania układu równań:

Zdarza się że macierz układu równań ma postać (np.

równania z ilorazami różnicowymi):

Można wykonać rozkład LU macierzy T, macierze te mają postać:

L = 2 6 6 6 6 6 6 6 6 4

1 l

2

1 0

l

3

1 . . . ...

0 . .. ...

l

n

1 3 7 7 7 7 7 7 7 7 5

U = 2 6 6 6 6 6 6 6 6 4

u

1

c

1

u

2

c

2

0 u

3

c

3

. .. ...

0 . .. c

n¡1

u

n

3 7 7 7 7 7 7 7 7 5

Elementy macierzy rozkładu obliczamy rekurencyjnie:

Rozwiązanie układu Tx=b:

l

i

= a

i

u

i¡1

T = 2 6 6 6 6 6 6 6 6 4

d

1

c

1

a

2

d

2

c

2

a

3

d

3

c

3

. .. ... ...

. .. ... c

n¡1

a

n

d

n

3 7 7 7 7 7 7 7 7

5 u

1

= d

1

u

i

= d

i

¡ l

ⁱ

c

i¡1

; i = 2; 3; : : : ; n

(22)

Rozwiązanie:

nakład obliczeń: M=2n-2, D=n-1 liczba zajętych komórek: P=3n-2

Jeśli macierz jest dominująca kolumnowo to rozkład T=LU jest równoważny rozkładowi z częściowym wyborem elementu podstawowego (niezawodność metody).

Iteracyjne poprawianie rozwiązania układu równań

Błąd rozwiązania można sprawdzić obliczając wektor reszt:

x

n

= y

n

u

_n

gdzie: x jest poprawką, którą można łatwo wyznaczyć rozwiązując układ:

Należy jednak pamiętać, że wyznaczona poprawka do rozwiązania również jest przybliżeniem. Kolejne poprawione rozwiązanie, które uzyskamy będzie miało postać:

Jeżeli wektor reszt r=b-Ax jest obliczony dokładnie, poprawka x została wyznaczona metodą Gaussa- Crouta oraz zachodzi warunek:

wówczas norma wektora reszt obliczona w kolejnych iteracjach maleje

y

1

= b

1

y

i

= b

i

¡ l

ⁱ

y

i¡1

x

i

= y

i

¡ c

ⁱ

x

i+1

u

i

; i = n ¡ 1; n ¡ 2; : : : ; 1

(23)

23

Algorytm iteracyjnego poprawiania rozwiązania:

1. Rozwiązujemy układ Ax

⁽¹⁾

=b metodą Gaussa 2. Obliczamy wektor reszt r

⁽¹⁾

i sprawdzamy

rozwiązanie

3. Sprawdzamy czy poniższy warunek jest prawdziwy

jeśli nie to przerywamy obliczenia. Jeśli jest spełniony to kontynuujemy.

4. Obliczamy poprawkę i wyznaczamy

5. Wyznaczamy wektor reszt r

⁽²⁾

i sprawdzamy

rozwiązanie. W razie konieczności powtarzamy

kroki 3,4,5 aż do skutku.

(24)

Rozwiązywanie układów liniowych nadokreślonych – minimalizacja formy kwadratowej

Jak rozwiązać poniższy problem?

dla warunku

Brak dokładnego rozwiązania w większości przypadków. Można poszukiwać conajwyżej

„najlepszego” przybliżenia rozwiązania w sensie średniokwadratowym.

Dla

2 6 6 6 6 6 6 6 6 4

a

11

: : : a

1n

a

21

: : : a

2n

: : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : a

m1

: : : a

mn

3 7 7 7 7 7 7 7 7 5

¢ 2 6 6 4

x

1

: : : : : : x

n

3 7 7 5 =

2 6 6 6 6 6 6 6 6 4

b

1

b

2

: : : : : : : : : : : : b

m

3 7 7 7 7 7 7 7 7 5

m > n

Szukamy minimum funkcjonału F:

Minimum znajdziemy jeśli narzucimy warunek (różniczkujemy po kolejnych elementach wektora):

Dwa pierwsze wyrazy są identyczne, (podobnie 2 i 3) więc otrzymujemy warunek:

@F

@~ x = ~0

(25)

25 Jeśli macierz A jest macierzą o rozmiarach mxn i elementach

rzeczywistych, b jest wektorem m-elementowym, a x wektorem n elementowym spełniającym równanie

wówczas dla dowolnego n-elementowego wektora y spełniona jest nierówność

Dla dowolnego wektora otrzymujemy warunek

skąd wynika że wektor r jest ortogonalny do wszystkich wektorów z przestrzeni R(A) rozpiętej na wektorach kolumnowych macierzy A.

Dlaczego? - bo macierz A jest prostokątna i nie generuje bazy zupełnej.

Ponadto nadokreślony układ równań można przekształcić do postaci układu normalnego

Macierz A^TA jest symetryczna, dlatego układ normalny można rozwiązać metodą Cholesky'ego. Jeśli kolumny macierzy A są niezależne liniowo to macierz jest nieosobliwa.

(26)

Gdy kolumny A są niezależne liniowo, wówczas rozwiązanie układu jest jednoznaczne

gdzie macierz A^I:

jest pseudoodwrotnością macierzy A.

P_A jest operatorem rzutu ortogonalnego na przestrzeń rozpiętą na kolumnach macierzy A.

Uwaga: jeśli kolumny A są zależne liniowo (bardzo często) to wówczas istnieje wiele

rozwiązań (średniokwadratowych ) dających ten sam wektor reszt.

Przykład – wpływ uwarunkowania macierzy na rozwiązanie układu normalnego

A

^I

= (A

^T

A)

^¡1

A

^T

Przekształcamy do układu normalnego

Dla precyzji obliczeń rzędu 

i macierz A^TA staje się osobliwa – układ nie posiada rozwiązania.

Metody wykorzystujące rozkład QR

Dla macierzy A o rozmiarach mxn, w której kolumny są niezależne liniowo istnieje jednoznaczny rozkład w postaci

Q jest macierzą o rozmiarach mxn taką że:

A

^T

A = 2

4 1 + "

²

1 1 1 1 + "

²

1 1 1 1 + "

²

3 5

A

^T

b = 2 4 1

1 1

3 5

"

²

¼ 0

A = QR

(27)

27 R jest macierzą trójkątną górną z elementami

Warunek minimalizacji normy wektora reszt w sensie średniokwadratowym przyjmuje postać

Jak wyznaczyć macierze Q i R?

Zmodyfikowana metoda Grama-Schmidta Wyznaczamy ciąg macierzy

r

kk

= 1; k = 1; : : : ; n

A = A

⁽¹⁾

; A

⁽²⁾

; : : : ; A

⁽ⁿ⁺¹⁾

= Q

Założenia

1) k-1 pierwszych kolumn w A^(k) to także k-1 pierwszych kolumn w Q

2) kolumny

są ortogonalne do kolumn

Proces ortogonalizacji polega na rekurencyjnej ortogonalizacji kolumn o indeksie od k do n w k-tej iteracji względem kolumny q_k (usuwamy z nich przyczynki od q_k)

w ten sposób wyznaczamy k-tą kolumnę R (elementy r_kj) oraz kolumnę k+1 macierzy Q (elementy a_j^(k+1)).

Klasyczna met. GS:

(28)

klasyczna met. GS różni się kolejnością obliczeń:

Jednocześnie przekształcamy wektor b tj.:

Po n+1 krokach b⁽ⁿ⁺¹⁾ jest to część wektora

pierwotnego ortogonalna do R(A) i stanowi wektor reszt. Po przeprowadzeniu procesu ortogonalizacji do końca (jeśli kolumny macierzy A są liniowo

niezależne) dostajemy

Metoda Grama-Schmidta dla macierzy o liniowo zależnych kolumnach

S=R^-1 jest macierzą trójkątną górną.

Stąd wynika

Może się okazać że a₁, a₂,...,a_k-1 są niezależne liniowo, ale a_k jest już ich kombinacją (oraz wektorów q₁, q₂,...). Wtedy

(w macierzy Q) i powinniśmy przerwać proces ortogonalizacji.

Jeśli jednak

to istnieje wektor

Można więc przestawić kolumny j i k oraz

prowadzić proces ortogonalizacji do momentu gdy pozostałe wektory a^(k) nie będą liniowo

A = QR ! AR

^¡1

= Q ! Q = AS

rank(A) > k

a

^(k)_j

6= 0; k · j · n

a

^(k)_k

= 0

(29)

29 Dla rank(A)=r_A<n rozkład QR ma postać

gdzie: R_rxr -macierz trójkątna górna (r_kk=1) S- macierz o rozmiarach r_Ax(n-r_A)

Rozwiązania szukamy rozwiązując układ

gdzie: x₁ - ma r składowych, x₂ – jest dowolnym wektorem o n-r składowych (np. x₂=0).

Przykład zakładamy

" ¿ 1; "

²

¼ 0