Wykład 14 Wstęp do metod przybliżonych

(1)

Wykład 14

Wstęp do metod przybliżonych

14.1 Wariacyjna definicja rozwiązań uogólnionych

Rozważamy równanie

Au = f (14.1)

w pewnej przestrzeni Hilberta H. Zakładamy, że operator A określony jest na pewnej podprze- strzeni liniowej D A ⊂ H i jego wartości leżą w H. Na mocy twierdzenia o minimum funkcjonału kwadratowego (13.39) wiemy, że jeśli równanie Au = f jest spełnione dla u ₀ ∈ D _A , tzn. Au ₀ = f , to funkcjonał F (u) = (Au, u) − 2 (f, u) osiąga swoją najmniejszą wartość w D _A w punkcie u = u ₀ . Nie wiadomo jednak, czy taki element u 0 ∈ D A istnieje.

Będziemy teraz usiłowali rozszerzyć D _A do takiego zbioru, na którym funkcjonał F (u) osiąga minimum.

Załóżmy, że A jest dodatnio określony, tzn. symetryczny oraz dla pewnej stałej C > 0 zachodzi nierówność

(Au, u) ≥ C ² kuk ² (14.2)

dla każdego u ∈ D _A .

W podprzestrzeni D _A definiujemy nowy iloczyn skalarny określony wzorem

(u, v) _A = (Au, v) . (14.3)

Łatwo pokazać, że wszystkie aksjomaty iloczynu skalarnego są spełnione. Iloczyn ten zadaje normę w D _A określoną jako

kuk _A = q

(u, u) _A . (14.4)

Z założenia (14.2) wynika, że kuk A ≥ Ckuk zatem ciągi zbieżne w normie k · k _A są zbieżne także w normie standardowej k · k.

Niech teraz H _A oznacza uzupełnienie D _A w normie k · k _A . Przestrzeń liniową H _A nazywamy przestrzenią Friedrichsa generowaną przez operator A. Można pokazać, że wzór (14.3) może być w naturalny sposób rozszerzony dla wszystkich u, v ∈ H _A . Podstawowe własności przestrzeni Friedrichsa opisuje następujące twierdzenie.

T w i e r d z e n i e

Przestrzeń H A jest przestrzenią Hilberta. Zbiór D A jest gęsty w H A , tzn. dowolny element z przestrzeni H _A może być przybliżony przez elementy z D _A .

128

(2)

Rozważmy teraz funkcjonał F (u) = (Au, u) − 2 (f, u). Na mocy (14.3) może on być zapisany jako

F (u) = (u, u) _A − 2 (f, u) dla u ∈ D _A . (14.5) Z poprzednich uwag wynika, że wzór (14.5) jest w naturalny sposób określony na H _A .

T w i e r d z e n i e

Niech operator A będzie dodatnio określony na gęstej podprzestrzeni liniowej D _A przestrzeni Hilberta H. Niech H _A będzie przestrzenią Friedrichsa generowaną przez operator A. Wówczas funkcjonał F zdefiniowany na H A za pomocą wzoru (14.5) przyjmuje na H A swoją najmniejszą wartość. Element u ₀ , dla którego F osiąga swoją najmniejszą wartość jest wyznaczony jednoznacz- nie.

Dla dowodu twierdzenia wystarczy zauważyć, że dla ustalonego f ∈ H wyrażenie (f, u) jest ciągłym funkcjonałem liniowym na H _A , ponieważ na mocy (14.2) zachodzi nierówność

|(f, u)| ≤ kf kkuk ≤ 1

C kf kkuk _A .

Z twierdzenia Riesza wynika istnienie takiego elementu u 0 ∈ H A , że dla każdego u ∈ H A zachodzi

(u ₀ , u) _A = (f, u) . (14.6)

W takim razie

F (u) = (u, u) _A − 2 (u 0 , u) _A = (u − u 0 , u − u 0 ) _A − (u 0 , u 0 ) _A =

= ku − u ₀ k ² _A − ku ₀ k ² _A ,

tzn. F (u ₀ ) = −ku ₀ k ² _A i dla każdego u 6= u ₀ spełniona jest nierówność F (u) > F (u ₀ ).

D e f i n i c j a

Element u ₀ minimalizujący funkcjonał (14.5) nazywamy rozwiązaniem uogólnionym równania Au = f .

U w a g a 1

Równość (u ₀ , u) _A = (f, u) nie prowadzi do efektywnego algorytmu skonstruowania rozwiąza- nia u ₀ . W celu znalezienia przybliżeń rozwiązania należy rozpatrzyć zagadnienie minimalizacji funkcjonału F (u).

U w a g a 2

Łatwo zauważyć, że jeśli

|(u ₀ , u) _A | = |(f, u)| ≤ 1

C kf kkuk _A , to dla u = u ₀

ku ₀ k ² _A ≤ 1

C kf kku ₀ k _A , a zatem ku ₀ k _A ≤ 1

C kf k. (14.7)

Gdy v ₀ jest rozwiązaniem zagadnienia Av ₀ = g, u ₀ jest rozwiązaniem zagadnienia Au ₀ = f , to ku ₀ − v ₀ k _A ≤ 1

C kf − gk (14.8)

(3)

co oznacza ciągłą zależność rozwiązania od prawej strony równania. W szczególności, gdy dla pewnych u _n ∈ D _A oznaczymy Au _n = f _n , to

ku _n − u ₀ k _A ≤ 1

C kf _n − f k = 1

C kAu _n − f k, (14.9)

tzn. (Au _n → f ) =⇒ (u _n → u ₀ ).

U w a g a 3

Jeśli u 0 ∈ D _A minimalizuje F (u) na H A , to u 0 jest rozwiązaniem zagadnienia Au = f . Jeśli jednak u ₀ ∈ D / _A , to równanie Au = f nie posiada rozwiązań w D _A .

Istotnie, gdyby v ∈ D _A było rozwiązaniem równania Au = f w D _A , to F (v) byłoby najmniejszą wartością funkcjonału F w D _A . Ponieważ jednak

F (v) = kv − u ₀ k ² _A − ku ₀ k ² _A > F (u ₀ ) ,

więc z gęstości zbioru D _A w H _A wynika istnienie elementów u _n ∈ D _A takich, że u _n → u ₀ , F (u _n ) → F (u ₀ ) < F (v) ,

co na mocy przyjętego założenia nie jest jednak możliwe.

14.2 Metoda szeregów ortonormalnych

Rozważamy równanie (14.1) w pewnej przestrzeni Hilberta H. Zakładamy, że operator A jest dodatnio określony na pewnej gęstej podprzestrzeni liniowej D _A ⊂ H i jego wartości leżą w H. Na mocy twierdzenia o minimum funkcjonału kwadratowego (13.39) wiemy, że jeśli równanie Au = f jest spełnione dla u 0 ∈ H A , tzn. Au 0 = f , to funkcjonał F (u) = (Au, u) − 2 (f, u) osiąga swoją najmniejszą wartość w H _A w punkcie u = u ₀ .

Zakładamy również, że przestrzeń H _A jest ośrodkowa (wystarczy żądać by H była ośrodkowa, np. H = L ² (Ω)).

Niech (ϕ _k ) będzie układem ortonormalnym zupełnym w H _A . Wówczas zgodnie z teorią szeregów Fouriera w przestrzeniach Hilberta i równością (10.17), u ₀ można przedstawić jako

u 0 =

+∞

X

k=1

a k ϕ k , gdzie a k = (u 0 , ϕ k ) _A . (14.10)

Z definicji iloczynu skalarnego (·, ·) _A wynika, że

a _k = (u ₀ , ϕ _k ) _A = (Au ₀ , ϕ _k ) = (f, ϕ _k ) dla k = 1, 2, . . . (14.11) Ze zbieżności szeregu (14.10) w H _A wynika jego zbieżność w H, ponieważ

ku 0 −

n

X

k=1

a k ϕ k k ≤ 1 C ku 0 −

n

X

k=1

a k ϕ k k A −→

n→∞ 0.

Powyższe rozważania można sformułować w postaci następującego twierdzenia.

T w i e r d z e n i e

Niech A będzie operatorem dodatnio określonym na podprzestrzeni liniowej, gęstej D _A ⊂

H, f ∈ H. Niech (ϕ _k ) będzie układem ortonormalnym zupełnym w H _A . Wówczas rozwiązanie

(4)

uogólnione u ₀ równania Au = f jest dane jako szereg (14.10) ze współczynnikami określonymi wzorami (14.11).

Niedogodnością metody szeregów ortonormalnych jest jest trudność efektywnego uzyskania układów ortonormalnych zupełnych (tzw. baz ortonormalnych) w H A .

14.3 Metoda Ritza

Niech A będzie operatorem dodatnio określonym na D A , D A gęsty w H, H - ośrodkowa przestrzeń Hilberta. Rozważmy bazę (ϕ _k ) w H _A (tzn. układ przeliczalny elementów liniowo niezależnych, zupełny). Nie zakładamy ortogonalności tego układu.

Niech F (u) = (u, u) _A − 2 (f, u). Rozwiązaniem uogólnionym zagadnienia Au = f jest taki punkt u ₀ ∈ H _A , że

F (u ₀ ) = min

u∈H

A

F (u) .

Ustalmy n naturalne i rozważmy zbiór elementów postaci u n =

n

X

k=1

a k ϕ k . Współczynniki a k wyznaczamy żądając, aby

F (u _n ) = min F (v _n ) , gdzie v _n ∈ lin (ϕ ₁ , ϕ ₂ , . . . , ϕ _n ) , tzn. v _n =

n

X

k=1

b _k ϕ _k .

F (v _n ) jest formą kwadratową zmiennych b ₁ , b ₂ , . . . , b _n postaci

F (v _n ) =

n

X

k=1

b _k ϕ _k ,

n

X

k=1

b _k ϕ _k

!

A

− 2 f,

n

X

k=1

b _k ϕ _k

!

. (14.12)

Warunkiem koniecznym istnienia ekstremum wyrażenia (14.12) jest, aby

∂F

∂b ₁ = 0, ∂F

∂b ₂ = 0, . . . , ∂F

∂b _n = 0.

Warunek ten prowadzi do następującego układu równań liniowych względem b ₁ , b ₂ , . . . , b _n



 

 

 

 

(ϕ ₁ , ϕ ₁ ) _A b ₁ + (ϕ ₁ , ϕ ₂ ) _A b ₂ + . . . + (ϕ ₁ , ϕ _n ) _A b _n = (f, ϕ ₁ ) (ϕ ₂ , ϕ ₁ ) _A b ₁ + (ϕ ₂ , ϕ ₂ ) _A b ₂ + . . . + (ϕ ₂ , ϕ _n ) _A b _n = (f, ϕ ₂ )

.. . .. . .. . .. . .. .

(ϕ n , ϕ 1 ) _A b 1 + (ϕ n , ϕ 2 ) _A b 2 + . . . + (ϕ n , ϕ n ) _A b n = (f, ϕ n )

(14.13)

Wyznacznik układu (14.13) jest różny od zera, ponieważ elementy ϕ _k są liniowo niezależne (jest to tzw. wyznacznik Grama układu (ϕ _k )), a więc wartości b ₁ , b ₂ , . . . , b _n są jednoznacznie określone.

W przypadku, gdy (ϕ k ) jest układem ortonormalnym otrzymujemy natychmiast, że b _k = (f, ϕ _k ) , dla k = 1, 2, . . . , n.

Tak określony ciąg u n =

n

X

k=1

b k ϕ k nazywamy ciągiem Ritza.

(5)

T w i e r d z e n i e

Niech A będzie operatorem dodatnio określonym na D _A ⊂ H, D _A gęste w H, f ∈ H, H - ośrodkowa przestrzeń Hilberta. Niech (ϕ _k ) będzie bazą w H _A (niekoniecznie ortogonalną). Wówczas ciąg Ritza (u _n ) ze współczynnikami b ₁ , b ₂ , . . . , b _n określonymi jednoznacznie przez układ równań (14.13) zbiega w H _A (a więc i w H) do uogólnionego rozwiązania u ₀ równania Au = f .

U w a g a 1

Chociaż dla ciągu Ritza u _n → u ₀ , to nie musi zachodzić Au _n → f . U w a g a 2

Korzystając z nierówności (10.20) i własności przestrzeni Hilberta, można pokazać, że dla m > n zachodzi zawsze nierówność

ku _m − u ₀ k _A ≤ ku _n − u ₀ k _A . (14.14)

U w a g a 3

Jeśli elementy bazy (ϕ _k ) należą do D _A , to układ równań (14.13) można zapisać w postaci



 

 

 

 

(Aϕ ₁ , ϕ ₁ ) b ₁ + (Aϕ ₁ , ϕ ₂ ) b ₂ + . . . + (Aϕ ₁ , ϕ _n ) b _n = (f, ϕ ₁ ) (Aϕ ₂ , ϕ ₁ ) b ₁ + (Aϕ ₂ , ϕ ₂ ) b ₂ + . . . + (Aϕ ₂ , ϕ _n ) b _n = (f, ϕ ₂ )

.. . .. . .. . .. . .. .

(Aϕ _n , ϕ ₁ ) b ₁ + (Aϕ _n , ϕ ₂ ) b ₂ + . . . + (Aϕ _n , ϕ _n ) b _n = (f, ϕ _n )

(14.15)

14.4 Metoda Galerkina

Niech A będzie operatorem określonym na D _A , D _A gęsty w H, H - ośrodkowa przestrzeń Hilberta.

Rozważmy bazę (ϕ _k ) w H _A taką, że ϕ _k ∈ D _A dla k = 1, 2, . . . . Nie zakładamy ortogonalności tego układu.

Poszukujemy przybliżenia rozwiązania uogólnionego równania Au = f w postaci u n =

n

X

k=1

a k ϕ k , gdzie stałe a _k wyznaczamy z układu równań

(Au _n − f, ϕ _k ) = 0 dla k = 1, 2, . . . , n. (14.16) Z gęstości D _A w H wynika, że gdyby warunek (14.16) spełniony był dla wszystkich k, to u _n byłoby rozwiązaniem równania Au = f . Ciąg u _n nazywamy ciągiem przybliżeń Galerkina.

W przypadku, gdy operator A jest liniowy warunek (14.16) prowadzi do układu równań (a ₁ Aϕ ₁ + a ₂ Aϕ ₂ + . . . + a _n Aϕ _n − f, ϕ _k ) = 0 dla k = 1, 2, . . . , n. (14.17) tzn. w postaci rozwiniętej



 

 

 

 

(Aϕ ₁ , ϕ ₁ ) a ₁ + (Aϕ ₂ , ϕ ₁ ) a ₂ + . . . + (Aϕ _n , ϕ ₁ ) a _n = (f, ϕ ₁ ) (Aϕ ₁ , ϕ ₂ ) a ₁ + (Aϕ ₂ , ϕ ₂ ) a ₂ + . . . + (Aϕ _n , ϕ ₂ ) a _n = (f, ϕ ₂ )

.. . .. . .. . .. . .. .

(Aϕ 1 , ϕ n ) a 1 + (Aϕ 2 , ϕ n ) a 2 + . . . + (Aϕ n , ϕ n ) a n = (f, ϕ n )

(14.18)

(6)

Jeśli dodatkowo założymy, że A jest operatorem dodatnio określonym (a więc symetrycznym), to łatwo zauważyć, że układ (14.18) jest identyczny z układem równań (14.15) otrzymanym w wyniku stosowania metody Ritza. W tym przypadku otrzymane ciągi przybliżeń są identyczne.

T w i e r d z e n i e

Niech A będzie operatorem dodatnio określonym na D _A , D _A gęsty w H, f ∈ H, H - ośrodkowa przestrzeń Hilberta. Niech (ϕ _k ) będzie bazą w H _A (niekoniecznie ortogonalną) oraz ϕ _k ∈ D _A dla k = 1, 2, . . . . Wówczas ciąg przybliżeń Galerkina, gdzie stałe a ₁ , a ₂ , . . . , a _n są wyznaczone z układu równań (14.18) jest zbieżny w H _A do rozwiązania uogólnionego równania Au = f .

U w a g a 1 (porównanie z metodą Ritza)

Zakres stosowania metody Galerkina jest o wiele szerszy niż metody Ritza. Dla zastosowania warunku (14.16) nie jest konieczne, aby operator A był dodatnio określony, symetryczny ani nawet liniowy. W metodzie Galerkina punktem wyjścia jest równanie Au = f , zaś w metodzie Ritza - minimalizacja funkcjonału F (u).

U w a g a 2

Można rozważać dwie różne bazy w przestrzeni H _A , tzn. (ϕ _k ) i (ψ _k ). Poszukujemy przybliżenia rozwiązania uogólnionego równania Au = f , podobnie jak poprzednio, w postaci

u _n =

n

X

k=1

a _k ϕ _k ,

gdzie stałe a _k wyznaczamy z warunku

(Au _n − f, ψ _k ) = 0 dla k = 1, 2, . . . , n. (14.19) Metoda ta nosi nazwę metody Galerkina-Pietrowa.

14.5 Metoda najmniejszych kwadratów

Niech A będzie operatorem liniowym określonym na D A , D A gęsty w H, H - ośrodkowa przestrzeń Hilberta. Załóżmy, że dany jest układ funkcji (ϕ _k ) w H taki, że ϕ _k ∈ D _A dla k = 1, 2, . . . oraz (Aϕ _k ) stanowi bazę w H (układ taki nazywamy A−bazą w H)

Metoda najmniejszych kwadratów polega na poszukiwaniu ciągu u _n =

n

X

k=1

a _k ϕ _k

przybliżeń rozwiązania uogólnionego u 0 równania Au = f . Stałe a k wyznacza się za pomocą warunku

kAu _n − f k ² = min

v

n

kAv _n − f k ² , (14.20)

gdzie minimum rozpatruje się po wszytkich funkcjach postaci v n =

n

X

k=1

b k ϕ k .

(7)

Obliczając kAv _n − f k ² otrzymujemy

kAv _n − f k ² = (Av _n − f, Av _n − f ) =

n

X

k=1

b _k Aϕ _k − f,

n

X

k=1

b _k Aϕ _k − f

!

=

n

X

i,j=1

b _i b _j (Aϕ _i , Aϕ _j ) − 2 f,

n

X

k=1

b _k Aϕ _k

!

+ (f, f ) .

Wyrażenie to osiąga minimum gdy _∂b ^∂

i

kAv _n − f k ² = 0 dla i = 1, 2, . . . , n co można zapisać w postaci układu równań



 

 

 

 

(Aϕ ₁ , Aϕ ₁ ) b ₁ + (Aϕ ₁ , Aϕ ₂ ) b ₂ + . . . + (Aϕ ₁ , Aϕ _n ) b _n = (f, Aϕ ₁ ) (Aϕ ₂ , Aϕ ₁ ) b ₁ + (Aϕ ₂ , Aϕ ₂ ) b ₂ + . . . + (Aϕ ₂ , Aϕ _n ) b _n = (f, Aϕ ₂ )

.. . .. . .. . .. . .. .

(Aϕ _n , Aϕ ₁ ) b ₁ + (Aϕ _n , Aϕ ₂ ) b ₂ + . . . + (Aϕ _n , Aϕ _n ) b _n = (f, Aϕ _n )

(14.21)

Z założenia wynika, że wyznacznik układu (14.21) jest różny od zera, zatem współczynniki b _i są jednoznacznie wyznaczone.

T w i e r d z e n i e

Niech A będzie operatorem liniowym dodatnio określonym na D _A , D _A gęsty w H, f ∈ H, H - ośrodkowa przestrzeń Hilberta. Niech (ϕ k ) będzie A−bazą w H (tzn. (Aϕ k ) jest bazą w H) oraz ϕ _k ∈ D _A dla k = 1, 2, . . . . Wówczas ciąg u _n postaci

u _n =

n

X

k=1

b _k ϕ _k

gdzie stałe b ₁ , b ₂ , . . . , b _n są wyznaczone z układu równań (14.21) jest zbieżny w H _A (a więc i w H) do rozwiązania uogólnionego u ₀ równania Au = f oraz lim

n→∞ Au _n = f w H.

U w a g a 1 (porównanie z metodą Ritza)

Niech (v n ) oznacza ciąg Ritza, zaś (u n ) ciąg otrzymany metodą najmniejszych kwadratów.

Wówczas, ponieważ F (u) = ku − u ₀ k ² _A − ku ₀ k ² _A , więc z konstrukcji ciągu Ritza wynika, że

kv _n − u ₀ k _A ≤ ku _n − u ₀ k _A , (14.22) co oznacza, że ciąg Ritza jest „szybciej” zbieżny. Z drugiej strony metoda najmniejszych kwadra- tów pozwala prosto oszacować popełniony błąd, bowiem na mocy nierówności (14.9) prawdziwe jest oszacowanie ku _n − u ₀ k _A ≤ _C ¹ kAu _n − f k.

U w a g a 2

W przypadku, gdy wiadomo, że u ₀ ∈ D _A można rozważyć funkcjonał F (u) = F (u) + kAu − f k ˆ ²

i zastosować do niego metodę Ritza. Wówczas ciąg minimalizujący ˆ F spełnia dodatkowo warunek

n→∞ lim Au _n = f w H. Metoda ta nosi nazwę metody Couranta.

U w a g a 3

Do formalnego zastosowania metody najmniejszych kwadratów nie jest konieczne, żeby opera-

tor A był dodatnio określony. Problem jednoznaczności wyznaczenia współczynników b _k i zbież-

ności ciągu (u n ) ma odpowiedź pozytywną przy następujących założeniach:

(8)

1. A - liniowy, D _A = H;

2. (Aϕ _k ) jest bazą w H;

3. Równanie Au = f ma rozwiązanie u 0 ∈ D A ;

4. Istnieje stała K > 0 taka, że dla każdego u ∈ D _A zachodzi nierówność kAuk ≥ Kkuk.

14.6 Metoda gradientów

Metoda ta dotyczy operatorów ograniczonych, dodatnio określonych na pewnym gęstym podzbio- rze D _A ⊂ H (nie nadaje się więc do operatorów różniczkowych).

Niech u ₀ będzie rozwiązaniem uogólnionym równania Au = f w H. Wówczas u ₀ minimalizuje funkcjonał

F (u) = (Au, u) − 2 (f, u) .

Funkcjonał ten, jako funkcjonał ograniczony, określony na podzbiorze gęstym w H może być przedłużony na całą przestrzeń H z zachowaniem ograniczoności.

Niech u ₁ będzie dowolnym elementem przestrzeni H. Załóżmy, że Au ₁ − f 6= 0 (w przeciwnym razie u ₁ = u ₀ i procedura jest zakończona). Wówczas poszukujemy takiego elementu v ₁ , że

kv ₁ k = kAu ₁ − f k i d

dt F (u ₁ + tv ₁ ) _|t=0 = max

v

d

dt F (u ₁ + tv) _|t=0 . (14.23) Ponieważ

F (u ₁ + tv ₁ ) = (A (u ₁ + tv ₁ ) , u ₁ + tv ₁ ) − 2 (f, u ₁ + tv ₁ ) =

= F (u ₁ ) + 2t (Au ₁ − f, v ₁ ) + t ² (Av ₁ , v ₁ ) , zatem

d

dt F (u ₁ + tv ₁ ) _|t=0 = 2 (Au ₁ − f, v ₁ ) .

Wyrażenie to osiąga wartość największą gdy v ₁ = Au ₁ − f . Dla wyznaczonego v ₁ wyrażenie F (u ₁ + tv ₁ ) osiąga wartość najmniejszą gdy

t = t ₁ = − (Au ₁ − f, v ₁ )

(Av 1 , v 1 ) = − (v ₁ , v ₁ )

(Av 1 , v 1 ) . (14.24)

Niech teraz u ₂ = u ₁ + t ₁ v ₁ . Powtarzamy powyższe rozumowanie dla elementu wyjściowego u ₂ i otrzymujemy

v ₂ = Au ₂ − f , t ₂ = − (v ₂ , v ₂ )

(Av ₂ , v ₂ ) , u ₃ = u ₂ + t ₂ v ₂ .

W ten sam sposób można skonstruować rekurencyjnie kolejne elementy ciągu u n takie, że v _n = Au _n − f , t _n = − (v _n , v _n )

(Av _n , v _n ) , u _n+1 = u _n + t _n v _n . (14.25)

(9)

T w i e r d z e n i e

Jeśli istnieją takie stałe dodatnie m i M , że dla każdego u ∈ H spełniona jest nierówność mkuk ² ≤ (Au, u) ≤ M kuk ² ,

to otrzymany powyżej ciąg (u _n ) zbiega do rozwiązania uogólnionego u ₀ równania Au = f w H _A (więc i w H), przy czym zachodzi nierówność

ku _n+1 − u ₀ k _A ≤ ku ₁ − u ₀ k _A M − m M + m

n

dla n = 1, 2, . . . .

14.7 Zadania

1. Rozważyć operator Au = (EIu ⁰⁰ ) ⁰⁰ odpowiadający równaniu ugięcia pręta (13.40) z przykła- du z wykładu „Elementy rachunku wariacyjnego” - nr 13. Napisać dla tego operatora układ równań (14.18) występujący w metodzie Galerkina oraz układ równań (14.13) występujący w metodzie Ritza. Pokazać, ze układy te są identyczne.

2. Niech H = L ² (0; π). Rozważmy równanie całkowe

(Au) (x) = u (x) − 0, 1

π

Z

0 sin (x + s) u (s) ds = h (x) , gdzie h ∈ L ² (0; π) .

Do operatora A zastosować metodę gradientów i wyznaczyć przybliżenie u ₂ rozwiązania.

Wyznaczyć również rozwiązanie dokładne równania.

Wykład 14 Wstęp do metod przybliżonych

Wykład 14

Wstęp do metod przybliżonych

14.1 Wariacyjna definicja rozwiązań uogólnionych

Rozważamy równanie

Au = f (14.1)

Będziemy teraz usiłowali rozszerzyć D A do takiego zbioru, na którym funkcjonał F (u) osiąga minimum.

Załóżmy, że A jest dodatnio określony, tzn. symetryczny oraz dla pewnej stałej C > 0 zachodzi nierówność

(Au, u) ≥ C 2 kuk 2 (14.2)

dla każdego u ∈ D A .

W podprzestrzeni D A definiujemy nowy iloczyn skalarny określony wzorem

(u, v) A = (Au, v) . (14.3)

Łatwo pokazać, że wszystkie aksjomaty iloczynu skalarnego są spełnione. Iloczyn ten zadaje normę w D A określoną jako

kuk A = q

(u, u) A . (14.4)

Z założenia (14.2) wynika, że kuk A ≥ Ckuk zatem ciągi zbieżne w normie k · k A są zbieżne także w normie standardowej k · k.

T w i e r d z e n i e

Przestrzeń H A jest przestrzenią Hilberta. Zbiór D A jest gęsty w H A , tzn. dowolny element z przestrzeni H A może być przybliżony przez elementy z D A .

128

Rozważmy teraz funkcjonał F (u) = (Au, u) − 2 (f, u). Na mocy (14.3) może on być zapisany jako

F (u) = (u, u) A − 2 (f, u) dla u ∈ D A . (14.5) Z poprzednich uwag wynika, że wzór (14.5) jest w naturalny sposób określony na H A .

T w i e r d z e n i e

Dla dowodu twierdzenia wystarczy zauważyć, że dla ustalonego f ∈ H wyrażenie (f, u) jest ciągłym funkcjonałem liniowym na H A , ponieważ na mocy (14.2) zachodzi nierówność

|(f, u)| ≤ kf kkuk ≤ 1

C kf kkuk A .

Z twierdzenia Riesza wynika istnienie takiego elementu u 0 ∈ H A , że dla każdego u ∈ H A zachodzi

(u 0 , u) A = (f, u) . (14.6)

W takim razie

F (u) = (u, u) A − 2 (u 0 , u) A = (u − u 0 , u − u 0 ) A − (u 0 , u 0 ) A =

= ku − u 0 k 2 A − ku 0 k 2 A ,

tzn. F (u 0 ) = −ku 0 k 2 A i dla każdego u 6= u 0 spełniona jest nierówność F (u) > F (u 0 ).

D e f i n i c j a

Element u 0 minimalizujący funkcjonał (14.5) nazywamy rozwiązaniem uogólnionym równania Au = f .

U w a g a 1

Równość (u 0 , u) A = (f, u) nie prowadzi do efektywnego algorytmu skonstruowania rozwiąza- nia u 0 . W celu znalezienia przybliżeń rozwiązania należy rozpatrzyć zagadnienie minimalizacji funkcjonału F (u).

U w a g a 2

Łatwo zauważyć, że jeśli

|(u 0 , u) A | = |(f, u)| ≤ 1

C kf kkuk A , to dla u = u 0

ku 0 k 2 A ≤ 1

C kf kku 0 k A , a zatem ku 0 k A ≤ 1

C kf k. (14.7)

Gdy v 0 jest rozwiązaniem zagadnienia Av 0 = g, u 0 jest rozwiązaniem zagadnienia Au 0 = f , to ku 0 − v 0 k A ≤ 1

C kf − gk (14.8)

co oznacza ciągłą zależność rozwiązania od prawej strony równania. W szczególności, gdy dla pewnych u n ∈ D A oznaczymy Au n = f n , to

ku n − u 0 k A ≤ 1

C kf n − f k = 1

C kAu n − f k, (14.9)

tzn. (Au n → f ) =⇒ (u n → u 0 ).

U w a g a 3

Jeśli u 0 ∈ D A minimalizuje F (u) na H A , to u 0 jest rozwiązaniem zagadnienia Au = f . Jeśli jednak u 0 ∈ D / A , to równanie Au = f nie posiada rozwiązań w D A .

Istotnie, gdyby v ∈ D A było rozwiązaniem równania Au = f w D A , to F (v) byłoby najmniejszą wartością funkcjonału F w D A . Ponieważ jednak

F (v) = kv − u 0 k 2 A − ku 0 k 2 A > F (u 0 ) ,

więc z gęstości zbioru D A w H A wynika istnienie elementów u n ∈ D A takich, że u n → u 0 , F (u n ) → F (u 0 ) < F (v) ,

co na mocy przyjętego założenia nie jest jednak możliwe.

14.2 Metoda szeregów ortonormalnych

Zakładamy również, że przestrzeń H A jest ośrodkowa (wystarczy żądać by H była ośrodkowa, np. H = L 2 (Ω)).

Niech (ϕ k ) będzie układem ortonormalnym zupełnym w H A . Wówczas zgodnie z teorią szeregów Fouriera w przestrzeniach Hilberta i równością (10.17), u 0 można przedstawić jako

u 0 =

+∞

X

k=1

a k ϕ k , gdzie a k = (u 0 , ϕ k ) A . (14.10)

Z definicji iloczynu skalarnego (·, ·) A wynika, że

a k = (u 0 , ϕ k ) A = (Au 0 , ϕ k ) = (f, ϕ k ) dla k = 1, 2, . . . (14.11) Ze zbieżności szeregu (14.10) w H A wynika jego zbieżność w H, ponieważ

ku 0 −

n

X

k=1

a k ϕ k k ≤ 1 C ku 0 −

n

X

k=1

a k ϕ k k A −→

n→∞ 0.

Powyższe rozważania można sformułować w postaci następującego twierdzenia.

T w i e r d z e n i e

Niech A będzie operatorem dodatnio określonym na podprzestrzeni liniowej, gęstej D A ⊂

H, f ∈ H. Niech (ϕ k ) będzie układem ortonormalnym zupełnym w H A . Wówczas rozwiązanie

uogólnione u 0 równania Au = f jest dane jako szereg (14.10) ze współczynnikami określonymi wzorami (14.11).

Będziemy teraz usiłowali rozszerzyć D _A do takiego zbioru, na którym funkcjonał F (u) osiąga minimum.

(Au, u) ≥ C ² kuk ² (14.2)

dla każdego u ∈ D _A .

W podprzestrzeni D _A definiujemy nowy iloczyn skalarny określony wzorem

(u, v) _A = (Au, v) . (14.3)

Łatwo pokazać, że wszystkie aksjomaty iloczynu skalarnego są spełnione. Iloczyn ten zadaje normę w D _A określoną jako

kuk _A = q

(u, u) _A . (14.4)

Z założenia (14.2) wynika, że kuk A ≥ Ckuk zatem ciągi zbieżne w normie k · k _A są zbieżne także w normie standardowej k · k.

Przestrzeń H A jest przestrzenią Hilberta. Zbiór D A jest gęsty w H A , tzn. dowolny element z przestrzeni H _A może być przybliżony przez elementy z D _A .

F (u) = (u, u) _A − 2 (f, u) dla u ∈ D _A . (14.5) Z poprzednich uwag wynika, że wzór (14.5) jest w naturalny sposób określony na H _A .

Dla dowodu twierdzenia wystarczy zauważyć, że dla ustalonego f ∈ H wyrażenie (f, u) jest ciągłym funkcjonałem liniowym na H _A , ponieważ na mocy (14.2) zachodzi nierówność

C kf kkuk _A .

(u ₀ , u) _A = (f, u) . (14.6)

F (u) = (u, u) _A − 2 (u 0 , u) _A = (u − u 0 , u − u 0 ) _A − (u 0 , u 0 ) _A =

= ku − u ₀ k ² _A − ku ₀ k ² _A ,

tzn. F (u ₀ ) = −ku ₀ k ² _A i dla każdego u 6= u ₀ spełniona jest nierówność F (u) > F (u ₀ ).

Element u ₀ minimalizujący funkcjonał (14.5) nazywamy rozwiązaniem uogólnionym równania Au = f .

Równość (u ₀ , u) _A = (f, u) nie prowadzi do efektywnego algorytmu skonstruowania rozwiąza- nia u ₀ . W celu znalezienia przybliżeń rozwiązania należy rozpatrzyć zagadnienie minimalizacji funkcjonału F (u).

|(u ₀ , u) _A | = |(f, u)| ≤ 1

C kf kkuk _A , to dla u = u ₀

ku ₀ k ² _A ≤ 1

C kf kku ₀ k _A , a zatem ku ₀ k _A ≤ 1

Gdy v ₀ jest rozwiązaniem zagadnienia Av ₀ = g, u ₀ jest rozwiązaniem zagadnienia Au ₀ = f , to ku ₀ − v ₀ k _A ≤ 1

co oznacza ciągłą zależność rozwiązania od prawej strony równania. W szczególności, gdy dla pewnych u _n ∈ D _A oznaczymy Au _n = f _n , to

ku _n − u ₀ k _A ≤ 1

C kf _n − f k = 1

C kAu _n − f k, (14.9)

tzn. (Au _n → f ) =⇒ (u _n → u ₀ ).

Jeśli u 0 ∈ D _A minimalizuje F (u) na H A , to u 0 jest rozwiązaniem zagadnienia Au = f . Jeśli jednak u ₀ ∈ D / _A , to równanie Au = f nie posiada rozwiązań w D _A .

Istotnie, gdyby v ∈ D _A było rozwiązaniem równania Au = f w D _A , to F (v) byłoby najmniejszą wartością funkcjonału F w D _A . Ponieważ jednak

F (v) = kv − u ₀ k ² _A − ku ₀ k ² _A > F (u ₀ ) ,

więc z gęstości zbioru D _A w H _A wynika istnienie elementów u _n ∈ D _A takich, że u _n → u ₀ , F (u _n ) → F (u ₀ ) < F (v) ,

Zakładamy również, że przestrzeń H _A jest ośrodkowa (wystarczy żądać by H była ośrodkowa, np. H = L ² (Ω)).

Niech (ϕ _k ) będzie układem ortonormalnym zupełnym w H _A . Wówczas zgodnie z teorią szeregów Fouriera w przestrzeniach Hilberta i równością (10.17), u ₀ można przedstawić jako

a k ϕ k , gdzie a k = (u 0 , ϕ k ) _A . (14.10)

Z definicji iloczynu skalarnego (·, ·) _A wynika, że

a _k = (u ₀ , ϕ _k ) _A = (Au ₀ , ϕ _k ) = (f, ϕ _k ) dla k = 1, 2, . . . (14.11) Ze zbieżności szeregu (14.10) w H _A wynika jego zbieżność w H, ponieważ

Niech A będzie operatorem dodatnio określonym na podprzestrzeni liniowej, gęstej D _A ⊂

H, f ∈ H. Niech (ϕ _k ) będzie układem ortonormalnym zupełnym w H _A . Wówczas rozwiązanie

uogólnione u ₀ równania Au = f jest dane jako szereg (14.10) ze współczynnikami określonymi wzorami (14.11).

Niech A będzie operatorem dodatnio określonym na D A , D A gęsty w H, H - ośrodkowa przestrzeń Hilberta. Rozważmy bazę (ϕ _k ) w H _A (tzn. układ przeliczalny elementów liniowo niezależnych, zupełny). Nie zakładamy ortogonalności tego układu.

Niech F (u) = (u, u) _A − 2 (f, u). Rozwiązaniem uogólnionym zagadnienia Au = f jest taki punkt u ₀ ∈ H _A , że

F (u ₀ ) = min

F (u _n ) = min F (v _n ) , gdzie v _n ∈ lin (ϕ ₁ , ϕ ₂ , . . . , ϕ _n ) , tzn. v _n =

b _k ϕ _k .

F (v _n ) jest formą kwadratową zmiennych b ₁ , b ₂ , . . . , b _n postaci

F (v _n ) =

b _k ϕ _k ,

b _k ϕ _k

b _k ϕ _k

∂b ₁ = 0, ∂F

∂b ₂ = 0, . . . , ∂F

∂b _n = 0.

Warunek ten prowadzi do następującego układu równań liniowych względem b ₁ , b ₂ , . . . , b _n

(ϕ ₁ , ϕ ₁ ) _A b ₁ + (ϕ ₁ , ϕ ₂ ) _A b ₂ + . . . + (ϕ ₁ , ϕ _n ) _A b _n = (f, ϕ ₁ ) (ϕ ₂ , ϕ ₁ ) _A b ₁ + (ϕ ₂ , ϕ ₂ ) _A b ₂ + . . . + (ϕ ₂ , ϕ _n ) _A b _n = (f, ϕ ₂ )

(ϕ n , ϕ 1 ) _A b 1 + (ϕ n , ϕ 2 ) _A b 2 + . . . + (ϕ n , ϕ n ) _A b n = (f, ϕ n )

Wyznacznik układu (14.13) jest różny od zera, ponieważ elementy ϕ _k są liniowo niezależne (jest to tzw. wyznacznik Grama układu (ϕ _k )), a więc wartości b ₁ , b ₂ , . . . , b _n są jednoznacznie określone.

W przypadku, gdy (ϕ k ) jest układem ortonormalnym otrzymujemy natychmiast, że b _k = (f, ϕ _k ) , dla k = 1, 2, . . . , n.

Chociaż dla ciągu Ritza u _n → u ₀ , to nie musi zachodzić Au _n → f . U w a g a 2

ku _m − u ₀ k _A ≤ ku _n − u ₀ k _A . (14.14)

Jeśli elementy bazy (ϕ _k ) należą do D _A , to układ równań (14.13) można zapisać w postaci