Metody teledetekcyjne w badaniach atmosfery. Wykład 14 – Zagadnienie odwrotne

(1)

Metody teledetekcyjne w badaniach atmosfery.

Wykład 14 – Zagadnienie odwrotne

Krzysztof Markowicz kmark@igf.fuw.edu.pl

(2)

2

Zagadnienie odwrotne

• Z matematycznego punktu widzenia problem zagadnienia odwrotnego jest równoznaczny problemowi asymilacji

danych w numerycznych prognozach pogody.

• W obu przypadkach problem jest na ogół źle postawiony gdyż liczba obserwacji jest mniejsza od liczby

wyznaczanych wielkości fizycznych.

(3)

• Przez y (y₁,y₂,…,y_m) oznaczmy wektor obserwacji, zaś x

(x₁,x₂,…,x_n) wektor wyznaczanych (niewiadomych) wielkości (wektor stanu). Przez  oznaczamy wektor błędów obserwacji.

• Relacje pomiędzy wektorem obserwacji i wektorem stanu zapisujemy w postaci:

gdzie F(x) oznacza model fizyczny (model do przodu – forward model). Używamy terminu model gdyż

powyższy związek jest często określony przez

skompilowane relacje fizyczne zapisywane w postaci numerycznej.





 F(x) y

(4)

4

Funkcja wagowa













 

 

 (x x ) K(x x )

x ) x ( ) F

x ( F

y _o _o _o

W wielu rozważaniach wygodnie jest rozważać problem liniowy. Dokonujemy linearyzacji modelu fizycznego w otoczeniu pewnego stanu referencyjnego x_o.

Macierz K (m x n) oznaczamy funkcją wagową. Macierz ta nie koniecznie musi być kwadratowa. W przypadku gdy

m<n problem jest niedookreślony (źle postawiony) m>n mamy nadmiarową liczbę obserwacji.

(5)

3-wymiarowa analiza wariacyjna : 3D-VAR

• W metodzie 3D-Var poszukujemy wektora analizy x_a, który minimalizuje skalarną funkcję kosztu.

• Zdefiniowana jest ona przez odległość pomiędzy

wektorem stanu x a wektorem pierwszego przybliżenia x_b mnożoną przez wagę będąca odwrotnością kowariancji błędu i odległość pomiędzy wektorem stanu x, a

wektorem obserwacji y_omnożoną przez odwrotność kowariancji błędów obserwacyjnych.

• W metodzie 3D-Var minimalizacji dokonujemy w przestrzeni wektora stanu.

(6)

6

3-wymiarowa analiza wariacyjna : 3D-VAR

• Rozważamy funkcję koszu oraz jej gradient w postaci:

Minimalizacja wariacyjnej funkcji kosztu (na podstawie 2-

wymiarowego modelu).

Kwadratura funkcji kosztu ma kształt paraboloidy (w tym

przypadku) z wartością minimalna dla optymalnej wartości analizy x_a. Algorytm poszukiwania wartości minimalnej sprowadza się do

poruszania po krzywej funkcji kosztu w kierunku największego gradientu funkcji.

)) ( (

) (

)

(x x x B ¹ x x y F x R ¹ y F x J   _b ^T ^  _b   ^T ^ 

)) ( (

2 ) (

2 )

(x B ¹ x x F R ¹ y F x

J   _b  ^T 

 ^ ^

(7)

• W praktyce punkt startowy minimalizacji zwany pierwszym

przybliżeniem (first guess) jest często wybierany na podstawie informacji a priori (background) x_b.

• Nie jest to wybór obowiązkowy jednak należy pamiętać o różnicy pomiędzy informacją a priori, która jest używana w definicji funkcji kosztu od pierwszego przybliżenia, które jest używane do inicjalizacji procedury minimalizacyjnej.

• Jeśli minimalizacja jest zadowalająca to wynik analizy nie

zależy istotnie od wyboru wartości startowej. Jednak zawsze zależy od informacji a priori.

• Znaczącym problemem analizy 3D-Var jest konieczność znalezienia metody pozwalającej wyznaczyć macierz

kowariancji B, która określa błędy informacji a priori dla każdej pary zmiennych modelu.

• W większości przypadków macierz kowariancji błędu

związana z obserwacjami jest przekątna macierzą blokową lub macierzą diagonalą.

(8)

8

• Łatwo zauważyć, że przekątna macierz blokowa

implikuje, iż funkcja kosztu J_o jest sumą N skalarnych funkcji kosztu J_o,i każdej zdefiniowanej dla podmacierzy R_i oraz odpowiadającej H_i oraz y_i.

• Rozbicie funkcji kosztu J_o staje się użytecznym

narzędziem do badania zachowania metody 3D-Var ze względu na każdą obserwację (jej wartość i

dopasowanie do wektora stanu x)

• Dodatkowo pozwala to na wymuszenie słabszych więzów (ograniczeń) przez dodanie dodatkowego czynnika w funkcji kosztu J_c.

• Prowadzi to jednak do warunku wstępnego co utrudnia i komplikuje minimalizację.

)) ( (

) (

1 ,

x F y

R x

F y

J

x J

J

i i

i T i

i i

o

N i

i o o









(9)

Teoria Bayesa

• W podejściu Bayesa używamy pojęcia

prawdopodobieństwa do opisu naszej wiedzy na temat wektora stanu oraz obserwacji.

• Definiujemy:

• P(x) - gęstość praw-sta (pdf) wektora stanu x. P(x)dx jest prawdopodobieństwem przed wykonaniem obserwacji, że wektor stanu znajduje się w przedziale (x,x+dx).

• P(y) - pdf obserwacji

• P(x,y) - pdf złożone x i y. P(x,y)dxdy oznacza

prawdopodobieństwo, że wektor x znajduje się w przedziale (x,x+dx) zaś y w przedziale (y.y+dy).

• P(y|x) - pdf warunkowe wektora y dla danego x. Oznacza, że P(y|x)dy jest prawdopodobieństwem, że wektor

obserwacji y znajduje się w przedziale (y,y+dy) gdy wektor stanu x przyjmuje określoną wartość

• P(x|y) – analogicznie jak powyższej

(10)

10

Rodgers, 2000

(11)

• Twierdze Bayesa :

opisuje prawdopodobieństwo warunkowe

Koncepcyjne przybliżenie problemu odwrotnego:

• Przed wykonaniem obserwacji mamy wiedzę a priori w postaci rozkładu gęstości prawdopodobieństwa (pdf-u).

• Proces obserwacyjny jest utożsamiany jako mapowanie wektora stanu w przestrzeni obserwacji przy użyciu modelu (forward model)

• Teoria Bayesa opisuje formalizm procesu odwrotnego do powyższego mapowania i wyznaczania pdf-u aposteriori poprzez poprawianie pdf-u a priori przez pdf obserwacji.

) y ( P

) x ( P ) x

| y ( ) P

y

| x (

P 

(12)

12

Rozważmy problem liniowy



  

 ( ) ^ ( )

2 exp 1

|

| ) 2 ( ) 1

( _/₂ ₁_/₂ y y R ¹ y y

y R

P _n ^T



 ^ 



^



^

 _i _i _j _j

j

i y y y y

R _,











 F(x) Kx y

Błędy pomiarowe  mogą być często przybliżane rozkładem Gaussa stąd wyrażenie na P(y|x) ma postać:

 

1

1( )

) (

)

| ( ln

2 P y x  y  Kx ^T R y  Kx  c

 ^

gdzie c₁ jest stałą zaś R_ jest macierzą kowariancji błędów pomiarowych

(13)

• Podobnie można zdefiniować pdf wektora stanu. Jednak w tym przypadku przybliżenie rozkładem Gaussa jest mnie realistyczne aczkolwiek wygodne do opisu.

 ^  ^  ^

 x x_a x x_a ^T B

 

2

1( )

) (

) ( ln

2 P x  x  x_a ^T B x  x_a  c

 ^

gdzie x_a jest a priori znanym stanem x, zaś B odpowiadającą mu macierzą kowariancji.

Podstawiając i wykorzystując twierdzenie Bayesa dostajemy związek na pdf a posteriori

   

3

1

1( ) ( ) ( )

) (

)

| ( ln

2 P x y  y  Kx ^T R y  Kx  x  x_a ^T B x  x_a  c

 ^ ^

Ma ono rozkład Gaussa więc może być zapisane w postaci:

 

^xˆ

(14)

14

Porównując czynniki kwadratowe w x otrzymujemy:

x S

x K

B x Kx

R K

x^T ^T ^¹  ^T ^¹  ^T ˆ^¹

1 1

ˆ^1  KR^ K  B^

Co daje: S

Analogicznie równanie liniowe w x^T:

ˆ) ˆ (

) (

) ( )

(Kx ^T R^¹ y  x^T B^¹ x_a  x^T S ^¹ x

Upraszczając czynnik x^T ponieważ równanie musi być spełnione dla każdego x oraz podstawiając za S^-1 otrzymujemy:

x B

K R

K x

B y

R

K^T ^¹  ^¹ _a  ( ^T ^¹  ^¹) ˆ

(15)

) (

) ˆ (

1 1

1 1 1

a T

T a

a T

T

Kx y

R K

B K

R K

x

x B

y R

K B

K R

K x













) (

)

ˆ x_a BK^T (KBK ^T R ¹ y Kx_a

x    ^ 

alternatywnie

(16)

16

Liczba stopni swobody

• Rozważmy przypadek gdy mamy p niezależnych informacji (p pomiarów) nieobarczonych błędami (gdy dopuścimy

błędy pomiarowe oznaczać to może, że duże błędy zmniejszą liczbę niezależnych informacji).

• Rozważmy przypadek, gdy mamy dwuelementowy wektor stanu (x₁,x₂) oraz dwa pomiary (y₁, y₂) i prosty model do przodu



 







 



 







 



 



 





2 1 2

1 2

1

x x 01

. 1 99 . 0

99 . 0 01 . 1 y

y

gdzie błędy są niezależne a ich wariancja wynosi ². Jest to równoznaczne z pomiarem ortogonalnej kombinacji z₁ oraz z₂.

2 1

2

2 1

1

) x x

( 02 . 0 )

y y

( z

) x x

( 2 )

y y

( z





























 ^{Zmienna z}² ma znacznie mniejszą

wartość niż z₁a więc nie zawiera użytecznej informacji na temat różnicy x₂ – x₁.

(17)

• Ponieważ, macierze kowariancji mogą posiadać niezerowe elementy poza diagonalą (będące odzwierciedleniem korelacji pomiędzy poszczególnymi elementami) transformujemy

macierz do nowej bazy w której wszystkie wartości pozadiagonalne są zerowe.

)

~ ¹^/²(

xa

x B

x  ^  ~y  R^¹^/² y



 ^~^~ ^~

~

~y  R^¹^/²KB¹^/²x  R^¹^/²  Kx 

gdzie: ~ ¹^/² ¹^/² KB R

K  ^

Liczba niezależnych obserwacji jest równa liczbie wartości osobliwych macierzy:

które mają wartość większą niż 1.

Jest to równoznaczne z liczbą wartości własnych macierzy

2 / 1 2

/

~ 1

KB R

K  ^

(18)

18

Analiza błędów





 f (x,b) y

) c , x , bˆ , y ( R

xˆ  _a

Zapiszmy wektor obserwacji w postaci:

gdzie b oznacza wektor parametrów niewchodzących w skład wektora stanu (np. natężenie linii widmowej, zależność poszerzenia linii widomych od temperatury itd.), zaś f jest „forward function” opisującą fizykę pomiaru uwzględniającą np. transfer promieniowania, czy pełny opis aparatury pomiarowej.

Wektor odzyskiwanych parametrów może być umownie zapisany w postaci:

gdzie R oznacza umownie metodę odwrotną, oznacza najlepsze oszacowanie parametrów funkcji do przodu f, zaś c jest wektorem

parametrów nie występujących podobnie jak wektor informacji a priori x_a w funkcji f, które jednak mogą wpływać na wartości odzyskiwanych

parametrów np. przez równego rodzaju niepewności i błędy.

bˆ

(19)

Podstawiając otrzymujemy:

) b , b , x ( f )

b , x (

F  ^'

) c , x , bˆ , )

b , x ( f ( R

xˆ    _a

Dokonujemy linearyzacji modelu do przodu F (y=F(x)+)

gdzie wektor b został podzielony na b i b’ zaś b’ opisuje te parametry funkcji do przodu f, które zostały zignorowane przy konstrukcji modelu do przodu F.

Wyznaczany wektor stanu możemy przepisać do postaci:

) c , x , bˆ , )

' b , b , x ( f )

b , x ( F ( R

xˆ      _a

gdzie f jest błędem modelu do przodu związanym z niepoprawnym opisem fizycznym

(20)

20

Dokonujemy linearyzacji modelu F w otoczeniu

otrzymujemy _b _bˆ

x

x _a



) c , x , bˆ , )

' b , b , x ( f )

bˆ b

( K )

x x

( K )

bˆ , x ( F ( R

xˆ  _a  _x  _a  _b      _a

gdzie

b K F

x K F

b x



 



 

Obecnie linearyzujemy operator R względem wektora y:

] )

' b , b , x ( f )

bˆ b

( K )

x x

( K [ G ]

c , x , bˆ ), bˆ , x ( F [ R

xˆ  _a _a  _x _x  _a  _b     

x G_x R



 

(21)

y y

a

a a

G

) x x

( A

x ] c , x , bˆ ), bˆ , x ( F [ R x

xˆ















Ostatecznie różnica pomiędzy wektorem odzyskanym a wektorem informacji a priori wynosi:

x K xˆ

G

A _y _x



 

 _y  K_b(b  bˆ)  f(x,b,b')   bias

wygładzanie

błąd metody odwrotnej

gdzie

(22)

22



















y y

b y

a

G

) ' b , b , x ( f G

) bˆ b

( K G

) x x

)(

I A ( x

xˆ

Ostatecznie różnica pomiędzy wektorem odzyskanym a wektorem stanu wynosi:

błąd wygładzania

błąd parametrów modelu błąd modelu do przodu szum metody odwrotnej