Metody Przetwarzania Danych Meteorologicznych
Wykład 6
Krzysztof Markowicz Instytut Geofizyki UW
kmark@igf.fuw.edu.pl
3-wymiarowa analiza wariacyjna : 3D-VAR
• W metodzie 3D-Var poszukujemy wektora analizy xa, który minimalizuje skalarną funkcję kosztu.
• Zdefiniowana jest ona przez odległość pomiędzy
wektorem stanu x a wektorem pierwszego przybliżenia xb
mnożoną przez wagę będąca odwrotnością kowariancji błędu i odległość pomiędzy wektorem stanu x, a
wektorem obserwacji yo mnożoną przez odwrotność kowariancji błędów obserwacyjnych.
• Zarówno metoda 3D-Var jak i OI nie uwzględnia dynamiki modelu.
• W metodzie OI minimalizacji dokonujemy w przestrzeni wektora obserwacji.
• W metodzie 3D-Var minimalizacji dokonujemy w przestrzeni wektora stanu.
3
3-wymiarowa analiza wariacyjna : 3D-VAR
• Rozważamy funkcję koszu oraz jej gradient w postaci:
Minimalizacja wariacyjnej funkcji kosztu (na podstawie 2-wymiarowego modelu).
Kwadratura funkcji kosztu ma kształt paraboloidy (w tym przypadku) z
wartością minimalna dla optymalnej wartości analizy xa. Algorytm
poszukiwania wartości minimalnej sprowadza się do poruszania po krzywej funkcji kosztu w kierunku największego gradientu funkcji.
• W praktyce punkt startowy minimalizacji zwany pierwszym przybliżeniem (first guess) jest często wybierany na podstawie informacji a priori (background) xb.
• Nie jest to wybór obowiązkowy jednak należy pamiętać o różnicy pomiędzy informacją a priori, która jest używana w definicji funkcji kosztu od pierwszego przybliżenia, które jest używane do
inicjalizacji procedury minimalizacyjnej.
• Jeśli minimalizacja jest zadowalająca to wynik analizy nie zależy istotnie od wyboru wartości startowej. Jednak zawsze zależy od informacji a priori.
• Znaczącym problemem analizy 3D-Var jest konieczność znalezienia metody pozwalającej wyznaczyć macierz kowariancji B, która
określa błędy informacji a priori dla każdej pary zmiennych modelu.
• W większości przypadków macierz kowariancji błędu związana z obserwacjami jest przekątna macierzą blokową lub diagonalą.
5
• Łatwo zauważyć, że przekątna macierz blokowa implikuje, iż funkcja kosztu Jo jest sumą N skalarnych funkcji kosztu Jo,i
każdej zdefiniowanej dla podmacierzy Ri oraz odpowiadającej Hi oraz yi.
• Rozbicie funkcji kosztu Jo staje się użytecznym narzędziem do badania zachowania metody 3D-Var ze względu na każdą
obserwację (jej wartość i dopasowanie do wektora stanu x)
• Dodatkowo pozwala to na wymuszenie słabszych więzów (ograniczeń) przez dodanie dodatkowego czynnika w funkcji kosztu Jc.
• Prowadzi to jednak do warunku wstępnego co utrudnia i komplikuje minimalizację.
7
Przykłady
Mając dany wektor obserwacyjny
szacujemy wektor stanu xa.
Q- kowariancja błędów modelu
Mamy zdefiniowany punkt (yn, xb) zaś M(x) oznacza trajektorie modelu (wektor stanu obliczony dla różnych wektorów obserwacyjnych). Minimalna odległość trajektorii od punktu (yn, xb) definiuje optymalny wektor analizy xa.
9
4-wymiarowa analiza wariacyjna : 4D-VAR
• 4D metoda jest uogólnieniem metody 3D-Var poprzez uzależnienie obserwacji od czasu.
• Równania pozostają takie same jednak operator obserwacji jest uogólniony aby uwzględniać wyniki prognostyczne modelu. Dzięki czemu możemy porównywać wektor stanu modelu z obserwacjami dla określonego czasu.
• Dla danego przedziału czasu analiza startuje w chwili początkowej zaś obserwacje zdefiniowane są dla n
okresów obserwacyjnych w badanych przedziale czasu.
Indeks i będzie służył do oznaczania chwili czasu.
• yj, xi oraz xti są obserwacjami, wektorem stanu oraz rzeczywistym wektorem stanu dla chwili czasu i, zaś
macierz Ri jest macierzą kowariancji błędu dla obserwacji (yi-Hi(xti))
11
• Operator obserwacji Hi w chwili czasu i jest linearyzowany do postaci Hi.
• Macierz kowariancji B błędu informacji a priori jest zdefiniowany tylko dla czasu początkowego, podobnie wektor xb.
• W tym przypadku postać funkcji kosztu jest następująca:
lub
Analiza 4D-Var
• Definiujemy operator prognostyczny modelu M0i
Opisuje on wektor stanu w chwili t=i obliczony na podstawie modelu prognostycznego startującego w chwili początkowej t=0.
Ogólny problem metody 4D-Var jest bardzo trudny do
rozwiązania. Związku z czym stosuje się dwie hipotezy, które upraszczają problem:
(1) Model prognostyczny może być wyrażony jako iloczyn
pośrednich kroków prognostycznych. Jeśli przez Mi oznaczymy operator pomiędzy wektorem stanu w chwili i-1 oraz i (xi=Mixi-1) to wówczas możemy zapisać:
13
(2) Funkcja kosztu staje się kwadratowa gdy dokonamy linearyzacji operatora H oraz M
gdzie M0i jest operatorem stycznym (pochodna operatora M) Powyższe hipotezy upraszczają problem minimalizacyjny do
zagadnienia kwadratowego, które jest łatwiejsze do rozwiązania.
Pierwszy czynnik funkcji kosztu Jb jest identyczny jak w metodzie 3D-Var. Obliczenie natomiast drugiego członu Jo , wymaga n
krotnego użycia modelu i całkowania równania modelu od chwili t=0 do t=i. W celu obliczenia gradientu funkcji kosztu musimy użyć model prognostyczny jeszcze więcej razy.
W tym celu używania się pojęcia operatora sprzężonego oraz modelu sprzężonego (adjoint model).
podobnie zakładaliśmy w 3D-Var
Operator sprzężony
Niech <u,v> będzie iloczynem skalarnym, zaś L liniowym
operatorem. Wówczas operator sprzężony zdefiniowany jest jako:
u , L
*v Lu , v
Jeśli L jest operatorem rzeczywistym to wówczas L*=LT. Jeśli L jest operatorem zespolonym to L* =L+
Analiza czułości modelu na warunki początkowe Model F(x)=y
Jak zaburzenie x wpływa na zaburzenie y Jak zaburzenie y wpływa na zaburzenie x
15
• Operator styczny K x K x
x
y F k
k k
i i
• Sprzężony operator styczny
) y ( J K
) y ( y J
J x
) F x ( F y
x )) x ( y ( J
y T k
x i
k i i
KT jest sprzężonym operatorem stycznym (adjoint tangent-linear model)
Modele sprzężone używane są w:
problemach asymilacji danych
przy badaniu czułości modeli na warunki początkowe
Co to jest model sprzężony?
T
T T T
y K x
y K x K y x
( ) ( )
Y
T
X
< y, Kx >
< K y, x >
Inverse map
For linear operator K, mapping from space X to space Y.
Adjoint operator KT
x y
K adjoint model K*
For nonlinear model K represents linearization of the
X Y
<x,y> iloczyn skalarny wektorów x y
17
Minimalizacja 4D-Var funkcji kosztu
(1) Wykonujemy całkowanie równań modelu od wektora stanu x do xn dla każdej pory obserwacyjnej i
(2) Obliczamy znormalizowane odchylenie modelu (3) Obliczamy wkład do funkcji kosztu
(4) Wyznaczamy postać funkcji kosztu
Obliczenie gradientu funkcji kosztu wymaga faktoryzacji
(5) Inicjalizujemy zmienną sprzężoną dla czasu końcowego
(6) Dla każdego kroku czasu i-1 zmienna jest wyznaczana poprzez tak zwane wymuszenie sprzężone
do
oraz wykonanie całowania co jest równoznaczne z mnożeniem przez MiT
(7) Ostatecznie w wyniku rekurencji otrzymujemy wartość zmiennej sprzężonej:
Tak więc dokonujemy całkowania wstecznego (w czasie) modelu sprzężonego z krokiem czasu zdefiniowanego przez operator MiT oraz wymuszenie HiTdi, które zależy od odległości pomiędzy trajektorią modelu i obserwacjami.
0 x~
1
x~i
i T i d
H
x~
i) d H x~
( M
x~i1 iT i iT i
) x ( J 2 / 1
x~0 o
19
Uwagi
• Metoda 4D-Var działa jedynie gdy model jest idealny.
W przypadku dużych błędów modelu w metodzie pojawiają się problemy.
• Metoda wymaga implementacji modelu sprzężonego, która jest bardzo pracochłonna dla skomplikowanych modeli prognoz
pogody.
21
23
Rozważmy problem 3 godzinnej prognozy pogody (czerwona linia), która została użyta do pierwszego przybliżenia.
Różnica pomiędzy obserwacjami a prognozą dla czasu T=0 jest niezerowa ze względu na:
– Błędy modelu – Błędy obserwacji
Trudno je jednak rozdzielić.
W metodzie wariacyjnej
asymilacji danych próbujemy dopasować obserwacje do modelu w ten sposób, iż
warunek początkowy uzyskany w ten sposób jest optymalne z punktu widzenia następnej prognozy.
Na diagramie widoczne jest pierwsze przybliżenie w punkcie A.
Pomimo, że jest ono zgodne z obserwacjami (T-3) prowadzi do znacznego błędu prognozy (T=0).
Odcieniem zielonym zaznaczono obserwacje (z błędem).
25
Wśród metod 4D-Var wyróżniany metodę sprzężoną (adjoint method)
W metodzie tej używa się
kolejnych iteracji do uzyskania optymalnej prognozy
Innymi słowy analiza Aadj
prowadzi to ustawienia trajektorii modelu (linia niebieska) w taki sposób, iż uzyskujemy lepszą 3 godzinną prognozę chociaż dla czasu T-3 może ona znaczącą odbiegać od obserwacji.
W pewnym więc sensie
wykorzystujemy informację o błędzie prognozy pogody przy zadanych warunkach
początkowych. Dzięki analizie Aadj zmniejszamy ten błąd.
Minimizing the gradient – transport zanieczyszczeń + pomiary satelitarne
a priori fluxes
Adjoint Fluxes
= J
Adjoint Transport GEOS-
CHEM
GEOS- CHEM
Measurement Sampling
Measurement Sampling Estimated
Fluxes
Modeled Concentrations
simulated Concentrations
Modeled Measurements
“True”
Measurements
Assumed Measurement
Errors Weighted Measurement
Residuals Cost function
J
Flux Update
1 1
( ) ( a)T a ( a) [ ( )]T [ ( )]
J x x x S x x y L x S y L x
0
Minimum of cost function J
°
°
°
°
2
1
3 x2
x1
x3 x0
27
Szacowanie błędów analizy
• W przypadku metody OI macierz kowariancji błędu analizy dana jest wzorem
lub redukuje się do postaci
W przypadku metod wariacyjnych macierz kowariancji błędu analizy wyznaczana jest z drugiej pochodnej funkcji kosztu