Metody Przetwarzania Danych Meteorologicznych Wykład 6

(1)

Metody Przetwarzania Danych Meteorologicznych

Wykład 6

Krzysztof Markowicz Instytut Geofizyki UW

kmark@igf.fuw.edu.pl

(2)

3-wymiarowa analiza wariacyjna : 3D-VAR

• W metodzie 3D-Var poszukujemy wektora analizy x_a, który minimalizuje skalarną funkcję kosztu.

• Zdefiniowana jest ona przez odległość pomiędzy

wektorem stanu x a wektorem pierwszego przybliżenia xb

mnożoną przez wagę będąca odwrotnością kowariancji błędu i odległość pomiędzy wektorem stanu x, a

wektorem obserwacji y_omnożoną przez odwrotność kowariancji błędów obserwacyjnych.

• Zarówno metoda 3D-Var jak i OI nie uwzględnia dynamiki modelu.

• W metodzie OI minimalizacji dokonujemy w przestrzeni wektora obserwacji.

• W metodzie 3D-Var minimalizacji dokonujemy w przestrzeni wektora stanu.

(3)

3

3-wymiarowa analiza wariacyjna : 3D-VAR

• Rozważamy funkcję koszu oraz jej gradient w postaci:

Minimalizacja wariacyjnej funkcji kosztu (na podstawie 2-wymiarowego modelu).

Kwadratura funkcji kosztu ma kształt paraboloidy (w tym przypadku) z

wartością minimalna dla optymalnej wartości analizy x_a. Algorytm

poszukiwania wartości minimalnej sprowadza się do poruszania po krzywej funkcji kosztu w kierunku największego gradientu funkcji.

(4)

• W praktyce punkt startowy minimalizacji zwany pierwszym przybliżeniem (first guess) jest często wybierany na podstawie informacji a priori (background) xb.

• Nie jest to wybór obowiązkowy jednak należy pamiętać o różnicy pomiędzy informacją a priori, która jest używana w definicji funkcji kosztu od pierwszego przybliżenia, które jest używane do

inicjalizacji procedury minimalizacyjnej.

• Jeśli minimalizacja jest zadowalająca to wynik analizy nie zależy istotnie od wyboru wartości startowej. Jednak zawsze zależy od informacji a priori.

• Znaczącym problemem analizy 3D-Var jest konieczność znalezienia metody pozwalającej wyznaczyć macierz kowariancji B, która

określa błędy informacji a priori dla każdej pary zmiennych modelu.

• W większości przypadków macierz kowariancji błędu związana z obserwacjami jest przekątna macierzą blokową lub diagonalą.

(5)

5

• Łatwo zauważyć, że przekątna macierz blokowa implikuje, iż funkcja kosztu Jo jest sumą N skalarnych funkcji kosztu Jo,i

każdej zdefiniowanej dla podmacierzy R_i oraz odpowiadającej H_i oraz y_i.

• Rozbicie funkcji kosztu J_o staje się użytecznym narzędziem do badania zachowania metody 3D-Var ze względu na każdą

obserwację (jej wartość i dopasowanie do wektora stanu x)

• Dodatkowo pozwala to na wymuszenie słabszych więzów (ograniczeń) przez dodanie dodatkowego czynnika w funkcji kosztu J_c.

• Prowadzi to jednak do warunku wstępnego co utrudnia i komplikuje minimalizację.

(6)

(7)

7

Przykłady

Mając dany wektor obserwacyjny

szacujemy wektor stanu x_a.

(8)

Q- kowariancja błędów modelu

Mamy zdefiniowany punkt (y_n, x_b) zaś M(x) oznacza trajektorie modelu (wektor stanu obliczony dla różnych wektorów obserwacyjnych). Minimalna odległość trajektorii od punktu (y_n, x_b) definiuje optymalny wektor analizy x_a.

(9)

9

(10)

4-wymiarowa analiza wariacyjna : 4D-VAR

• 4D metoda jest uogólnieniem metody 3D-Var poprzez uzależnienie obserwacji od czasu.

• Równania pozostają takie same jednak operator obserwacji jest uogólniony aby uwzględniać wyniki prognostyczne modelu. Dzięki czemu możemy porównywać wektor stanu modelu z obserwacjami dla określonego czasu.

• Dla danego przedziału czasu analiza startuje w chwili początkowej zaś obserwacje zdefiniowane są dla n

okresów obserwacyjnych w badanych przedziale czasu.

Indeks i będzie służył do oznaczania chwili czasu.

• y_j, x_i oraz x_ti są obserwacjami, wektorem stanu oraz rzeczywistym wektorem stanu dla chwili czasu i, zaś

macierz Ri jest macierzą kowariancji błędu dla obserwacji (yi-Hi(xti))

(11)

11

• Operator obserwacji H_i w chwili czasu i jest linearyzowany do postaci H_i.

• Macierz kowariancji B błędu informacji a priori jest zdefiniowany tylko dla czasu początkowego, podobnie wektor x_b.

• W tym przypadku postać funkcji kosztu jest następująca:

lub

(12)

Analiza 4D-Var

• Definiujemy operator prognostyczny modelu M₀__i

Opisuje on wektor stanu w chwili t=i obliczony na podstawie modelu prognostycznego startującego w chwili początkowej t=0.

Ogólny problem metody 4D-Var jest bardzo trudny do

rozwiązania. Związku z czym stosuje się dwie hipotezy, które upraszczają problem:

(1) Model prognostyczny może być wyrażony jako iloczyn

pośrednich kroków prognostycznych. Jeśli przez M_i oznaczymy operator pomiędzy wektorem stanu w chwili i-1 oraz i (x_i=M_ix_i-1) to wówczas możemy zapisać:

(13)

13

(2) Funkcja kosztu staje się kwadratowa gdy dokonamy linearyzacji operatora H oraz M

gdzie M_0i jest operatorem stycznym (pochodna operatora M) Powyższe hipotezy upraszczają problem minimalizacyjny do

zagadnienia kwadratowego, które jest łatwiejsze do rozwiązania.

Pierwszy czynnik funkcji kosztu J_b jest identyczny jak w metodzie 3D-Var. Obliczenie natomiast drugiego członu J_o , wymaga n

krotnego użycia modelu i całkowania równania modelu od chwili t=0 do t=i. W celu obliczenia gradientu funkcji kosztu musimy użyć model prognostyczny jeszcze więcej razy.

W tym celu używania się pojęcia operatora sprzężonego oraz modelu sprzężonego (adjoint model).

podobnie zakładaliśmy w 3D-Var

(14)

Operator sprzężony

Niech <u,v> będzie iloczynem skalarnym, zaś L liniowym

operatorem. Wówczas operator sprzężony zdefiniowany jest jako:





 u , L

^*

v Lu , v

Jeśli L jest operatorem rzeczywistym to wówczas L^*=L^T. Jeśli L jest operatorem zespolonym to L^* =L⁺

Analiza czułości modelu na warunki początkowe Model F(x)=y

Jak zaburzenie x wpływa na zaburzenie y Jak zaburzenie y wpływa na zaburzenie x

(15)

15

• Operator styczny K _x _K _x

x

y F _k

k k

i i   



 





• Sprzężony operator styczny

) y ( J K

) y ( y J

J x

) F x ( F y

x )) x ( y ( J

y T k

x i

k i i



 

    



 







K^T jest sprzężonym operatorem stycznym (adjoint tangent-linear model)

Modele sprzężone używane są w:

problemach asymilacji danych

przy badaniu czułości modeli na warunki początkowe

(16)

Co to jest model sprzężony?

T

T T T

y K x

y K x K y x



 ( )  ( ) 

Y

T

X

< y, Kx >

< K y, x >

Inverse map

For linear operator K, mapping from space X to space Y.

Adjoint operator K^T

x y

K adjoint model K*

 For nonlinear model K represents linearization of the

X Y

<x,y> iloczyn skalarny wektorów x y

(17)

17

Minimalizacja 4D-Var funkcji kosztu

(1) Wykonujemy całkowanie równań modelu od wektora stanu x do x_n dla każdej pory obserwacyjnej i

(2) Obliczamy znormalizowane odchylenie modelu (3) Obliczamy wkład do funkcji kosztu

(4) Wyznaczamy postać funkcji kosztu

Obliczenie gradientu funkcji kosztu wymaga faktoryzacji

(18)

(5) Inicjalizujemy zmienną sprzężoną dla czasu końcowego

(6) Dla każdego kroku czasu i-1 zmienna jest wyznaczana poprzez tak zwane wymuszenie sprzężone

do

oraz wykonanie całowania co jest równoznaczne z mnożeniem przez M_iT

(7) Ostatecznie w wyniku rekurencji otrzymujemy wartość zmiennej sprzężonej:

Tak więc dokonujemy całkowania wstecznego (w czasie) modelu sprzężonego z krokiem czasu zdefiniowanego przez operator M_i^T oraz wymuszenie H_i^Td_i, które zależy od odległości pomiędzy trajektorią modelu i obserwacjami.

0 x~ 

1

x~i_

i T i d

H

x~

_i

) d H x~

( M

x~_i_₁  _i^T _i  _i^T _i

) x ( J 2 / 1

x~₀   _o

(19)

19

(20)

Uwagi

• Metoda 4D-Var działa jedynie gdy model jest idealny.

W przypadku dużych błędów modelu w metodzie pojawiają się problemy.

• Metoda wymaga implementacji modelu sprzężonego, która jest bardzo pracochłonna dla skomplikowanych modeli prognoz

pogody.

(21)

21

(22)

(23)

23

Rozważmy problem 3 godzinnej prognozy pogody (czerwona linia), która została użyta do pierwszego przybliżenia.

Różnica pomiędzy obserwacjami a prognozą dla czasu T=0 jest niezerowa ze względu na:

– Błędy modelu – Błędy obserwacji

Trudno je jednak rozdzielić.

(24)

W metodzie wariacyjnej

asymilacji danych próbujemy dopasować obserwacje do modelu w ten sposób, iż

warunek początkowy uzyskany w ten sposób jest optymalne z punktu widzenia następnej prognozy.

Na diagramie widoczne jest pierwsze przybliżenie w punkcie A.

Pomimo, że jest ono zgodne z obserwacjami (T-3) prowadzi do znacznego błędu prognozy (T=0).

Odcieniem zielonym zaznaczono obserwacje (z błędem).

(25)

25

Wśród metod 4D-Var wyróżniany metodę sprzężoną (adjoint method)

W metodzie tej używa się

kolejnych iteracji do uzyskania optymalnej prognozy

Innymi słowy analiza Aadj

prowadzi to ustawienia trajektorii modelu (linia niebieska) w taki sposób, iż uzyskujemy lepszą 3 godzinną prognozę chociaż dla czasu T-3 może ona znaczącą odbiegać od obserwacji.

W pewnym więc sensie

wykorzystujemy informację o błędzie prognozy pogody przy zadanych warunkach

początkowych. Dzięki analizie Aadj zmniejszamy ten błąd.

(26)

Minimizing the gradient – transport zanieczyszczeń + pomiary satelitarne

a priori fluxes

Adjoint Fluxes

= J

Adjoint Transport GEOS-

CHEM

GEOS- CHEM

Measurement Sampling

Measurement Sampling Estimated

Fluxes

Modeled Concentrations

simulated Concentrations

Modeled Measurements

“True”

Measurements

Assumed Measurement

Errors Weighted Measurement

Residuals Cost function

J

Flux Update

1 1

( ) ( _a)^T _a ( _a) [ ( )]^T [ ( )]

J x  x x S x x^   y L x S y_^  L x

₀

Minimum of cost function J

°

₂

₁

₃ x₂

x₁

x₃ x₀

(27)

27

Szacowanie błędów analizy

• W przypadku metody OI macierz kowariancji błędu analizy dana jest wzorem

lub redukuje się do postaci

W przypadku metod wariacyjnych macierz kowariancji błędu analizy wyznaczana jest z drugiej pochodnej funkcji kosztu

(28)