• Nie Znaleziono Wyników

Analiza informacji meteorologicznych Wykład 1

N/A
N/A
Protected

Academic year: 2021

Share "Analiza informacji meteorologicznych Wykład 1"

Copied!
58
0
0

Pełen tekst

(1)

Analiza informacji meteorologicznych

Wykład 1

Krzysztof Markowicz Instytut Geofizyki UW kmark@igf.fuw.edu.pl

(2)

2

Informacje ogólne

Wykład: czwartek godzina 14:00-15:40, sala B4.58 Ćwiczenia: czwartek godzina 9:15-11:00,

sala B4.17.

Forma zaliczenia:

Zaliczenie ćwiczeń Egzamin ustny

(3)

3

Literatura

• Roger Daley, „Atmospheric Data Analysysis”.

• Notatki do wykładu z lat ubiegłych:

http://www.igf.fuw.edu.pl/~kmark/stacja/wyklady/AnalizaInfo rmacjiMeteo/PrzetwarzanieDanychKHaman.doc

http://www.igf.fuw.edu.pl/~kmark/stacja/wyklady/AnalizaInformac jiMeteo/

• Robert Dayley, Atmospheric Data Analysis, Cambridge Atmospheric and Space Science Series, 1993.

Internet:

• Kurs asymilacji danych ECMWF

https://www.ecmwf.int/en/learning/education-material/lecture-no tes

(4)

4

Program wykładu

Wprowadzenie do wykładu, proces przetwarzania danych.

Dane meteorologiczne

typy danych (dane standardowe i niestandardowe) formaty danych meteorologicznych

wykrywanie błędów i weryfikacja danych

Analiza danych meteorologicznych

pojęcie skali

interpolacja danych, przegląd metod interpolacyjnych

Asymilacja danych

wprowadzenie do asymilacji danych asymilacja 3D oraz 4D

filtr Kalmana

przykłady asymilacji danych satelitarnych, danych synoptycznych

(5)

5

Re-analiza danych klimatologicznych

standaryzacja długich serii obserwacyjnych re-analiza NCEP/NCAR

Filtracja

matematyczny opis procesu filtracji

filtracja w czasie pomiaru wielkości fizycznych typy filtracji

Statystyczna analiza danych

przestrzeń zdarzeń losowych, zmienna losowa jedno i wielowymiarowa, prawo wielkich liczb

gęstość prawdopodobieństwa, dystrybuanta, histogram poziom istotności, przedział ufności, weryfikacja hipotez momenty statystyczne, macierz kowariancji i korelacji funkcje od zmiennych losowych

Regresja

liniowa i nieliniowa

metoda najmniejszych kwadratów regresja zmiennej wielowymiarowej

(6)

6

Elementy teorii procesów stochastycznych

definicje

funkcja autokorelacyjna

przedstawienie kanoniczne funkcje strukturalne

procesy losowe, proces stacjonarny i jednorodny procesy niestacjonarne

rozwinięcie fourierowskie i analiza fourierowska procesu stacjonarnego

twierdzenie ergodyczne

Empiryczne Funkcje Ortogonalne EOF

przykłady EOF-ów

Analiza falkowa i fraktalna

falki

przykłady i konstrukcja falek wymiar fraktalny Hausdorffa wymiar korelacyjny i pudełkowy

Sieci Neuronowe

przykłady prostych układów samouczących

(7)

7

Zagadnienia na ćwiczenia

• Wstęp do przetwarzania informacji meteorologicznych w matlabie

• Czytanie różnych formatów danych meteorologicznych i ich wizualizacja

• Wykrywanie i korekcja błędów w danych

• Interpolacja, ekstrapolacja

• Elementy asymilacji danych, metody minimalizacyjne

• Regresja danych

• Filtracja danych

• Przetwarzanie danych na przykładzie danych satelitarnych, sondażowych i innych

• Metody statystyczne, analiza statystyczna danych

• Analiza Fouriera, Falkowa

• Rozkład kanoniczny na funkcje ortogonalne EOF-y , przykłady

(8)

8

Główne problemy i zadania związane z przetwarzaniem danych meteorologicznych

• Asymilacja danych meteorologicznych do modeli

numerycznych (dane pochodzą z różnych przyrządów a pomiary nie raz wykonywane są w różnych momentach czasu).

• Asymilacja danych satelitarnych. Dane o silnie

niejednorodnym rozkładzie np. pomiary SST wykonywane są gdy brak chmur na danym obszarze.

• Wizualizacja danych obserwacyjnych

• Ujednolicanie pól meteorologicznych pochodzących z różnych typów obserwacji.

• Analizy danych pod kątem statystycznym

• Rekonstrukcja niejednolitych ciągów czasowych

• Problemy wynikające ze zmian przyrządów używanych do obserwacjach klimatycznych – ujednolicanie serii

pomiarowych (re-analiza meteorologiczna). Problem ten dotyczy zarówno pomiarów typu in-situ jak i

teledetekcyjnych.

(9)

9

• Dane – wszystkie informacje w formie zakodowanej (binarnie, szesnastkowo, kreskowo itd.)

• Informacja - oznacza pewną własność fizyczną lub

strukturalną obiektów, która może być przesyłana. Dzięki czemu pozwala ona rozróżniać obiekty

• Jednostką podstawowa informacji jest bit informacji

• Do przekazywania informacji stosuje się kodowanie.

Najprostszym kodem jest kod binarny i wszystkie inne można na niego przetłumaczyć

• Archiwizowanie i przenoszenie informacji jest często kodowane aby ograniczyć koszty tego procesu.

(10)

10

Proces przetwarzania danych

• Przetwarzanie danych – to proces w czasie, którego dane

konwertowane są z jednego formatu do drugiego. Często spotyka się inną definicje mówiącą, że jest to proces komputerowy pomiędzy

danymi a informacją.

• Proces ten często odbywa się automatycznie na pośrednictwem komputerów lub mikrokomputerów

• W czasie przetwarzania danych nie powstają nowe dane, mogą być za to tracone.

• W czasie procesu przetwarzania danych możemy wyróżnić:

• Selekcję (rezygnacja z części danych wejściowych)

• Uogólnianie (rezygnacja z niepotrzebnych rozróżnień np. przez uśrednianie)

• Zmianę kodu (np. przejście z danych liczbowych na format graficzny),

• Zmianę nośnika i archiwizację

• Transmisję

• Filtrację (wydobywanie z wyjściowego zbioru danych istotnie potrzebnych z punktu widzenia prowadzącego proces).

(11)

11

To proces w czasie którego dokonujemy redukcji danych wyjściowych tak, aby zbiór danych końcowych zwierał

jedynie informacje rzeczywiście niezbędne użytkownikowi w formie wygodnej do ich wykorzystania.

Wynika to z faktu, iż mamy do dyspozycji ogromne ilości danych a człowiek, który jest najczęściej końcowym

użytkownikiem danych nie jest w stanie operować więcej niż kilkoma informacjami naraz.

Elementami procesu analizy są

• detekcja i korekcja błędów

• synteza (redukcja danych do postaci przyswajalnej przez użytkownika)

• edycja (wybór informacji oraz formatu)

• wizualizację (graficzna forma edycji zależna od

przeznaczania np. mapy 3D, przekroje, histogramy itd.)

Analiza

(12)

12

Analiza subiektywna i obiektywna

• Subiektywna analiza danych meteorologicznych została zapoczątkowana przez szkołę norweską w czasie I Wojny Światowej. Przykładem są tu mapy synoptyczne rysowane ręcznie. W tym przypadku

analiza zależy od osoby która ją sporządza. Pierwsze mapy Bergerona są raczej dziełem artystycznym niż wykorzystanie posiadanej wiedzy.

• Obiektywna analiza danych często zwana również statystyczną oznacza, że proces analizy jest

zalgorytmizowały a wynik powtarzalne.

(13)

13

Subiektywna analiza pola meteorologicznego

(14)

14

(15)

15

Analiza obiektywna

• Głównym problemem analizy obiektywnej jest nieregularność przestrzenna (czasami również czasowa) sieci obserwacyjnej.

• Musimy podać zmierzone wartości parametrów meteorologicznych w punktach siatki.

• Tak wiec obiektywna analiza jest w NWP jest procesem interpolacyjnym, w wyniku którego uzyskujemy

wartość początkową pola meteorologicznego.

• Dlaczego nie jest to „prosta”

interpolacja nieregularnego pola wielkości skalarnych czy

wektorowych?

• Istnieje wiele odpowiedzi na to pytanie, zostaną jednak one

udzielone w dalszej części wykładu.

(16)

16

Asymilacja danych do numerycznych prognoz pogody

NWP - Numerical Weather Prediction

(17)

17

Ciągła asymilacja danych, wykorzystująca zarówno nowe jak i stare informacje

(18)

18

Dane meteorologiczne

• Pochodzą z obserwacji atmosferycznych

• Dzielimy je na standardowe (zbierane wg ściśle

określonej procedury za pomocą standaryzowanych

przez WMO przyrządów) i niestandardowe (obejmujące wyniki z procesów badawczych).

• Dane meteorologiczne dzielimy na:

Synoptyczne, klimatologiczne i inne.

• Dane synoptyczne wykonywane są w tych samych porach czasu UTC (pomiary synchroniczne)

• Dane klimatologiczne wykonywane są w względem czasu lokalnego ( pomiary niesynchroniczne).

• Pomiary satelitarne są z reguły niesynchroniczne poza pomiarami z platform geostacjionarnych.

(19)

Typy stacji meteorologicznych

Meteorologiczne (około 60 w Polsce) –

wykorzystywane głownie przez służby meteorologiczne WMO. Obserwacje prowadzone co godzinę

Posterunki meteorologiczne (około 260). Obserwacje 3 razy w ciągu doby (06 12 18 UTC)

Posterunki opadowe (około 2300) pomiary wysokości opadu i pokryw śnieżnej o godzinie 06 UTC

Stacje specjalne:

1. Aerologiczne (3 w Polsce) 2. Agrometeorologiczne

3. Biometeorologiczne 4. Lotnicze

5. Fenologiczne 6. Naukowe

(20)

Rodzaje obserwacji meteorologicznych

1) In Situ – pomiary w miejscu (ustalone ,,h,t)

2) Metody teledetekcyjne (zdalne) przy wykorzystaniu fal elektromagnetycznych (mikrofale, ultrafiolet,

promieniowanie widzialne i podczerwone) fale akustyczne. Pozwalają wyznaczyć rozkład

przestrzenny parametru

(21)

Miejsce obserwacji meteorologicznych In-situ

• Ogródek meteorologiczny o minimalnych rozmiarach

10x15 m.

• Obszar otwarty i

reprezentacyjny dla danego (jak największego) obszaru.

• Pokrycie terenu niska trawa

• Oddalony od przeszkód terenowych (dokładne informacje specyfikuje WMO)

(22)

Położenie ogródka

• w odległości 30 m od ogródka nie mogą znajdować się żadne budynki, drzewa, krzewy oraz uprawy sztucznie zraszane;

• w odległości ponad 30 m od ogródka mogą stać małe pojedyncze obiekty np. parterowy dom czy drzewo, jednak ta odległość nie może być mniejsza niż 10-cio krotna ich wysokość;

• w odległości ponad 100 m od ogródka może być luźna zabudowa i małe grupy drzew

• w odległości ponad 300 m od ogródka mogą znajdować się zwarte zespoły drzew (sady i parki);

• w odległości co najmniej 500 m od ogródka mogą stać już wielopiętrowe bloki mieszkalne.

(23)

Klatka meteorologiczna

Po co stosuje się klatki meteorologiczne?

Ustabilizować przepływ powietrza w koło przyrządów znajdujących się w środku

Minimalizować efekty promieniowania słonecznego Chronić przyrządy przed opadami

atmosferycznymi

(24)

Przyrządy w klatce meteorologicznej

(25)

Wielkości mierzone

• Temperatura powietrza, gruntu, wody

• Ciśnienie

• Wilgotność, zasolenie

• Parowanie z wody, z gleby z roślin

• Chmur, zachmurzenie, rodzaj, wysokości podstawy

• Opady, suma opadu, natężenie, rodzaj opadu

• Pokrywa śniegu

• Promieniowanie słoneczne i ziemskie

• Wody, stan, przepływ

• Widzialność

• Zanieczyszczenia (aerozol, radioaktywne)

• Pomiary aerologiczne

(26)

Fizyka pomiarów

WEWE czujnikczujnik przetwarzanieprzetwarzanie wskaźnikwskaźnik WYWY

wzorzec

wzorzec kalibracjakalibracja

(27)

Nowoczesne systemy zbierania i przetwarzania danych

czujnik

czujnik przetwarzanieprzetwarzanie

wskaźnik wskaźnik

analiza analiza rejestracja

rejestracja

inneinne przyrządy

przyrządy modelmodel

(28)

Parametry opisujące czujnik

• Czułość (sensitivity) S=d(Wy)/d(We) pochodna krzywej kalibracyjnej.

(29)

• Rozdzielczość (resolution) - najmniejsza zmiana wielkości na wejściu jaka można wykryć na wyjściu

• Precyzja (precision) – minimum odchylenia od wartości najbardziej prawdopodobnej

• Dokładność (odtwarzalność) – precyzja + zgodność z wybranym wzorcem

Ponadto:

• Zakres – określa dynamikę przyrządu

• Histereza powtarzalność pomiaru w rożnych warunkach

• Próg działania (np. anemometr)

• SNR = log(S/N) – stosunek sygnału (S) do szumu N wyrażony w [dB]

(30)

• Dokładność pomiaru

określa, jak bardzo rezultat pomiaru jest zbliżony do wartości prawdziwej. Wyniki o dużej dokładności

otrzymuje się stosując mierniki i wzorce o małej niepewności wzorcowania

• Precyzja pomiaru

określa, jak dobrze został określony rezultat pomiaru, bez odnoszenia się do wartości prawdziwej. Wyniki o dużej precyzji otrzymuje się poprzez taką modyfikację warunków pomiaru, aby niepewności przypadkowe były jak najmniejsze.

(31)
(32)

32

Redundancja informacji

• W teorii informacji redundancja to ilość informacji przekraczająca wymagane do rozwiązania problemu minimum.

• Bardziej formalnie – ilość bitów w wiadomości minus ilość bitów faktycznej informacji.

• Celowa redundancja danych jest stosowana w celu ułatwienia

odtworzenia danych po ich częściowej utracie czy uszkodzeniu lub też do wykrycia takiego uszkodzenia (CRC, suma kontrolna).

• Redundancja ma zastosowanie głównie w przypadku bardzo ważnych, strategicznych dla danego systemu informacji.

Szczególnie często mamy do czynienia z redundancją danych w systemach telekomunikacyjnych, gdzie niezawodność przesyłania odgrywa kluczową rolę podczas transmisji.

• Usuwanie nieprzydatnej redundancji to kompresja danych.

Paradoksalnie, wiele programów kompresujących może dodawać niewielkie informacje nadmiarowe, pozwalające wykryć

uszkodzenie skompresowanych danych (sumy kontrolne).

(33)

33

Suma kontrolna

• to liczba uzyskana w wyniku sumowania lub wykonania innych operacji matematycznych na przesyłanych danych, przesłana razem z danymi i służąca do sprawdzania poprawności

przetwarzanych danych.

• komputer wysyłający dane liczy sumę kontrolną i dołącza ją do pakietu danych. Komputer odbierający dane liczy również sumę kontrolną z odebranych danych i sprawdza, czy zgadza się

suma obliczona przez niego z sumą odebraną z pakietem danych. Jeśli nie, to znaczy, że dane uległy przekłamaniu.

• odmianą sumy kontrolnej jest:

• CRC

• cyfra kontrolna w numerach PESEL (11 cyfra), NIP, numerach kont bankowych,

• bit parzystości stosowany przy transmisji szeregowej łączem RS-232, lub bit parzystości w taśmie perforowanej. W tym przypadku liczba jest liczbą 1-bitową,

• suma bitowa, różnica bitowa stosowana w wielu protokołach transmisji danych.

(34)

34

Przykład – bit parzystości

• Jest to bit dodawany do każdego bajtu informacji w celu

sprawdzenia poprawności pakietu, w ten sposób, by liczba jedynek w bajcie była zawsze parzysta.

• Bit parzystości otrzymuje wartość 0 lub 1 tworząc sumę wszystkich bitów tak aby łączna wartość równała się 0 - była zawsze parzysta.

• Pakiet bajtowy 10111101 jest parzysty (6 bitów '1'), więc bit parzystości wynosi 0 dając 9 bitowe wyrażenie kodowe 101111010.

• Pakiet bajtowy 01110011 jest nieparzysty (ma 5 bitów '1'), więc bit parzystości wynosi 1, dając 9 bitowy wyraz kodowy 011100111.

• Pakiet bajtowy 00000000 jest parzysty (ponieważ zero jest parzyste), więc bit parzystości wynosi 0, dając w rezultacie 9 bitowe wyrażenie kodowe 000000000.

• Bit parzystości umożliwia wykrywanie tylko pojedynczych

przekłamań. Toteż obecnie zaprzestaje się jego używania na rzecz rozbudowanych i pewniejszych protokołów nadzoru poprawności transmitowanych danych.

• Odwrotnością bitu parzystości jest bit nieparzystości.

(35)

35

CRC (Cyclic Redundancy Check) – cykliczny kod nadmiarowy)

• to matematyczna suma kontrolna wykorzystywana do wykrywania uszkodzonych danych binarnych.

• Kod CRC zwykle dodawany jest do ramki lub pakietu w celu późniejszej weryfikacji integralności danych. Jest to algorytm

wykrywania błędów bardziej niezawodny niż suma kontrolna, umożliwia również określenie, czy błąd zdarzył się podczas transmisji.

• Wartość CRC określana jest w sposób bardziej rygorystyczny niż wartość sumy kontrolnej.

• CRC jest resztą z binarnego dzielenia ciągu danych przez relatywnie krótki dzielnik, zwany generatorem lub wielomianem CRC. W praktyce stosuje się najczęściej wielomiany o długości 17 lub 33 bitów, dające odpowiednio wyniki 16 (CRC-16) i 32 bitów (CRC-32).

• Metoda ta jest szeroko wykorzystywana do wykrywania błędów przypadkowych, ale nie nadaje się do ochrony integralności w zastosowaniach kryptograficznych. CRC jest relatywnie łatwe do

sfałszowania, tj. jest możliwe takie poprawienie ciągu bitów by dawał on w wyniku poprawne CRC.

(36)

36

Weryfikacja Danych

• Jednym z głównych zadań weryfikacji danych jest wykrywanie błędów

• błędy pojawiają się w czasie obserwacji meteorologicznych i można je podzielić na

• błędy aparatury pomiarowej

• błędy powstałe w czasie rejestracji (zapisu)

• błędy związane z niereprezentatywnością pomiarów

• błędy transmisji danych.

(37)

37

Cechy informacji meteorologicznych, które wykorzystuje się podczas weryfikacji danych

• wykazują zależności fizyczne pomiędzy różnymi wielkościami np. wiatr geostroficzny, czy równanie hydrostatyki wprowadzają związki na podstawowe wielkości mierzone w czasie obserwacji

meteorologicznych.

• mieszczą się w pewnych zakresach zmienności (widełkach)

(38)

38

Wykrywanie błędów

Jeżeli błędy są względnie nieduże, stwierdzenie ich istnienia i wielkości może być niemożliwe i trzeba je traktować jako nieusuwalną

niepewność, możliwą do oszacowania co najwyżej w sensie statystycznym.

Natomiast błędy większe dają się często wykryć i w pewnym stopniu skorygować.

Do wykrywania takich błędów wykorzystuje się redundancję w zapisie danych lub redundancję zawartą we wcześniejszej wiedzy na temat ich własności, lub w metadanych.

W szczególności wykrycie błędu umożliwiają często:

znajomość zakresu zmienności parametru (wartość odbiegająca

znacznie od oczekiwanej a zwłaszcza wykraczająca poza znany zakres zmienności może być błędna);

znajomość skali zmienności pola lub przebiegu czasowego

pozwalająca na wykrycie błędów przez stwierdzenie nierealnych wartości pierwszych lub drugich pochodnych.;

znajomość zależności pomiędzy różnymi wielkościami – można np.

szukać rozbieżności pomiędzy zmierzonym polem ciśnienia i polem oczekiwanym na podstawie pomiarów temperatury itp. oraz równania hydrostatyki, która to rozbieżność świadczyć może błędzie.

na podstawy pewnej wiedzy a priori o własnościach analizowanych pól

na podstawie wiedzy statystycznej.

(39)

39

• W szczególności, jeśli przebieg czasowy pewnego parametru w danym punkcie obserwacyjnym

zaczyna zachowywać się inaczej niż w punktach sąsiednich, podczas gdy wcześniej wykazywał

podobieństwo, może to wynikać z zerwania

jednorodności danych, np. zmiany przyrządów lub zmiany warunków fizjograficznych w otoczeniu tego punktu.

• Nietypowe zachowanie analizowanego pola lub przebiegu czasowego nie zawsze musi oznaczać błąd w danych (choć najczęściej to oznacza). Może też być sygnałem wystąpienia jakiegoś nieznanego lub w danych okolicznościach nieoczekiwanego

zjawiska. Dlatego automatyzacja korygowania takich błędów może być ryzykowna (vide historia „dziury ozonowej”) choć często bywa konieczna ze

względów operacyjnych.

(40)

40

Metody korekcji błędów

• Najprostszą metodą korekcji jest odrzucenie danej uznanej za błędną.

Może to jednak czasem spowodować odrzucenie informacji nietypowej ale prawdziwej. Ponadto w wielu przypadkach dane są używane w

operacjach, które nie dopuszczają pustych pozycji (np. obliczenia na

sieciach punktów o regularnych odstępach pomiędzy węzłami). W takim przypadku błędną wartość należy zastąpić inną, policzoną na podstawie posiadanych danych redundantnych. Może to być:

• najbardziej prawdopodobna wartość klimatologiczna,

• wartość wyliczona na podstawie znanych relacji z innymi polami (np.

geopotencjał wyliczony na podstawie rozkładu temperatury i wilgotności),

• wartość uzyskana w wyniku interpolacji na podstawie danych z innych punktów analizowanego pola lub przebiegu.

• W szczególności dane klimatyczne można poprawiać, wykorzystując dane archiwalne na temat korelacji tendencji zmian parametrów

pomiędzy sąsiednimi stacjach.

(41)

41

Formaty danych metrologicznych

• Zapisywanie informacji meteorologicznych obejmujących dane: synoptyczne, klimatyczne, satelitarne czy też wyniki obliczeń numerycznych prognoz pogody w odpowiednim formacie stanowi zasadnicza kwestia w sensie ich

przesyłania, archiwizacji, budowy baz danych z możliwością dostępu dla użytkowników.

• Niestety nie stanieje żaden standardowy format, w którym zapisywane byłby wyżej wspominane dane.

• Dlatego też czytanie danych meteorologicznych wymaga niejednokrotnie używania specjalnych programów, które zależą od systemów operacyjnych i rodzajów używanych komputerów.

(42)

42

Pliki tekstowe i binarne

• Rozróżniamy dwa rodzaje plików: tekstowe i binarne. Nazwy są trochę mylące, bo wszystkie pliki są binarne, czyli

,,zerojedynkowe''.

• Jednak pliki tekstowe zajmują wśród nich wyróżnioną pozycję, sposób ich odczytywania jest bowiem najbardziej w świecie komputerów rozpowszechnionym standardem. Znajdują się w nich litery, zamienione na bity.

• Zapisany w ten sposób plik można odczytać na dowolnym komputerze, niezależnie od systemu operacyjnego itp. W

dodatku ,,odczytać'' możemy tu rozumieć dosłownie, gdyż po zamianie bitów na litery (czyli wyświetleniu pliku ASCII) pojawia się tekst, zwykle zrozumiały dla człowieka.

• Ogólnie, pliki binarne to wszystkie pliki nietekstowe. Mogą

zawierać obrazy, lub dowolne dane. Jeśli zapisano je w jednym z ogólnie przyjętych standardów to zwykle daje się je odczytać na większości komputerów, jeśli tylko zainstalowano na nich

odpowiednie programy. To jednak znacznie komplikuje i utrudnia zadanie użytkownikom którzy zajmują się analiza tego typu

danych

(43)

43

Hierarchical Data Format- HDF

• HDF jest biblioteka oraz wielowymiarowym formatem plików używanym do przesyłania danych w postaci graficznej oraz numerycznej między komputerami.

• Format HDF zawiera kilka modułów danych:

wielowymiarowe macierze, grafikę rastrową oraz tablice.

Każdy z nich zawiera zespół zmiennych, które mogą być zapisywane, czytane oraz dodawane przez użytkownika

• Format HDF jest samoopisujący się co oznacza, że czytając plik z danymi nie musimy posiadać żadnej informacji o strukturze pliku.

• Pliki w formacie HDF mogą być wymieniane pomiędzy większością komputerów i systemów operacyjnych!!.

• Format HDF używany jest najczęściej dla danych satelitarnych

(44)

44

FIGURE 1a - HDF Data Structures

(45)

45

GRIB (GRIdded Binary)

• To matematyczny format używany na potrzeby

meteorologii do archiwizowania danych historycznych oraz wyników numerycznych prognoz pogody

• GRIP jest formatem standardowym zaakceptowanym przez World Meteorological Organization jak GRIB FM 92-IX, opisany w raportach WMO (Manual on Codes No.306).

• Obecnie funkcjonują dwie wersje GRIB-ow:

• Edycja pierwsza GRIB-ow jest szeroko używana przez centra meteorologiczne na potrzeby

numerycznych prognoz pogody

• Nowej generacji (druga edycja) nie jest używana tak powszechnie. Wyjątkiem jest Eumetcast, gdzie w GRIBAch zapisuje się produkty związane z

Meteosatem drugiej generacji ( Meteosat Second Generation)

(46)

46

Struktura GRIBów

• Każdy plik w formacie GRIB zawiera szereg rekordów.

• Każdy z rekordów składa się z jednego parametru dla danego czasu oraz jednego poziomu.

• Z kolei każdy rekord składa się z 6 sekcji. Przy czym sekcja 4 zawiera właściwe dane. Pozostałe zawierają niezbędne informacje do przeczytania sekcji danych.

• Struktura sekcji:

• Section 0: Indicator Section.

Section 1: Product Definition Section.

Section 2: Grid Description Section - Optional.

Section 3: Bit Map Section - Optional.

Section 4: Binary Data Section.

Section 5: '7777' - ASCII Characters indicating end of GRID record.

(47)

47

NetCDF (Network Common Data Form

Cechy Formatu NetCDF

• samo-opisujący się (plik netCDF zawiera informacje o zawartych w nim danych).

• niezależny od architektury komputera

• bezpośredni dostęp do danych (dowolna część danych może być efektywnie czytana bez wcześniejszego

czytania poprzedzający danych)

• dane mogą być dopisywane do pliku w jednym wymiarze bez przedefiniowania struktury pliku.

• istnieje możliwość zmiany struktury pliku oraz kopiowanie innych ustawień

• równoczesna dostępność do pliku przez osobę zapisującą dane jak i użytkowników czytając do

(48)

48

języki w jakich napisane zostały biblioteki NetCDF

• C

• C++

• Fortran

• Perl

• Jave

niektóre programy czytające pliki NetCDF:

• IDL Interface

• MATLAB

• NCAR Graphics

• FERRET

• GrADS

• HDF Interface

(49)

49

Struktura pliku NetCDF

a) header - część opisująca zmienne zawierająca informacje o:

• wymiarach

• atrybutach

• zmiennych

• b) sekcja danych - zawiera właściwe dane o:

ograniczonych wymiarach

nieograniczonym (jednym) wymiarze

• c) typy zmiennych:

• ncbyte 1 Byte

• ncchar 1 Byte

• ncshort 2 Byte

• ncint 4 Byte

• ncfloat 4 Byte

• ncdouble 8 Byte

(50)

50

Struktura NetCDF-u

(51)

51

• netcdf uwnd10m.mon.mean {

• dimensions:

• lon = 192 ;

• lat = 94 ;

• time = UNLIMITED ; // (694 currently)

• variables:

• float lat(lat) ;

• lat:units = "degrees_north" ;

• lat:actual_range = 88.542f -88.542f ;

• lat:long_name = "Latitude" ;

• float lon(lon) ;

• lon:units = "degrees_east" ;

• lon:long_name = "Longitude" ;

• lon:actual_range = 0.f, 358.125f ;

• double time(time) ;

• time:units = "hours since 1-1-1 00:00:0.0" ;

• time:long_name = "Time" ;

• time:actual_range = 17067072., 17573304. ;

• time:delta_t = "0000-01-00 00:00:00" ;

• time:avg_period = "0017-00-00 00:00:00" ;

• time:prev_avg_period = "0000-00-01 00:00:00" ;

• float uwnd(time, lat, lon) ;

(52)

52

• float uwnd(time, lat, lon) ;

• uwnd:long_name = "Monthly Mean of U-Wind" ;

• uwnd:valid_range = -102.2f, 102.2f ;

• uwnd:actual_range = -13.76903f, 14.4571f ;

• uwnd:units = "m/s" ;

• uwnd:add_offset = 0.f ;

• uwnd:scale_factor = 1.f ;

• uwnd:missing_value = 32766s ;

• uwnd:precision = 2s ;

• uwnd:least_significant_digit = 1s ;

• uwnd:GRIB_id = 11s ;

• uwnd:var_desc = "u-wind" ;

• uwnd:dataset = "CDC Derived NCEP Reanalysis Products\n",

• "AC" ;

• uwnd:level_desc = "10 m\n",

• "P" ;

• uwnd:statistic = "Mean\n",

• "M" ;

• uwnd:parent_stat = "Individual Obs\n",

• "I" ;

(53)

53

• // global attributes:

• :Conventions = "COARDS" ;

• :title = "monthly mean u wind" ;

• :history = "renamevars Thu Feb 1 09:41:58 2001 from uwnd10m.mon.mean.nc\n",

• "Tue Jul 6 00:21:54 1999: ncrcat uwnd10m.mon.mean.nc

/Datasets/ncep.reanalysis.derived/surface_gauss/uwnd10m.mon.m ean.nc

/dm/dmwork/nmc.rean.ingest/combinedMMs/uwnd10m.mon.mean.n c\n",

• "created 97/10/04 by CAS (netCDF2.3)" ;

• :description = "Data is from NMC initialized reanalysis\n",

• "(4x/day). It consists of T62 variables interpolated to\n",

• "pressure surfaces from model (sigma) surfaces." ;

• :platform = "Model" ;

(54)

54

Sekcja danych

• lon = 0, 1.875, 3.75, 5.625,…

• lat = 88.542, 86.6531, 84.7532, 82.8508,…

• time = 17067072, 17067816, 17068512, 17069256,…

• uwnd= -2.035805, -2.166451, -2.145482, -2.277421, -2.800644,…

(55)

55

Wybrane programy do czytania danych (darmowe)

GrADS (Grid Analysis and Display System), HDF, NetCDF, GRIB.

CDAT (Climate Data Analysis Tools), NetCDF, GRIB Xconv/Convsh (NetCDF, GRIB, UK Met Office Unified Model Data Output format, UK Met Office PP format, DRS format)

Programy komercyjne:

Matlab (HDF, NetCDF)

IDL (HDF, NetCDF, GRIB)

(56)

56

Kod SYNOP

• Format SYNOP jest międzynarodowym formatem

danych meteorologicznych używanym do ich transmisji w trybie rzeczywistym.

• Używany jest od ponad 50 lat.

W kodzie SYNOP zawarte są następujące grupy obserwacji

Grupa 000 – oznaczana numer stacji i lokalizacje

• Grupa 111 – opisuje obserwacje nad lądem

• Grupa 222 – opisuje pomiary powierzchni mórz i oceanów

• Grupa 333 – zawiera dane klimatologiczne

(57)

57

Struktura formatu SYNOP

IIiii lub IIIII YYGGi 99LLL QLLLL

iihVV Nddff 00fff 1sTTT 2sTTT 3PPPP 4PPPP 5appp 6RRRt 7wwWW 8NCCC 9GGgg

222Dv 0sTTT 1PPHH 2PPHH 3dddd 4PPHH 5PPHH 6IEER 70HHH 8aTTT

• 333 0.... 1sTTT 2sTTT 3Ejjj 4Esss 5jjjj jjjjj 6RRRt 7RRRR 8Nchh 9SSss

(58)

58

Inne formaty danych

• SHIP

• TEMP

• METAR, TAF, TEMP

• BOUY, AMDAR, AIREP.

Cytaty

Powiązane dokumenty

• W czasie przetwarzania danych nie powstają nowe dane, mogą być za to tracone. przez uśrednianie).. • Zmianę

Minimalizowanym funkcjonałem jest suma kwadratów różnic wartości funkcji interpolacyjnej i wartości obserwowanych w punktach pomiarowych. Najczęściej stosuje się ją do funkcji

Abstrakcyjna teoria prawdopodobieństwa w sensie matematycznym jest bardzo bogata a jej przydatność praktyczna wynika z faktu, że empirycznie wyznaczalne prawdopodobieństwo w

Estymację – szacowanie wartości parametrów lub postaci rozkładu zmiennej na podstawie próby – na podstawie wyników próby formułujemy wnioski dla całej

• W przypadku gdy mamy n punktów siatki operator liniowej interpolacji wpływa na wartości analizy tylko w sąsiedztwie obserwacji podczas gdy współczynnik korelacji

• Nie jest to wybór obowiązkowy jednak należy pamiętać o różnicy pomiędzy informacją a priori, która jest używana w definicji funkcji kosztu od pierwszego przybliżenia,

• Oznacza to, że oszacowanie stanu w danym momencie czasu wymaga znajomości tylko stanu poprzedniego oraz wektora obserwacji.. • Stan filtru Kalmana opisują

• Re-analiza meteorologiczna pozwala na ujednolicenie pomiarów za pomocą technik asymilacji danych i.. przeprowadzenie dokładnej