• Nie Znaleziono Wyników

Walidacja krzyżowa

W dokumencie Atlas temperatury powietrza w Polsce: (Stron 74-79)

5. Ocena modelu

5.2. Walidacja krzyżowa

Podstawą oceny jakości modeli przestrzennych w niniejszym opra-cowaniu są wyniki walidacji krzyżowej. Dla prawidłowej interpretacji wyni-ków oceny CV należy jeszcze raz podkreślić, że wielkość błędu w tej meto-dzie jest różnicą pomiędzy wielkością modelowaną a obserwowaną, jednak przy założeniu, że wielkość obserwowana w danej lokalizacji nie jest uwzględniona w procedurze specyfikacji modelu. Oznacza to, że wielkości błędów CV dają wgląd w wielkości modelowane w miejscach nieopróbowa-nych, choć ich populacja jest ograniczona do liczebności i położenia stacji meteorologicznych. Wielkość błędów CV może być wykorzystywana także do porównywania wyników różnych modeli dla tych samych zmiennych.

Taką analizę prowadzono na etapie wyboru metody modelowania (Szyma-nowski, Kryza, 2012). Uzyskane wyniki jednoznacznie wskazywały na po-prawę wszystkich miar zbiorczych błędów CV przy rozszerzeniu modelu z postaci GWR do GWRK. W niniejszym opracowaniu wielkość błędów CV ma pozwolić z jednej strony na ocenę możliwych wielkości błędów w odnie-sieniu do lokalizacji stacji meteorologicznych (błędy ekstremalne i średnie), a z drugiej strony na określenie możliwych tendencji regionalnych do prze-szacowania lub niedoprze-szacowania wielkości temperatury przez model oraz identyfikacji punktów wielkości odstających. W pierwszym przypadku ocze-kiwane są jak najmniejsze wielkości błędów ekstremalnych, MAE i RMSE oraz jak najbliższe zeru wielkości ME. W drugim przypadku model jest bar-dziej wiarygodny im mniej można zaobserwować stacji ze statystycznie

istotną lokalną autokorelacją dodatnią lub ujemną, wyrażającą się na mapach wystąpieniem jednego z czterech typów relacji przestrzennych (HH, LL, LH, HL).

Na podstawie zbiorczych miar błędów walidacji krzyżowej można ogólnie stwierdzić, iż im większy poziom uśrednienia temperatury, tym mniejsze błędy. Jednak w szczegółach obraz nie jest tak jednoznaczny, gdyż dla danych miesięcznych i dobowych obserwowany jest znaczny wzrost zróżnicowania średnich miar błędów CV. Oznacza to, że przykładowo dla danych dobowych statystyki ME, MAE i RMSE mogą być tak małe, jak dla danych miesięcznych (np. 2 czerwca 2002 r., mapa 5.7), ale są też obser-wowane przypadki, gdzie statystyki te są znacząco większe niż na pozosta-łych poziomach agregacji (np. 12 sierpnia 2003 r., mapa 5.17). Prawidłowość ta nie zawsze dotyczy wszystkich trzech statystyk zbiorczych w takim sa-mym stopniu, gdyż akcentują one nieco inne właściwości modelu. Błąd śred-ni (ME) jest z reguły bliski zera, co oznacza symetryczny rozkład dodatśred-nich i ujemnych wielkości błędów. ME > 0 K wskazuje na ogólną tendencję do przeszacowania, ME < 0 K – do niedoszacowania wielkości temperatury przez model. W terminologii anglojęzycznej miarę tą określa się także termi-nem „BIAS”, co jednoznacznie wskazuje na „obciążenie” modelu, wyrażone znakiem i wielkością błędu. W analizowanych przypadkach częściej obser-wowano dodatnie wielkości ME (43 razy) niż wielkości ujemne (26 razy).

Średni błąd bezwzględny (MAE) na ogół przyjmuje wielkości z przedziału 0–1 K, jedynie czterokrotnie przekraczając wartość 1 K, z maksimum 1,636 K dla średniej temperatury 26 grudnia 2002 r. (mapa 5.10). W tym przypadku obserwowano także największą wartość statystyki RMSE błędów CV wyno-szącą 2,077 K. Był to jedyny przypadek, gdy RMSE był większy od 2 K.

Duże wielkości RMSE są oczywiście związane z przypadkami o dużych błę-dach CV w większości stacji, ale gdy dodatkowo rośnie proporcja pomiędzy

RMSE a MAE, to może wskazywać, że występują punkty ze znacząco du-żymi błędami w stosunku do pozostałych miejsc pomiaru (elementy odstają-ce). Największym stosunkiem RMSE/MAE błędów CV, sięgającym 1,5, cha-rakteryzuje się model dla średniej wieloletniej grudnia (mapa 3.12).

Wielkości ekstremalne rzeczywistych błędów CV (informacja zawar-ta w zawar-tabelach atrybutowych warstw CV map cyfrowych) dla średnich rocz-nych i średnich miesięczrocz-nych wieloletnich rzadko osiągają poziom 3 K (-3,350 K dla września 1999 r. – mapa 4.18, stacja Dolina Pięciu Stawów;

+2,944 K dla grudnia 1996 r. – mapa 4.23, stacja Jabłonka). Dla średnich dobowych, w pojedynczych przypadkach niedoszacowanie wielkości tempe-ratury wyrażone błędem CV może przekraczać 7 K, np. -7,501 K dla 27 grudnia 2002 r. (mapa 5.11, stacja Szklarska Poręba). Nieco mniejsze mogą być przeszacowania wielkości temperatury przez model z maksymalną war-tością +6,751 K dla Śnieżki w dniu 9 stycznia 2003 r. (mapa 5.13). General-nie, wstępne wyniki analizy wskazują, iż rosnące wielkości błędów CV nie tyle są związane z rosnącą różnicą temperatury pomiędzy stacjami, co z jej zmiennością, wyrażoną np. odchyleniem standardowym. Największe odchy-lenie standardowe zmierzonej temperatury powietrza stwierdzono dla 26 grudnia 2002 r. (5,02, mapa 5.10), a ekstremalne błędy CV wyniosły wtedy:

-4,616 K (Wisła-Centrum) i +6,143 K (Łopuszna).

Relacje pomiędzy wielkościami błędów obserwowanymi na stacjach sąsiadujących dają wyobrażenie o lokalnych i regionalnych tendencjach do przeszacowania lub niedoszacowania wielkości temperatury przez model.

O elementach odstających – stacjach o wielkości błędu istotnie różniącego się od otaczających – informują relacje typu HL i LH. Natomiast zgrupowa-nia o podobnych, dużych wielkościach błędu przedstawiają relacje: HH (błę-dy dodatnie – przeszacowania) i LL (błę(błę-dy ujemne – niedoszacowania).

Przyczyn występowania tego rodzaju błędów CV może być wiele, a

określe-nie, co stoi za pojawieniem się błędu w konkretnym przypadku jest trudne.

Relacje elementów odstających mogą pojawiać się jako typowe na obszarach górskich, gdzie stacje o niewielkiej odległości euklidesowej położone są w znacząco odmiennych warunkach środowiskowych (np. duże różnice wy-sokości, różne formy rzeźby terenu). Takie efekty są typowe dla regionu kar-konosko-izerskiego – stacje: Jakuszyce, Szklarska Poręba, Śnieżka, Karpacz, Jelenia Góra, Paprotki – jako relacje LH (np. mapa 2.1), HL (np. mapa 1.1) lub naprzemiennie występujące relacje LH i HL (np. mapy 3.1, 3.5, 3.6). Re-lację typu HL obserwuje się też często w rejonie Podhala i Kotliny Nowotar-skiej, zwłaszcza na stacjach Jabłonka i Łopuszna (np. mapy 1.1, 2.1, 3.1).

Tendencje regionalne przeszacowania modelu, a więc przypadki, gdy dla grupy stacji sąsiadujących ze sobą obserwowane są wysokie dodatnie wielkości błędu CV, mogą występować, gdy stacje te charakteryzują się po-dobnymi cechami lokalizacji, a model matematyczny nie jest wystarczająco efektywny do prawidłowego określenia wielkości temperatury. Typowym przykładem takiego efektu jest grupa stacji w regionie Beskidu Sądeckiego i zachodniej części Beskidu Niskiego – Piwniczna, Muszyna, Krynica, Wy-sowa i Barwinek. Stacje te zlokalizowane są w obrębie form dolinnych, a ich wysokość nie przekracza 600 m n.p.m. (tab. 1). Położenie w obrębie form dolinnych sprawia, że przy zwiększonej częstości pojawiania się zastoisk chłodnego powietrza, obserwowana temperatura jest niższa niż wskazuje na to, nawet ograniczona do ponad 25 stacji lokalnego okna GWR, dominu-jąca w modelu regresyjnym zależność temperatura powietrza – wysokość bezwzględna (np. mapy 1.1, 2.2, 3.3). Niejednokrotnie efekt ten rozciąga się także na stacje regionu Bieszczadów (Komańcza, Baligród-Mchawa, Terka, Stuposiany – np. mapy 3.4, 3.9).

Zawyżenie modelowanych wielkości temperatury bywa także obser-wowane w rejonach zalewów Szczecińskiego i Wiślanego, prawdopodobnie

w następstwie silniejszego niż uwzględniony w modelu w tych regionach wpływu zbiorników wodnych w chłodnej porze roku (np. mapy 2.2, 3.11, 4.19, 4.19). Zawyżone wskazania modelu mogą powstawać regionalnie także w następstwie oddziaływania czynników cyrkulacyjnych lub pogodowych.

Przykładem takiej sytuacji jest rozkład temperatury 28 maja 2000 r. (mapa 5.1), wytworzony w typie cyrkulacji zachodniej cyklonalnej z adwekcją chłodnej masy polarno-morskiej. Przy ogólnym spadku temperatury z pół-nocnego zachodu na południowy wschód, model zawyżył wskazania dla sta-cji objętych adwekcją za strefą frontu chłodnego, co skutkowało wysokimi dodatnimi błędami CV na linii od ujścia Warty do Odry aż do Zatoki Gdań-skiej (stacje: Gorzów Wielkopolski, Krzyż Wielkopolski, Piła, Kościerzyna, Gdańsk–Rębiechowo). Czynniki pogodowe mogły też odgrywać rolę w dniu 12 listopada 2004 r. (mapa 5.22), kiedy na stacjach Niziny Śląskiej obserwo-wano tendencję do zawyżenia temperatury przez model w pasie od Otmu-chowa, przez Wrocław, po Tomaszów Górny, Polkowice Dolne i Ceber.

Model może wykazywać także regionalną tendencję do zaniżenia temperatury w stosunku do wielkości obserwowanych, co wyraża się stwier-dzeniem ujemnych błędów CV i relacji typu LL w grupie stacji sąsiadują-cych. Takie sytuacje występują dość często dla stacji tatrzańskich (Zakopane, Bukowina Tatrzańska, Dolina Pięciu Stawów, Hala Gąsienicowej i Kasprowy Wierch; np. mapy 3.9, 4.15), a także w Beskidzie Żywieckim, Śląskim i Ma-łym (stacje: Cieszyn, Bielsko-Biała, Wisła-Centrum, Istebna-Kubalonka, Nowy Dwór, Laliki; np. mapy 4.6, 4.20).

W dokumencie Atlas temperatury powietrza w Polsce: (Stron 74-79)

Powiązane dokumenty