• Nie Znaleziono Wyników

Index of /rozprawy2/10341

N/A
N/A
Protected

Academic year: 2021

Share "Index of /rozprawy2/10341"

Copied!
108
0
0

Pełen tekst

(1) . AKADEMIA GÓRNICZO-HUTNICZA im. STANISŁAWA STASZICA w KRAKOWIE. WYDZIAŁ INŻYNIERII MECHANICZNEJ I ROBOTYKI. ROZPRAWA DOKTORSKA. Bartłomiej Stępień ESTYMACJA NIEPEWNOŚCI WSKAŹNIKÓW ZAGROŻEŃ  HAŁASOWYCH ŚRODOWISKA           . PROMOTOR prof. dr hab. inż. Wojciech Batko. Kraków 2010.

(2) Promotorowi prof. dr hab. inż. Wojciechowi Batko za inspiracje i wsparcie merytoryczne, Rodzinie za mobilizację i wsparcie – SERDECZNIE DZIĘKUJĘ.

(3) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Spis treści 1.  Wstęp. 5 . 2.  Wskaźniki oceny zagrożeń hałasowych środowiska. 9 . 3.  Niepewność pomiarów. 12 . 3.1.  Źródła błędów w procesie pomiarowym . 13 . 3.2.  Zasady wyznaczania niepewności pomiarów . 15 . 3.2.1. . Wyznaczanie niepewności standardowej typu A . 18 . 3.2.2. . Wyznaczanie niepewności standardowej typu B . 20 . 4.  Estymacja wartości oczekiwanej i niepewności standardowej typu. A. długookresowych. wskaźników. oceny. zagrożeń. hałasowych środowiska. 25 . 4.1.  Podejście klasyczne . 25 . 4.2.  Podejście nieklasyczne . 26 . 5.  Nieklasyczne metody statystyczne. i. ich. zastosowanie do. estymacji parametrów rozkładu. 28 . 5.1.  Estymacja nieparametryczna – estymator jądrowy . 28 . 5.1.1. . Estymacja wartości oczekiwanej i odchylenia standardowego . 5.2.  Techniki ponownego losowania – metoda bootstrap  5.2.1. . 35 . 36  39 . Estymacja wartości oczekiwanej i błędu standardowego . 5.3.  Estymacja bayesowska . 41 . 5.3.1. . Metody numeryczne stosowane we wnioskowaniu bayesowskim . 45 . 5.3.2. . Estymacja wartości oczekiwanej i odchylenia standardowego . 49 . 6.  Algorytmy nieklasycznych metod statystycznych do estymacji wartości oczekiwanej i niepewności standardowej typu A długookresowych. wskaźników. oceny. zagrożeń. hałasowych. środowiska. 51 . 6.1.  Estymacja jądrowa . 52 . 3.

(4) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 6.2.  Metoda bootstrap . 53 . 6.3.  Estymacja bayesowska . 55 . 7.  Zastosowanie. w. warunkach. praktycznych. algorytmów. do. estymacji wartości oczekiwanej i niepewności standardowej typu A długookresowych wskaźników oceny zagrożeń hałasowych środowiska. 57 . 7.1.  System ciągłego monitoringu hałasu . 57 . 7.2.  Materiał badawczy . 61 . 7.3.  Wyniki estymacji . 64 . 8.  Podsumowanie i wnioski. 71 . Bibliografia. 76 . ZAŁĄCZNIK. 84 . 4.

(5) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 1. Wstęp Podstawowym przepisem europejskim odnoszącym się do problematyki ochrony środowiska przed hałasem jest Dyrektywa 2002/49/WE Parlamentu Europejskiego i Rady z dnia 25 czerwca 2002 roku w sprawie oceny i zarządzania poziomem hałasu w środowisku (Dz. U. WE L 189 z dnia 18 lipca 2002 roku). Przepisy dotyczące ochrony środowiska przed hałasem w Polsce zawarte są w ustawie z dnia 27 kwietnia 2001 r. Prawo ochrony środowiska (Dz. U. 2008 r., nr 25, poz. 150 z późn. zm.) oraz w licznych aktach wykonawczych do ww. ustawy. Dyrektywa 2002/49/WE (Dyrektywa, 2002), a także Prawo ochrony środowiska (Ustawa, 2001), których wytyczne poruszane są w pracach (Adamczyk i inni, 2004; Ciesielka i inni, 2005; Kompała, 2009; Kucharski, 2007; Popescu, 2007), dedykowane potrzebom realizacji długookresowej polityki ochrony. środowiska. przed. hałasem,. sformułowały. potrzebę. estymacji. długookresowych wskaźników oceny hałasu. Są one określone wartościami długookresowego średniego poziomu dźwięku A w porach dzienno-wieczoronocnych L DWN oraz nocnych L N wyrażone w decybelach (dB). Ich wartości są bazą do tworzenia map rozkładu hałasu na terenach podlegających ocenie klimatu akustycznego i związanego z nimi wyboru programu działań mającego na celu zapobieganie i ograniczanie szkodliwych skutków hałasu w środowisku. Z procesem wyliczeń ww. wskaźników związana jest konieczność walidacji otrzymanych rezultatów, wymagająca analizy budżetu niepewności oszacowań. ich. wartości. (Kucharski,. 2006;. PN-ISO. 1996-1:2006;. Rozporządzenie Ministra Środowiska z dnia 2 października 2007 r. w sprawie wymagań w zakresie prowadzenia pomiarów poziomów w środowisku substancji lub energii przez zarządzającego drogą, linią kolejową, linią tramwajową, lotniskiem, portem (Dz. U. 2007 r., nr 192, poz. 1392)). Budżet niepewności długookresowych wskaźników oceny zagrożeń hałasowych. 5.

(6) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. środowiska składa się z wielu składników (niepewności cząstkowych), do których należą: • niepewność wyników pomiarów, • niepewność przyrządu pomiarowego, • niepewność wzorcowania, • niepewność odległości punktu pomiarowego od źródła, • niepewność warunków meteorologicznych, • niepewność eksperymentatora. Niepewność wyników pomiarów w przedstawionym powyżej budżecie jest wyznaczana na drodze analizy statystycznej wyników uzyskanych podczas badań kontrolnych środowiska, czyli metodą typu A i nazwana będzie niepewnością standardową typu A. W niniejszej pracy wyrażenia niepewność wyników pomiarów i niepewność standardowa typu A będą używane jako synonimy. Natomiast pozostałe składniki wyznaczane są metodą typu B (Wszołek, 2006), czyli informacje o niepewności pozyskane są sposobami innymi niż statystyczne. Istotnym składnikiem rozważanego budżetu jest niepewność standardowa typu. A,. definiowana. odchyleniem. standardowym. średniej. z. wyników. kontrolnych. W podejściu klasycznym, w praktyce jej obliczeń korzysta się z reguł opisanych w ISO/IEC Guide 98. Bazuje on na klasycznych estymatorach wariancji i warunku możliwości przyporządkowania losowym wynikom badań kontrolnych rozkładu normalnego. Analizy danych akustycznych wskazują jednak, że zarówno dla danych rzeczywistych jak i syntetycznych, rozkład długookresowych wskaźników oceny zagrożeń hałasowych środowiska nie jest normalnym (Batko i inni, 2007a; Batko i inni, 2007b; Gałuszka, 2010), a także nie jest dobrze skorelowany z żadnym rozkładem teoretycznym znanym w literaturze (Wszołek i inni, 2006). W praktycznych zagadnieniach analizy hałasu środowiskowego wyniki badań kontrolnych stanowią jedną próbę, na podstawie której prowadzi się 6.

(7) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. wnioskowanie. W podejściu klasycznym, trudności z doborem modelu parametrycznego,. który. wiarygodnie. opisywałby. funkcję. gęstości. prawdopodobieństwa długookresowych wskaźników, doprowadziły do przyjęcia założenia, że badana próba posiada rozkład normalny. Jednak często w praktyce próba nie jest wystarczająco liczna by problem miał własności asymptotyczne. W związku z przedstawionymi problemami estymacji długookresowych wskaźników i ich niepewności standardowej typu A w niniejszej pracy podjęto próbę. wypracowania. metod. oceny. i. ograniczenia. błędów. estymacji. długookresowych wskaźników oceny zagrożeń hałasowych środowiska, a tym samym zwiększenia dokładności ich wyznaczania. Zadanie postawione w niniejszej pracy rozwiązano poprzez zastosowanie estymacji jądrowej funkcji gęstości prawdopodobieństwa, która na podstawie pomierzonej jednej próby, pozwala uzyskać nieparametryczny estymator funkcji gęstości. prawdopodobieństwa. wskaźników. dokuczliwości. hałasu.. Wykorzystano także technikę ponownego losowania bootstrap, polegającą na kombinacyjnym generowaniu wielu prób z jednego zbioru pomierzonych danych.. Sięgnięto. również. po. estymację. bayesowską. polegającą. na. zastosowaniu twierdzenia Bayesa w celu wyznaczenia rozkładu a posteriori na podstawie założonej struktury a priori i stosowanej dla rozpatrywanych modeli funkcji wiarygodności. Opracowane zostały algorytmy do estymacji punktowej wartości długookresowych wskaźników oceny hałasu i ich niepewności standardowej typu A. Przeprowadzono szczegółowe badania skonstruowanych algorytmów pod kątem ich stosowalności i efektywności w zadaniach probabilistycznej. analizy. hałasu. środowiskowego.. Badano. różnice. w wartościach długookresowych wskaźników i niepewności standardowej typu A estymowanych metodą klasyczną i z wykorzystaniem nieklasycznych metod statystycznych. Badania efektywności i użyteczności opracowanych algorytmów estymacji w. zagadnieniach. praktycznych. sprawdzono. na. wybranych. danych 7.

(8) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. rzeczywistych. Źródło danych akustycznych stanowiły bazy wyników ciągłego monitoringu hałasu zainstalowanego w Krakowie przy Al. Krasińskiego. Przeprowadzone. testy. pozwalają. wybrać. najbardziej. optymalną. z testowanych procedur punktowej estymacji długookresowych wskaźników oceny zagrożeń hałasowych środowiska i ich niepewności standardowej typu A. Analiza pokazuje również jak zmienia się błąd nieparametrycznej estymacji wartości estymowanych charakterystyk wraz ze zmianą liczności próby i złożoności rozkładu prawdopodobieństwa danych.. 8.

(9) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 2. Wskaźniki oceny zagrożeń hałasowych środowiska Przepisy europejskie (Dyrektywa, 2002) i krajowe (Ustawa, 2001) obligują do dokonania kompleksowej oceny akustycznego stanu środowiska oraz do przyjęcia stosownych działań na rzecz ograniczenia ponadnormatywnych akustycznych oddziaływań na środowisko. W tym celu niezbędne jest sporządzenie, przy użyciu wspólnych w odniesieniu do wszystkich państw członkowskich, metod i wskaźników oceny hałasu w środowisku, strategicznych map akustycznych oraz programów ochrony środowiska. Szczegółowe wymagania względem tworzenia programu ochrony środowiska przed hałasem znajdują się w Rozporządzeniu Ministra Środowiska z dnia 14 października 2002 r. w sprawie szczegółowych wymagań, jakim powinien odpowiadać program ochrony środowiska przed hałasem (Dz. U. 2002 r., nr 179, poz. 1498). W 2005 r. na mocy ustawy z dnia 18 maja 2005 roku o zmianie ustawy – Prawo ochrony środowiska oraz niektórych innych ustaw (Dz. U. 2005 r., nr 113, poz. 954) ustawodawca wprowadził nową instytucję, tzw. wskaźników hałasu.. Obecnie. stanowią. one. podstawę. zarówno. do. prowadzenia. długookresowej polityki w zakresie ochrony środowiska przed hałasem jak i ustalania oraz kontroli warunków emisji hałasu. Pierwsze z ww. wskaźników, służące do prowadzenia długookresowej polityki w zakresie ochrony środowiska przed hałasem, to długookresowy średni poziom dźwięku A L DWN oraz długookresowy nocny poziom dźwięku A L N . Długookresowe średnie poziomy dźwięku A L DWN oraz L N w dB są wyznaczane zgodnie z Rozporządzeniem Ministra Środowiska z dnia 7 listopada 2007 r. zmieniające rozporządzenie w sprawie ustalania wartości wskaźnika hałasu L DWN (Dz. U. 2007 r., nr 210, poz. 1535) na bazie wartości wskaźników dokuczliwości hałasu L DWN,i dla i = 1, 2, …, 365 ze wszystkich dni roku kalendarzowego w porze dnia-wieczoru-nocy:. (. ⎡ 1 0,1L 0,1(L + 5 ) 0,1(L +10 ) LDWN , i = 10 log ⎢ 12 × 10 D ,i + 4 × 10 W ,i + 8 × 10 N ,i ⎣ 24. )⎤⎥ , ⎦. (2.1). 9.

(10) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. gdzie: L D,i – poziom dzienny dźwięku A, wyznaczony z ekspozycji dziennych, tj. z przedziału czasu od godz. 6:00 do godz. 18:00, dB, L W,i – poziom wieczorowy dźwięku A, wyznaczony dla ekspozycji hałasu z przedziału czasu od godz. 18:00 do godz. 22:00, dB, L N,i – poziom nocny dźwięku A, wyznaczony z okresów nocnych, tj. z przedziału czasu od godz. 22:00 do godz. 6:00, dB, oraz w porze nocy L N, i dla i = 1, 2, …, 365 określonej relacją:. ⎡1 K )⎤ 0,1(L LN , i = 10 log⎢ ∑10 Aeq ,T i ⎥ , ⎣ K i =1 ⎦. (2.2). gdzie: K – liczba próbek, (L Aeq,T ) i – poziom równoważny dźwięku A dla i-tej próbki, dB. Oszacowania długookresowych wskaźników zagrożeń akustycznych środowiska L DWN oraz L N będących średnią ze wszystkich dni roku kalendarzowego:. ⎡ 1 365 0,1LDWN , i ⎤ LDWN = 10 log⎢ ∑10 ⎥, ⎣ 365 i =1 ⎦. (2.3). ⎡ 1 365 0,1LN , i ⎤ LN = 10 log ⎢ ∑10 ⎥⎦ , ⎣ 365 i =1. (2.4). tworzą zbiór dwóch wskaźników: L Aeq.LT = {L DWN , L N }.. (2.5). Oznaczenie to zostało wprowadzone w niniejszej pracy w celu ułatwienia zapisu zależności matematycznych odnoszących się jednocześnie do jednego i drugiego długookresowego wskaźnika. Wskaźniki mające zastosowanie do ustalania i kontroli warunków korzystania ze środowiska odniesione do jednej doby to równoważny poziom dźwięku A dla pory dnia L Aeq,D i równoważny poziom dźwięku A dla pory nocy L Aeq,N . Niniejsza praca została poświęcona wyznaczaniu wartości oczekiwanej i niepewności. długookresowych. wskaźników. hałasu. przy. wykorzystaniu. 10.

(11) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. nieklasycznych. metod. statystycznych,. zatem. istnienie. wskaźników. odniesionych tylko do jednej doby zostało tylko zasygnalizowane. Przedstawione powyżej wskaźniki hałasu (długookresowe oraz odniesione tylko do jednej doby) zostały wykorzystane dla ustanowienia standardów jakości środowiska, co jest przedmiotem Rozporządzenia Ministra Środowiska z dnia 14 czerwca 2007 r. w sprawie dopuszczalnych poziomów hałasu w środowisku (Dz. U. 2007 r., nr 120, poz. 826).. 11.

(12) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 3. Niepewność pomiarów Z pojęciem pomiarów nierozerwalnie związane jest pojęcie błędu pomiaru. Charakteryzuje on niezgodność wartości uzyskanej w wyniku pomiaru z wartością wielkości mierzonej. Zgodnie z podstawowym aksjomatem metrologii – nie ma pomiarów bezbłędnych, a zatem wykonując pomiary trzeba mieć świadomość, że ich wyniki będą obarczone błędami. Błędy te są przyczyną niepewności związanej z przebiegiem procesu pomiarowego i jego rezultatami. Błąd pomiaru zawiera na ogół wiele składowych zarówno o charakterze zdeterminowanym jak i przypadkowym. Błąd pomiaru można zatem traktować jako wielkość losową. Losowość błędu pomiaru sprawia, że wynik, choćby najbardziej skrupulatnie wyznaczony, nie daje pełnej i jednoznacznej informacji o wartości wielkości mierzonej. Biorąc pod uwagę właściwości ciągłej zmiennej losowej można wręcz stwierdzić, że wartość uzyskana po uwzględnieniu wszelkich. możliwych. do. obliczenia. poprawek. (wynik. poprawiony. wg. ISO Guide 99) różni się od „szukanej” wartości prawdziwej. Stąd przytoczone wyżej brzmienie tzw. podstawowego postulatu (aksjomatu) metrologii. Wynik pomiaru jest tylko przybliżeniem (estymatą) wartości wielkości mierzonej i dlatego każdemu wynikowi pomiaru towarzyszy niepewność wynikająca z jego losowości. Nie należy go podawać za pomocą jednej liczby, ale tak jak ciągłą zmienną losową, w postaci przedziału nazywanego przedziałem. ufności.. Wówczas. z. określonym. prawdopodobieństwem,. przypisanym temu przedziałowi, można przyjąć, że wartość wielkości mierzonej jest w nim zawarta, pod warunkiem poprawnego wykonania pomiaru i analizy dokładności. Prawdopodobieństwo to przyjmuje się najczęściej na poziomie P ≥ 0,95. Praktycznie przedział ten, nazwany również przedziałem niepewności, przedstawia się w postaci (y – U(y), y + U(y)), gdzie y jest estymatą wartości wielkości mierzonej uzyskaną podczas pomiaru, a U(y) jest tzw. niepewnością rozszerzoną. W związku z dokumentami: ISO/IEC Guide 98, ISO Guide 99, PN-EN. ISO. 10012:2004,. pojęcie. niepewność. pomiaru. jest. obecnie. w powszechnym użyciu i skutecznie wyparło błąd graniczny pomiaru stosowany 12.

(13) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. wcześniej do określenia przedziału niepewności wyniku pomiaru. Pojęcie to może być używane w dwóch znaczeniach: do wyrażania ogólnych wątpliwości, jakie wiążą się z wynikiem pomiaru oraz jako parametr określający granice zmienności wyników pomiarów. W tym drugim (podstawowym) znaczeniu niepewność pomiaru charakteryzuje dokładność określenia wartości wielkości mierzonej i powinna być ustalona dla każdego pomiaru.. 3.1. Źródła błędów w procesie pomiarowym Niepewność pomiaru jest efektem błędów o charakterze losowym, jakie występują w procesie pomiarowym. Ogólnie błędy pomiarów można podzielić na (Arendarski, 2006; Jakubiec i inni, 1996): • błędy przypadkowe, • błędy systematyczne, • błędy nadmierne. Błąd przypadkowy zmienia się w sposób nieprzewidziany, zarówno co do wartości bezwzględnej, jak i co do znaku, przy wykonywaniu dużej liczby pomiarów tej samej wartości pewnej wielkości w warunkach praktycznie niezmiennych (w warunkach powtarzalności). Błąd systematyczny przy wielu pomiarach tej samej wartości pewnej wielkości, wykonywanych w tych samych warunkach, pozostaje stały zarówno co do wartości bezwzględnej, jak i co do znaku lub zmienia się wg określonego prawa wraz ze zmianą warunków. Błąd nadmierny wynika z nieprawidłowego wykonania pomiaru, np.: • z fałszywie odczytanego wskazania, • z użycia uszkodzonego przyrządu, • z niewłaściwego zastosowania przyrządu. Podstawowe źródła błędów występujących w procesie pomiarowym zilustrowano na rysunku 3.1 w postaci diagramu Ishikawy (Szczepańska, 1999).. 13.

(14) Rysunek 3.1. Struktura źródeł błędów w procesie pomiarowym (Arendarski, 2006). Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 14.

(15) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Wyróżniono sześć podstawowych kategorii błędów związanych z różnymi elementami procesu pomiarowego: • nieścisłości w definicji wielkości mierzonej, • błędy instrumentalne – związane ze sprzętem pomiarowym, • błędy obserwacji, • błędy metody, • błędy środowiskowe – związane ze stanem warunków otoczenia w czasie wykonywania pomiarów, • błędy obliczeniowe.. 3.2. Zasady wyznaczania niepewności pomiarów Na wynik pomiaru, zgodnie z diagramem przedstawionym na rysunku 3.1, wpływa wiele czynników o charakterze przypadkowym. Można zatem uznać, że rozrzut wyników jest rezultatem złożenia rozkładów wielu składowych. Wynik pomiaru jest wypadkową zmienną losową. Złożenie wszystkich istotnych zmiennych. składowych. daje. w. rezultacie. zmienną,. której. odchylenie. standardowe jest wskaźnikiem niepewności pomiaru. Można zatem przyjąć, że odchylenia. standardowe. poszczególnych. składowych. charakteryzują. niepewności cząstkowe. Aby przy analizie niepewności pomiaru nie pominąć żadnej. istotnej. składowej,. trzeba. zbudować. możliwie. wierny. model. matematyczny pomiaru, który wszystkie te składowe będzie obejmował. Poprawne. sformułowanie. analizowanie. źródeł. modelu. niepewności. matematycznego i. w. dalszej. znakomicie. kolejności. ułatwia. oszacowanie. niepewności wykonywanych pomiarów (Arendarski, 2006). Wielkość mierzona Y zależy od wielu wielkości wejściowych:. Y = f ( X 1, X 2 , K, X m ) .. (3.1). Zbiór wielkości wejściowych można podzielić na (ISO/IEC Guide 98): • wielkości, których wartości i niepewności są bezpośrednio określone poprzez aktualny. pomiar,. można. otrzymać. np.. z. pojedynczej. obserwacji,. powtórzonych obserwacji, lub oceny opartej na doświadczeniu,. 15.

(16) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. • wielkości, których wartości i niepewności zostały wniesione do pomiaru z zewnętrznych źródeł, takich jak: wielkości związane z kalibrowanymi wzorcami, certyfikowanymi materiałami odniesienia i danymi odniesienia zaczerpniętymi z podręczników. Wynik poprawiony pomiaru tej wielkości jest funkcją wielu argumentów: Y pop = f (X pop 1, X pop 2 , K, X pop m ) ,. (3.2). z których każdy jest obarczony niepewnością standardową u(X i ), gdzie i = 1, 2, …, m. Niepewność u(X i ) jest wypadkową niepewności wyniku surowego i niepewności wyznaczenia poprawki. Niepewność standardową złożoną u c (Y) oblicza się korzystając z prawa propagacji niepewności, którego formalizacja matematyczna przyjmuje postać (Arendarski, 2006; ISO/IEC Guide 98; Szydłowski, 2001):. ⎛ ∂f u (Y ) ≈ ∑ ⎜⎜ i =1 ⎝ ∂X i 2 c. m. 2. m −1 m ⎞ 2 ⎛ ∂f ⎟⎟ u ( X i ) + 2∑ ∑ ⎜⎜ i =1 j =i +1⎝ ∂X i ⎠. ⎞⎛ ∂f ⎟⎟⎜ ⎜ ⎠⎝ ∂X j. ⎞ ⎟ u ( X i ) u (X j ) r (X i , X j ) , (3.3) ⎟ ⎠. gdzie: u(X i ) – niepewności standardowe wielkości składowych (niepewności standardowe cząstkowe), r(X i , X j ) – współczynnik korelacji zmiennych X i i X j . Jeżeli poszczególne argumenty we wzorze (3.2) są niezależne, to składniki z korelacjami będą zerowe, a wzór na niepewność standardową złożoną u c (Y) przyjmuje postać (Arendarski, 2006; ISO/IEC Guide 98; Szydłowski, 2001): ⎛ ∂f u c (Y ) = ∑ ⎜⎜ i =1 ⎝ ∂X i m. 2. ⎞ 2 ⎟⎟ u ( X i ) . ⎠. (3.4). Niepewność podawana z wynikiem pomiaru jest wielokrotnością niepewności standardowej złożonej i nosi nazwę niepewności rozszerzonej. Wynik końcowy zrealizowanego pomiaru pośredniego wielkości Y zapisujemy w formie: 16.

(17) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. y p = y pop ± U (Y ) = y pop ± k ⋅ u c (Y ) ,. (3.5). gdzie: k – współczynnik rozszerzenia. Współczynnik rozszerzenia k, w zależności od wskaźnika ufności przyporządkowanego przedziałowi niepewności, przyjmuje najczęściej wartości. k = [2, 3] . Wartości wielkości X i są realizacjami zmiennych losowych, zatem niepewności standardowe można wyznaczyć na podstawie serii obserwacji, czyli metodą statystyczną. W ISO/IEC Guide 98 jest ona nazwana metodą typu A. Niepewność standardowa typu A jest obliczana z funkcji gęstości prawdopodobieństwa. otrzymanej. z. obserwowanego. rozkładu. częstości.. O możliwości wyznaczenia niepewności standardowej metodą statystyczną dla każdego pomiaru mówi ISO/IEC Guide 98: „Jeżeli laboratorium pomiarowe ma dość czasu i środków, może prowadzić wyczerpujące badania statystyczne wszystkich możliwych przyczyn niepewności, stosując np. wiele różnych konstrukcji i rodzajów przyrządów pomiarowych, stosując różne metody pomiarowe, różne ich realizacje i różne aproksymacje ich teoretycznych możliwości”. Ponieważ takie badania są często nieuzasadnione ekonomicznie, wiele składowych niepewności trzeba wyznaczyć innymi, bardziej praktycznymi sposobami, określonymi ogólnie w ISO/IEC Guide 98 jako metoda typu B. Niepewność standardowa typu B jest obliczana na podstawie wiedzy a priori, czyli założonej funkcji gęstości prawdopodobieństwa przez eksperymentatora. Celem klasyfikacji metod obliczania na typ A i B jest wskazanie dwóch różnych sposobów obliczania składowych niepewności i ułatwienie rozważań, natomiast nie jest nim wskazywanie różnic w naturze składowych obliczanych różnymi. metodami.. prawdopodobieństwa. Oba i. typy. obliczania. korzystają. są z. oparte uznanych. na. rozkładach interpretacji. prawdopodobieństwa. Składowe niepewności obliczone zarówno jedną jak 17.

(18) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. i drugą. metodą. są. określane. w. kategoriach. wariancji. lub. odchyleń. standardowych.. 3.2.1. Wyznaczanie niepewności standardowej typu A Najczęściej przyjmuje się, że rozkład błędów przypadkowych pomiaru jest rozkładem normalnym N(0, σ) (Arendarski, 2006; Kotulski i inni, 2004). Rozkład ten wyraża znaną: • właściwość symetrii błędów przypadkowych – błędy przypadkowe o takich samych wartościach bezwzględnych i różnych znakach są spotykane jednakowo często, • właściwość koncentracji – błędy przypadkowe małe co do wartości bezwzględnej są spotykane częściej niż duże. Wzór na gęstość prawdopodobieństwa rozkładu błędów przypadkowych przyjmuje postać (Arendarski, 2006): f (Δp ) =. ⎛ Δ2p exp⎜ − ⎜ 2σ 2 2π σ ⎝ 1. ⎞ ⎟. ⎟ ⎠. (3.6). Krzywą obrazującą przebieg funkcji gęstości rozkładu błędów opisaną zależnością (3.6) przedstawiono na rysunku 3.2. Pole pod krzywą rozkładu obrazuje prawdopodobieństwo, zatem całka z funkcji f(Δ p ) liczona od minus do plus nieskończoności jest równa jedności. Aby określić prawdopodobieństwo, że błąd zawiera się w przedziale (- ε 1 , ε 1 ), należy obliczyć całkę z funkcji gęstości w tym przedziale (Arendarski, 2006; Deutsch, 1969; Plucińska i inni, 2000): P (− ε 1 ≤ Δp ≤ ε 1 ) =. ε1. ∫ f (Δ ) dΔ p. p. .. (3.7). −ε 1. Na. rysunku. 3.2. przedstawiono. trzy. najczęściej. wykorzystywane. przedziały, symetryczne względem wartości oczekiwanej, dla których te prawdopodobieństwa wynoszą (Magiera, 2002): 18.

(19) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. • P(- σ ≤ Δ p ≤ σ) = 0,6826, • P(- 2σ ≤ Δ p ≤ 2σ) = 0,9544, • P(- 3σ ≤ Δ p ≤ 3σ) = 0,9973.. Rysunek 3.2. Krzywa rozkładu błędów przypadkowych. Prawdopodobieństwo. wystąpienia. błędu. przypadkowego. poza. przedziałem trzysigmowym wynosi 0,0027 i praktycznie przyjmuje się, że jest znikomo małe. Stąd reguła trzech sigm, według której wartości błędów przypadkowych zawierają się w przedziale (- 3σ, 3σ). Na podstawie zależności na surowy wynik pomiaru (Arendarski, 2006): ) (3.8) X s = x p + Δx s + Δ p X , gdzie: x p – wartość prawdziwa mierzonej wielkości, ) Δx s – wartość systematycznego błędu pomiaru, Δ p X – błąd przypadkowy pomiaru, można stwierdzić, że rozkład wyników obserwacji różni się od rozkładu błędów przypadkowych jedynie wartością oczekiwaną – odchylenie standardowe jest ) takie samo, ponieważ x p i Δx s mają stałe wartości.. 19.

(20) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Odchylenie. standardowe. σ. rozkładu. obserwacji. jest. parametrem. teoretycznym, którego wiarygodną wartość można oszacować na podstawie odpowiednio dużej (n > 30) serii pomiarów tej samej wartości wielkości mierzonej. Odchylenie standardowe z próby oblicza się ze wzoru (Hellwig, 1998; Zeliaś, 2000): n. s (x i ) =. ∑ (x i =1. − x). 2. i. ,. n −1. (3.9). gdzie: x i – wyniki kolejnych obserwacji w serii,. x – średnia arytmetyczna obserwacji, n – liczba obserwacji w serii, i charakteryzuje zmienność obserwowanych wartości x i wokół średniej x . W większości przypadków, najlepszym osiągalnym estymatorem wartości oczekiwanej μ X zmiennej X, która zmienia się losowo jest średnia arytmetyczna (Deutsch, 1969; Lehmann, 1991; Sobczyk, 2007): x=. 1 n ∑ xi . n i =1. (3.10). Natomiast odchylenie standardowe średniej s(x ) jest identyfikowane z niepewnością standardową u(x) i wyznaczane na podstawie zależności (Arendarski, 2006; ISO/IEC Guide 98; Szydłowski, 2001): n. u (x ) = s (x ) =. s (x i ) n. =. ∑ (x i =1. − x). 2. i. n (n − 1). ,. (3.11). i określa liczbowo jak dobrze x estymuje wartość oczekiwaną μ X zmiennej X.. 3.2.2. Wyznaczanie niepewności standardowej typu B Naturalną metodą wyznaczania niepewności standardowych jest metoda statystyczna, czyli metoda typu A. Jednak badania statystyczne wszystkich niepewności cząstkowych mogłyby być bardzo uciążliwe i kosztowne. Dlatego w ISO/IEC Guide 98 jako równorzędną przewidziano metodę typu B. Nazwą tą 20.

(21) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. objęte są wszelkie inne niż statystyczne sposoby pozyskania informacji o niepewności. Jeżeli wariancja u2(X i ) wielkości wejściowej we wzorze (3.4) nie może być wyznaczona na podstawie serii pomiarów, to niepewność standardową wyznacza się na podstawie informacji o możliwym zakresie zmienności tej wielkości. Zestaw tych informacji może obejmować (ISO/IEC Guide 98): • poprzednie dane pomiarowe, • posiadane doświadczenie wraz z ogólną znajomością zjawisk i właściwości odpowiednich materiałów odniesienia i przyrządów, • specyfikacje wytwórców, • dane uzyskane ze świadectw wzorcowania i z innych certyfikatów, • niepewności przypisane danym odniesienia zaczerpniętym z podręczników. Jeżeli w dostępnych dokumentach, podręcznikach lub innym tego rodzaju źródle jest określony zakres zmienności analizowanej wielkości, np. podana jest niepewność rozszerzona U(x), to niepewność standardową u(x) oblicza się dzieląc tę pierwszą wartość przez odpowiedni współczynnik rozszerzenia k. Jeżeli nie jest podane k ani poziom ufności stosujemy regułę trzech sigm, przyjmując k = 3. Trzeba jednak podkreślić, że przy niepewności rozszerzonej zawsze powinien być podany odpowiadający jej wskaźnik ufności lub współczynnik. rozszerzenia. k.. W. powyższych. przypadkach. a. priori. przyporządkowano wartościom analizowanych wielkości rozkłady normalne (Arendarski, 2006; ISO/IEC Guide 98). Przyporządkowanie a priori rozkładu normalnego w wielu przypadkach jest uzasadnione. Jeżeli jednak podane są granice przedziału, w którym zawiera się wartość wielkości i nie ma podstaw do założenia, że istnieje większe prawdopodobieństwo wystąpienia wartości w części środkowej niż na krańcach tego przedziału, to w takich przypadkach, zamiast rozkładu normalnego stosuje się raczej rozkład równomierny (jednostajny, prostokątny) o funkcji gęstości prawdopodobieństwa przedstawionej na rysunku 3.3 i opisanej zależnością (Kotulski i inni, 2004; Snopkowski, 2007): 21.

(22) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. ⎧0 ⎪ f (x ) = ⎨ 1 ⎪⎩ b − a. dla. x ∉ [a, b]. dla. x ∈ [a, b]. .. (3.12). Dla równomiernego rozkładu prawdopodobieństwa: • P(μ - σ ≤ x ≤ μ + σ) ≈ 0,58, • P(a ≤ x ≤ b) = 1.. Rysunek 3.3. Rozkład jednostajny. Prawdopodobieństwo wystąpienia błędów w pobliżu granic a i b jest takie samo jak w pobliżu wartości oczekiwanej μ. Funkcja gęstości prawdopodobieństwa ma wartość stałą f(x) = 1/(b - a). Zależność między rozstępem R = b - a i wariancją dla tego rozkładu ma postać (Arendarski, 2006):. σ2 =. R2 . 12. (3.13). Wobec tego niepewność standardową przy szerokości połówkowej zakresu zmienności (niepewności rozszerzonej) U(x) = R/2 oblicza się ze wzoru (Arendarski, 2006):. u (x ) =. U (x ) 3. .. (3.14). 22.

(23) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Gdyby. istniały. wątpliwości,. co. do. słuszności. przyjęcia. rozkładu. równomiernego, w przypadku gdy prawdopodobieństwo wystąpienia błędów w pobliżu granic jest mniejsze niż w pobliżu środka pola błędów, do rozważań można przyjąć rozkład pośredni między normalnym i równomiernym. Takim rozkładem jest rozkład trójkątny (Simpsona) przedstawiony na rysunku 3.4 i gęstości prawdopodobieństwa opisanej zależnością (Arendarski, 2006; Snopkowski, 2007): ⎧ 2(x − a ) ⎪ (b − a )(μ − a ) ⎪ f (x ) = ⎨ ⎪ 2(b − x ) ⎪⎩ (b − a )(b − μ ). dla. a≤x≤μ. . dla. (3.15). μ≤x≤b. Dla tego rozkładu:. σ=. R 2 6. ,. (3.16). natomiast odpowiednie prawdopodobieństwa przyjmują wartości: • P(μ - σ ≤ x ≤ μ + σ) ≈ 0,65, • P(μ - 2σ ≤ x ≤ μ + 2σ) ≈ 0,97, • P(a ≤ x ≤ b) = 1.. Rysunek 3.4. Rozkład trójkątny (Simpsona). Zależność między wariancją i rozstępem określa wzór:. 23.

(24) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. R2 σ = . 24 2. (3.17). Jeżeli niepewność rozszerzona U(x) = R/2, wówczas niepewność standardową określa zależność:. u (x ) =. U (x ) 6. .. (3.18). Są przypadki, w których zastosowanie może znaleźć również rozkład arcsin o funkcji gęstości prawdopodobieństwa (Arendarski, 2006; Magiera, 2005):. f (x ) =. 1. π a − x2 2. dla − a < x < a ,. (3.19). której przebieg przedstawiono na rysunku 3.5.. Rysunek 3.5. Funkcja gęstości prawdopodobieństwa rozkładu arcsin. Wariancję zmiennej o takim rozkładzie wyraża zależność:. σ2 =. R2 . 8. (3.20). Po podstawieniu U(x) = R/2, niepewność standardową w tym przypadku określa zależność:. u (x ) =. U (x ) 2. .. (3.21). 24.

(25) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 4. Estymacja wartości oczekiwanej i niepewności standardowej typu A długookresowych wskaźników oceny zagrożeń hałasowych środowiska 4.1. Podejście klasyczne Oszacowanie wartości długookresowych wskaźników oceny zagrożeń hałasowych środowiska opisanych zależnościami (2.3) i (2.4) wymaga dostępu do wyników całorocznego monitoringu poziomu dźwięku. W praktyce, w obecnych warunkach wymóg ten nie jest możliwy do spełnienia w szerszym zakresie. Dlatego też oceny tych wskaźników są dokonywane na bazie ograniczonej próby wyników monitoringu akustycznego wynikającego z przyjętego harmonogramu wyrywkowych badań kontrolnych środowiska. Liczność tej próby n jest bardzo mała i wynosi od kilku do kilkunastu elementów. W podejściu klasycznym, którego schemat został przedstawiony na rysunku 4.1 zakłada się, że próba uzyskana na podstawie wyrywkowych badań kontrolnych środowiska posiada rozkład normalny i przy wyznaczaniu niepewności standardowej typu A długookresowych wskaźników oceny zagrożeń hałasowych środowiska korzysta się z zaleceń ISO/IEC Guide 98, które zostały przedstawione w rozdziale 3. Po uwzględnieniu oznaczenia (2.5) zależności (2.3) i (2.4) określające wartość oczekiwaną długookresowych wskaźników oceny zagrożeń hałasowych środowiska, szacowaną na podstawie ograniczonej próby losowej, przybiera postać:. ⎡1 n ⎤ 0,1L LAeq.LT = 10 log⎢ ∑ 10 Aeq .LT , i ⎥ , ⎣ n i =1 ⎦. (4.1). gdzie: L Aeq.LT,i – poziom wskaźnika dla i-tej próby, dB, n – liczność próby,. 25.

(26) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. natomiast wzór (3.11) na niepewność standardową typu A długookresowych wskaźników oceny zagrożeń hałasowych środowiska można zapisać jako:. ∑ (L n. (. ). s L Aeq .LT =. i =1. Aeq .LT ,i. − L Aeq .LT. n (n − 1). ). 2. .. (4.2). Rysunek 4.1. Algorytm estymacji wartości oczekiwanej i niepewności typu A długookresowych wskaźników hałasu metodą klasyczną. 4.2. Podejście nieklasyczne Estymacja punktowa zmiennej losowej warunkowana jest znajomością rozkładu estymatora θˆ parametru θ lub wykorzystaniem w analizie wielu prób, na podstawie których, poprzez estymaty parametru θ, aproksymować można rozkład estymatora. θˆ . Ocena długookresowych wskaźników zagrożeń. hałasowych środowiska oparta jest tylko na analizie jednej mało licznej próby, czyli wynikach uzyskanych na podstawie wyrywkowych badań kontrolnych środowiska. Zalecenia ISO/IEC Guide 98 przedstawione w rozdziale 3 zakładają, że badana próba pochodzi z rozkładu normalnego. W rzeczywistości takie. założenie. jest. trudne. do. przyjęcia,. a. rozkład. gęstości 26.

(27) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. prawdopodobieństwa występowania długookresowych wskaźników oceny zagrożeń hałasowych środowiska f(L Aeq.LT ) jest nieznany (Wszołek i inni, 2006; Batko i inni, 2007a), więc nie można bezkrytycznie stosować zaleceń w nim zawartych. W sytuacji, gdzie wnioski wyciąga się na podstawie tylko jednej ograniczonej próby o nieznanym rozkładzie prawdopodobieństwa istnieje potrzeba poszukiwania metod pozwalających na dokładniejsze oszacowanie wartości oczekiwanej i niepewności standardowej typu A długookresowych wskaźników oceny hałasu. Dokładniejsze oszacowanie można uzyskać stosując metody statystyki nieklasycznej, wykorzystując estymację jądrową funkcji gęstości prawdopodobieństwa, technikę ponownego losowania bootstrap oraz. estymację. bayesowską.. Przedstawione. metody. były. wcześniej. wykorzystywane w akustyce jedynie w badaniach pilotażowych prowadzonych w zespole profesora Batko, których wyniki przedstawione są w licznych pracach (Batko i inni, 2008a; Batko i inni, 2008b; Batko i inni, 2009; Batko i inni, 2010a; Batko i inni, 2010b; Batko i inni, APPA; Batko i inni, AA). Zastosowanie ich do zagadnień analizy długookresowych wskaźników oceny zagrożeń hałasowych środowiska w sposób zaprezentowany w pracy jest pierwszym w badanej dziedzinie.. 27.

(28) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 5. Nieklasyczne metody statystyczne i ich zastosowanie do estymacji parametrów rozkładu 5.1. Estymacja nieparametryczna – estymator jądrowy Jedną. z. możliwości. jednoznacznego. określenia. rozkładu. prawdopodobieństwa F zmiennej losowej X jest podanie funkcji gęstości prawdopodobieństwa f(x), która jest pochodną dystrybuanty F(x) tego rozkładu. W badaniach empirycznych bardzo często nie znamy postaci rozkładu interesujących nas zmiennych, a informacja ta jest niezbędna do dokonywania wyboru. właściwych. metod. w. celu. dalszej. analizy. statystycznej.. Do. zweryfikowania hipotezy o rozkładzie badanej zmiennej możemy zastosować odpowiednie testy, ale najpierw musimy mieć podstawy do sformułowania takiej hipotezy. Nie zawsze wystarczą jedynie przesłanki z innych analogicznych badań, o ile takie były w ogóle prowadzone. Dlatego też nieparametryczna estymacja. funkcji. gęstości. prawdopodobieństwa. jest. bardzo. ważnym. zagadnieniem w analizach statystycznych, tym bardziej, że pozwala ona również wyznaczyć oszacowanie dystrybuanty oraz prawdopodobieństwa zdarzeń, polegających na osiąganiu przez zmienną losową wartości należących do określonych przedziałów. Obecnie podstawową metodą estymacji nieparametrycznej staje się stosowanie estymatorów jądrowych. Koncepcja ich konstrukcji jest naturalna, interpretacje przejrzyste, a postać dogodna do matematycznej analizy. Zostały one zaproponowane na przełomie lat pięćdziesiątych i sześćdziesiątych XX wieku niezależnie przez Rosenblatta i Parzena, ale do lat osiemdziesiątych mogły być przedmiotem zainteresowań badawczych jedynie wąskiej grupy specjalistów.. Powszechne. badania. i. przede. wszystkim. zastosowania. estymatorów jądrowych są bowiem niemożliwe bez użycia komputerów o względnie dużej mocy obliczeniowej i możliwości dogodnego przedstawienia wyników na ekranie monitora. Rozważana będzie jednowymiarowa zmienna losowa X. Rozkład tej zmiennej ma funkcję gęstości prawdopodobieństwa f(x). Jej estymator będzie 28.

(29) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. wyznaczany na podstawie n-elementowej próby losowej x = (x 1 , x 2 , …, x n ), w której realizacje są interpretowane jako dane uzyskane doświadczalnie, w trakcie niezależnych eksperymentów wartości zmiennej losowej X. Nieparametryczny. jądrowy. estymator. funkcji. gęstości. prawdopodobieństwa f(x) przedstawiony na rysunku 5.1 ma postać (Rosenblatt, 1956; Parzen, 1962; Kulczycki, 2005; Koronacki i inni, 2005):. 1 n ⎛ x − xi ⎞ fˆ(x ) = ⎟, ∑K⎜ n ⋅ h i =1 ⎝ h ⎠. (5.1). gdzie: K(•) – funkcja jądra (jądro) estymatora, h – parametr szerokości pasma (parametr wygładzania), n – liczność próby.. Rysunek 5.1. Estymator jądrowy. 29.

(30) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Borelowska funkcja K(•) musi spełniać warunek (Domański i inni, 1998; Efromovich, 1999; Kulczycki, 2005): +∞. ∫ K (x ) dx = 1 .. (5.2). −∞. Ponadto zakłada się, iż funkcja K(•) jest symetryczna względem zera (Silverman, 1986), czyli:. K (x ) = K (− x ) ,. (5.3). i ma w tym punkcie (słabe) maksimum globalne:. K (0) ≥ K (x ) .. (5.4). Zauważmy, że ze wzorów (5.1) i (5.2) wynika następujący warunek: +∞. ∫ fˆ(x ) dx = 1.. (5.5). −∞. Okazuje się, że estymator jądrowy jest mało wrażliwy na postać funkcji K(•). Dzięki temu istnieje możliwość wyboru postaci jądra, aby spełnione były wymagania konkretnego zastosowania. Na przykład, jeżeli konieczne jest aby funkcja fˆ(x ) miała pochodne dowolnego rzędu – można przyjąć jądro normalne. Natomiast jeśli konieczne jest ograniczenie zbioru, na którym estymator przyjmuje wartości dodatnie – proponowane jest jądro Epanecznikowa (Kulczycki, 2005). Podstawowy, powszechnie stosowany miernik jakości estymatorów stanowi kryterium błędu średniokwadratowego. W przypadku rzeczywistego parametru θ i jego estymatora θˆ wartością tego kryterium, oznaczonego poniżej przez MSE (Mean Square Error) jest wartość oczekiwana kwadratu błędu estymacji, co zapisuje się także jako (Silverman, 1986; Kulczycki, 2005; Magiera, 2002):. ((. MSE = E θˆ − θ. ) ). 2. (5.6). Równoważną, dogodną do interpretacji postać powyższego wzoru stanowi zależność:. [() ]. MSE = E θˆ − θ. 2. (). + V θˆ .. (5.7). 30.

(31) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Wartość błędu średniokwadratowego MSE jest więc sumą kwadratu obciążenia estymatora θˆ i jego wariancji. Pierwszy składnik wskazuje zatem jak odległy od prawdziwej. wartości. jest. „środek”. uzyskiwanych. w. praktyce. wartości. estymatora, natomiast drugi składnik wskazuje stopień ich „rozrzutu” względem owego „środka”. W przypadku gdy jest rozważana jakość estymacji funkcji gęstości prawdopodobieństwa f(x), kryterium błędu średniokwadratowego (5.6) może być stosowane przy ustalonej wartości argumentu x, czyli:. [. ]. 2 MSE x = E ⎛⎜ fˆ(x ) − f (x ) ⎞⎟ , ⎝ ⎠. (5.8). lub równoważnie:. [( ). ]. ( ). 2 MSE x = E fˆ(x ) − f (x ) + V fˆ(x ) .. (5.9). Globalny wskaźnik jakości estymacji owej gęstości otrzymuje się w wyniku scałkowania powyższych wielkości. Przyjmuje on wtedy formę kryterium scałkowanego błędu średniokwadratowego MISE (Mean Integrated Square Error):. ∫ E ⎛⎜⎝ [fˆ(x ) − f (x )]. +∞. MISE =. −∞. 2. ⎞⎟ dx , ⎠. (5.10). ( ). (5.11). lub równoważnie:. ∫ ⎡⎢⎣[E (fˆ(x )) − f (x )]. +∞. MISE =. −∞. 2. + V fˆ(x ) ⎤ dx . ⎥⎦. Wzór (5.11) stanowi dogodny aparat matematyczny do oceny dokładności estymacji funkcji gęstości prawdopodobieństwa f(x). Wartość scałkowanego błędu średniokwadratowego MISE jest (podobnie jak poprzednio) sumą dwóch składników wynikłych ze scałkowania kwadratu obciążenia estymatora fˆ(x ) i jego wariancji. Z teoretycznego punktu widzenia naturalne jest wymaganie minimalizacji wartości scałkowanego błędu średniokwadratowego (5.11). Można tego dokonać poprzez odpowiedni wybór jądra (optymalnego) K(•) oraz szerokości (optymalnej) pasma h. Warunek ten spełniony jest przez jądro Epanecznikowa (Kulczycki, 2005): 31.

(32) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. (. ⎧3 2 ⎪ 1− x K (x ) = ⎨ 4 ⎪⎩0. ). dla. x ∈ [− 1, 1]. dla. x ∈ (− ∞, − 1) ∪ (1, ∞ ). .. (5.12). Do podstawowych typów jąder zaliczamy także: • jądro jednostajne: ⎧1 dla x ∈ [− 1, 1] ⎪ K (x ) = ⎨ 2 , ⎪⎩0 dla x ∈ (− ∞, − 1) ∪ (1, ∞ ). (5.13). • jądro dwuwagowe:. (. ⎧15 2 ⎪ 1− x K (x ) = ⎨16 ⎪⎩0. ). 2. dla. x ∈ [− 1, 1]. dla. x ∈ (− ∞, − 1) ∪ (1, ∞ ). ,. (5.14). • jądro normalne: ⎛ x2 ⎞ ⎟⎟ , K (x ) = exp⎜⎜ − 2 2π ⎠ ⎝ 1. (5.15). • jądro trójkątne:. ⎧1 − x K (x ) = ⎨ ⎩0 Zdefiniowane. powyżej. dla dla. x ∈ [− 1, 1]. x ∈ (− ∞, − 1) ∪ (1, ∞ ). podstawowe. typy. jąder. .. (5.16). ujęto. w. formie. stabelaryzowanej w tabeli 5.1. Zostały tam przedstawione wykresy jąder oraz efektywność danego jądra względem optymalnego jądra Epanecznikowa. Z praktycznego punktu widzenia efektywność wskazuje o ile należy zwiększyć liczność próby, aby uzyskać jakość estymacji otrzymywaną z użyciem jądra Epanecznikowa. Faktem o znaczeniu podstawowym dla praktycznych zastosowań jest to, iż efektywności poszczególnych jąder niewiele różnią się między sobą. Najprostsze z uwidocznionych w tabeli 5.1 postaci – jądro jednostajne jest jedynie o 7% mniej efektywne niż optymalne jądro Epanecznikowa. W przypadku innych typów różnica ta jest jeszcze mniejsza, w praktyce wręcz pomijalna. Pojawia się zatem możliwość aby przy wyborze funkcji K(•) 32.

(33) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. uwzględnić przede wszystkim własności otrzymanego estymatora, na przykład klasę regularności, prostotę obliczeniową, ograniczoność nośnika lub też inne cechy. istotne. z. punktu. widzenia. konkretnego. zagadnienia. będącego. przedmiotem badań (Kulczycki, 2005). Tabela 5.1. Podstawowe typy jader oraz ich efektywność względem jądra Epanecznikowa. typ jądra K. wykres. zmniejszenie efektywności względem jądra Epanecznikowa. Epanecznikowa. 0%. jednostajne. 7%. dwuwagowe. 1%. normalne. 5%. trójkątne. 1%. Wartość wprowadzonego we wzorze (5.1) parametru wygładzania h ma zasadniczy wpływ na jakość estymatora jądrowego. Zbyt mała wartość powoduje pojawienie się znacznej ilości ekstremów lokalnych estymatora fˆ(x ) , co jest sprzeczne z faktycznymi własnościami realnych populacji. Z kolei zbyt duże wartości parametru h skutkują nadmiernym wygładzeniem estymatora, 33.

(34) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. maskującym. specyficzne. cechy. badanego. rozkładu.. Istnieją. jednakże. użyteczne metody umożliwiające wyznaczenie tej wartości na podstawie wartości próby losowej, przy wykorzystaniu kryterium scałkowanego błędu średniokwadratowego MISE (Kulczycki, 2005). Wśród dogodnych metod znajduje się metoda przybliżona, podstawień i krzyżowego uwiarygodnienia. Wyczerpują. one. potrzeby. aplikacyjne,. przy. różnych. uwarunkowaniach. poszczególnych zagadnień praktycznych. Metoda przybliżona jest bardzo prosta, przeznaczona do stosowania. w przypadku. jedno-. i. wielowymiarowym,. aczkolwiek. niegwarantująca. dokładności wymaganej w wielu zastosowaniach. Wartość parametru h wyznaczona przy pomocy tej metody jest tym użyteczniejsza im bardziej estymowany rozkład jest zbliżony do normalnego lub ogólniej w przypadku trywialnego rozkładu unimodalnego. Najczęściej nie są to jednak symulacje, w których warto stosować estymację nieparametryczną. W praktyce tą metodę należy polecać jako proste rozwiązanie tymczasowe w początkowej fazie pracy nad programem komputerowym. Jest ona również używana jako pierwsze oszacowanie na potrzeby bardziej złożonych procedur. Metoda podstawień należy do zaawansowanych metod wyznaczania. wartości współczynnika wygładzania. Zapewnia ona dokładny, dogodny i szybki algorytm wyznaczania wartości parametru h na podstawie próby losowej. Może być stosowana wobec jednowymiarowej zmiennej losowej, a zatem także w przypadku zmiennej wielowymiarowej, gdy używane jest jądro produktowe. Metoda krzyżowego uwiarygodnienia zasadniczo nie zależy od wymiaru. rozważanej zmiennej losowej, co niewątpliwie jest jej zaletą. W przypadku jednowymiarowym korzystniejsza jest metoda podstawień, zatem metodę krzyżowego uwiarygodnienia stosuje się w przypadku wielowymiarowym przy stosowaniu jądra radialnego. Kompletne algorytmy przedstawionych metod wyznaczania wartości parametru wygładzania zostały opisane w monografii Kulczyckiego (Kulczycki, 34.

(35) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. 2005).. Autor. proponuje. nieznaczne,. kilku-. lub. kilkunastoprocentowe. zmniejszenie parametru wygładzania, zwłaszcza w przypadku rozkładów wielomodalnych, niesymetrycznych i przy relatywnie małych licznościach próby losowej. Doboru optymalnej wartości parametru wygładzania h można również dokonać na podstawie następującej zależności (Bowman i inni, 1997; Gajek i inni, 2000): • gdy zastosujemy jądro Epanecznikowa: hopt = 1,05 σ n. −. 1 5. ,. (5.17). ,. (5.18). • gdy zastosujemy jądro normalne: h opt = 1,06 σ n. −. 1 5. gdzie: n – liczność próby, σ – odchylenie standardowe. W. praktyce. σ. zastępujemy. obciążonym. estymatorem. odchylenia. standardowego s obliczonym na podstawie próby losowej:. s=. 1 n (x i − x )2 . ∑ n i =1. (5.19). 5.1.1. Estymacja wartości oczekiwanej i odchylenia standardowego W. poprzednim. podrozdziale. przedstawiona. została. metodyka. konstruowania nieparametrycznego estymatora jądrowego funkcji gęstości prawdopodobieństwa f(x), która w dogodny sposób opisuje rozkład estymatora. θˆ i jest również sugestywnym środkiem syntezy informacji zawartej w próbie, ponieważ jest opisem graficznym, który najłatwiej przemawia do wyobraźni. Naturalne jest także pokuszenie się o skonstruowanie liczbowych miar, opisujących podstawowe własności rozkładu estymatora θˆ . Zatem odchylenie standardowe, będące miarą zmienności estymatora θˆ może być oszacowane z zależności:. 35.

(36) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. +∞. 2. K ⎛ ˆ ⎞⎟ fˆ(x ) dx , x − θ ⎜ ∫ ⎠ − ∞⎝. sˆ K =. (5.20). gdzie: K. θˆ – estymata jądrowa parametru θ. Wykorzystując. jądrowy. fˆ(x ). estymator. funkcji. gęstości. prawdopodobieństwa, za jądrowe oszacowanie parametru θ przyjmuje się wartość: K. θˆ =. +∞. ∫ x fˆ(x ) dx .. (5.21). −∞. 5.2. Techniki ponownego losowania – metoda bootstrap Znajomość rozkładu prawdopodobieństwa F zmiennej losowej X pozwala śledzić charakter jej statystycznego zachowania. Na ogół w praktyce rzeczywista funkcja gęstości prawdopodobieństwa zmiennej losowej X jest nieznana. W takiej sytuacji może ona być aproksymowana w sposób parametryczny lub nieparametryczny na podstawie prostej próby statystycznej x, będącej realizacją badanej zmiennej X. Aproksymacja ta sprowadza się najczęściej. do. znalezienia. estymatora. rozkładu. prawdopodobieństwa. i obliczenia jego wartości na podstawie danej próby. Estymator rozkładu prawdopodobieństwa jest zatem funkcją próby, a więc zmienną losową mającą własny. rozkład. prawdopodobieństwa.. Jeśli. znany. jest. rozkład. prawdopodobieństwa estymatora, wnioskowanie statystyczne może zostać wzbogacone informacją o dokładności estymacji. Jednak w wielu sytuacjach rozkład estymatora jest nieznany a oszacowanie jego wartości sprowadza się do znalezienia punktowej estymaty, przybliżającej poszukiwany rozkład prawdopodobieństwa. zmiennej. losowej. X,. bez. informacji. o. wielkości. popełnionego przy tym błędu. Rozwiązanie tego problemu jest możliwe dzięki technikom ponownego losowania, tzw. resampling methods. Dają one bowiem możliwość. aproksymacji. podstawie. tylko. jednej. rozkładu próby. prawdopodobieństwa. statystycznej,. a. przez. estymatora to. oceny. na jego. probabilistycznej zmienności. 36.

(37) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Techniki ponownego losowania polegają na kombinacyjnym generowaniu wielu. prób. na. podstawie. jednej. pomierzonej. próby,. powielając. jej. probabilistyczne własności. Metody te oparte są na założeniu podobieństwa pomiędzy rozproszeniem estymatora nieznanej wielkości wokół tej wielkości, a rozproszeniem. estymatora,. którego. rozkład. prawdopodobieństwa. zrekonstruowany jest na podstawie prób generowanych z próby oryginalnej, wokół estymaty oszacowanej na podstawie oryginalnej próby (Efron, 1979; Hall, 1992; Efron i inni, 1993; Wehrens i inni, 2000). Dzięki temu, wykorzystując te techniki, można uzyskać dodatkowe informacje o błędzie estymacji, obciążeniu estymatora. poszukiwanej. wielkości. oraz. o. przedziałach. ufności. tego. estymatora. Jedną. z. najlepiej. przebadanych. teoretycznie. technik. ponownego. losowania jest metoda bootstrap zaproponowana przez Bradleya Efrona w 1979 roku (Efron, 1979). Występuje ona w dwóch formach: parametrycznej i nieparametrycznej. W podejściu parametrycznym rozkład prawdopodobieństwa F zmiennej losowej. X. estymowany. jest. na. podstawie. próby. x. poprzez. model. parametryczny. Na podstawie oryginalnej próby szacowana jest nieznana wartość. współczynnika. parametryzującego. rozkład. prawdopodobieństwa. zmiennej losowej X. Bootstrap próby generowane są z populacji o założonym rozkładzie prawdopodobieństwa zmiennej losowej X, którego parametr przyjmuje wartość równą estymacie uzyskanej na podstawie oryginalnej próby. W niniejszej pracy podejście parametryczne nie będzie wykorzystywane, w związku z tym zostało tylko zasygnalizowane. Metoda bootstrap w formie nieparametrycznej wykorzystuje technikę Monte Carlo do n-krotnego losowania ze zwracaniem elementów oryginalnej próby x = (x 1 , x 2 , …, x n ), przy czym prawdopodobieństwo uzyskania danego x i jest dla wszystkich elementów próby x takie samo i wynosi 1/n, gdzie n jest wymiarem oryginalnej próby losowej (Efron i inni, 1993).. 37.

(38) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Dla. każdej. bootstrap. próby. estymowany. jest. parametr. rozkładu. prawdopodobieństwa zmiennej losowej X w taki sam sposób, jak dla oryginalnej próby,. a. wszystkie. bootstrap. estymaty. tego. parametru. służą. do. zrekonstruowania rozkładu estymatora nieznanego parametru. Rysunek 5.2 przedstawia. przykład. generowania. prób. typu. bootstrap. w. podejściu. parametrycznym i nieparametrycznym.. Rysunek 5.2. Przykład generowania prób typu bootstrap w wersji nieparametrycznej i parametrycznej. Każda próba typu bootstrap x* = (x* 1 , x* 2 , …, x* n ) składa się z takiej samej liczby obserwacji jak próba macierzysta i jest wykorzystana do oceny wartości nieznanego parametru θ. Parametr θ może być dowolnym momentem rozkładu zmiennej losowej X lub inną wielkością opisującą statystyczne cechy zmiennej losowej X. Jeżeli θˆ jest estymatorem parametru θ, a jego wartość obliczona na podstawie próby x wynosi:. 38.

(39) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. θˆ = s (x ) ,. (5.22). to dla każdej próby typu bootstrap, estymata parametru θ, tzw. bootstrap estymata parametru θ otrzymana jest w taki sam sposób, jako:. θˆ * = s (x * ).. (5.23). 5.2.1. Estymacja wartości oczekiwanej i błędu standardowego Zgodnie. z. założeniami. technik. ponownego. losowania,. rozkład. estymatora θˆ może być aproksymowany przy ustalonych wartościach realizacji zmiennej losowej X, rozkładem estymatora bootstrap θˆ * . Położenie rozkładów estymatorów θˆ i θˆ * jest przesunięte względem siebie o wielkość θˆ − θ , ale dla porównania ich kształtu jest to nieistotne. Tak więc odchylenie standardowe, będące miarą zmienności estymatora θˆ , może być oszacowane przy pomocy błędu standardowego bootstrap estymatora θˆ * zdefiniowanego jako (Efron i inni, 1993; Magiera, 2002):. ∑ (θˆ − θˆ ) B. sˆ B* =. b =1. * b. *. B −1. 2. ,. (5.24). gdzie: B – ilość prób typu bootstrap,. θˆ * – estymata typu bootstrap parametru θ. Przy zastosowaniu metody Monte Carlo do szacowania rozkładu bootstrap parametru θ, za oszacowanie tego parametru przyjmuje się wartość średnią z wartości θˆ1* , θˆ2* , K, θˆB*. będących wartościami zmiennej θˆ * , uzyskanymi. w wyniku B-krotnego generowania wartości próby bootstrap (Domański i inni, 2000). Tak więc oszacowanie parametru θ przyjmuje wartość (Efron i inni, 1993; Koronacki i inni, 2004; Magiera, 2002):. θˆ * =. 1 B ˆ* ∑θ b . B b =1. (5.25). 39.

(40) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Rysunek 5.3. Algorytm estymacji wartości oczekiwanej i błędu standardowego estymatora parametru θ wykorzystujący metodę bootstrap. Wielkość opisana wzorem (5.24) jest nie tylko miarą rozproszenia estymatora θˆ , ale również zmienną losową, posiadającą swoją wariancję (Efron i inni, 1993):. ( ). var sˆ B* =. c1 c + 2 , 2 n ⋅B n. (5.26). gdzie: c 1 , c 2 – stałe zależne od rozkładu prawdopodobieństwa F populacji, z której pochodzą dane. 2. Czynnik c 1 /n reprezentuje wariancje próby statystycznej x. Jeśli n → ∞ to c 1 /n2 → 0. Wyrażenie c 2 /(n · B) związane jest z wariancją ponownego losowania i jeśli B → ∞ przy stałym n, to c 2 /(n · B) → 0. Do oszacowania wielkości (5.26) wykorzystywana jest tzw. metoda jackknife – after – bootstrap. Pierwszym krokiem tej metody jest utworzenie n jackknife prób na podstawie danych x. Dla każdej jackknife próby generuje się B prób typu bootstrap, a następnie estymuje się sˆ B* ( i ) wg wzoru (5.24), gdzie indeks (i) oznacza estymatę sˆB* otrzymaną na podstawie i-tej próby jackknife.. 40.

(41) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Zmienność. sˆB*. szacuje. wariancja. dla. utworzonego. zbioru. {sˆ }, obliczona wg formuły wprowadzonej przez Tukey’a (Tukey, 1958): * B( i ). 2. ( ). vˆar jack sˆ B* =. n n ⎛ * 1 n * ⎞ ˆ s sˆ B (i ) ⎟⎟ . − ⎜ ∑ B (i ) n ∑ n − 1 i =1 ⎜⎝ i =1 ⎠. (5.27). Procedura ta jest bardzo czasochłonna, ale może zostać zastąpiona prostszą, dającą poprawną estymatę wariancji sˆB* dla B ≥ 200 (Efron i inni, 1993). Z próby x generuje się B bootstrap prób, wśród których wyznacza się grupy nie zawierające. poszczególnych. obserwacji. xi. próby. x.. Dla. każdej. tak. wyodrębnionej grupy bootstrap prób estymuje się sˆ B* ( i ) w sposób następujący:. sˆ B* (i ) =. ⎛ * 1 ⎜θˆb − ∑ ⎜ Bi b∈Ci ⎝ Bi. 2. ⎞ θˆ ⎟⎟ ∑ b∈Ci ⎠ , * b. (5.28). gdzie: C i – wskaźniki bootstrap prób w liczbie B i , które nie zawierają i-tego elementu próby x.. { }. Na podstawie zbioru sˆB* ( i ) oblicza się wariancję sˆ B* ( i ) zdefiniowaną równaniem (5.27). Aby estymata standardowego błędu estymatora θˆ uzyskana metodą bootstrap była wiarygodna, do jej estymacji wymagane jest wykorzystanie ponad 25 prób typu bootstrap. Generowanie więcej niż 200 prób typu bootstrap nie zmienia zasadniczo wyniku estymacji (Efron i inni, 1993; Hollander i inni, 1999).. 5.3. Estymacja bayesowska Metody bayesowskie uznawane są obecnie za nieklasyczne metody statystyczne. Ich odmienność w stosunku do metod klasycznych (tzw. metod teorio-próbkowych) prawdopodobieństwa.. jest. wynikiem. przyjęcia. W. podejściu. klasycznym. innych. interpretacji. prawdopodobieństwo. interpretowane jest jako idealizacja częstości, podczas gdy w ujęciu bayesowskim prawdopodobieństwo jest miarą stopnia przekonania badacza co 41.

(42) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. do prawdziwości zajścia danego zdarzenia. Konsekwencją tego jest uznanie parametrów klasycznego modelu za zmienne losowe. Istotą estymacji bayesowskiej jest zastosowanie twierdzenia Bayesa w celu wyznaczenia rozkładu a posteriori na podstawie założonej struktury a priori i stosowanej dla rozpatrywanych modeli funkcji wiarygodności. Estymacja bayesowska łączy w ten sposób wstępną wiedzę badacza o parametrach modelu, posiadaną przed wglądem w dane, z informacją jaką niesie próba. Rozkład a priori umożliwia tym samym w sposób jawny i sformalizowany włączenie intuicyjnych, subiektywnych informacji spoza próby. Jest on miarą stopnia przekonania badacza co do szans poszczególnych wartości parametrów (Bernardo i inni, 2000; Box i inni, 1973; Kostrzewski, 2006; Męczarski, 1998; Osiewalski, 1991; Osiewalski, 2001; Pipień, 2006; Szreder, 1994; Zellner, 1971). Atrakcyjność podejścia bayesowskiego jest związana również z tym, iż rozkład a posteriori odzwierciedla informację o nieznanych parametrach w sposób czysto probabilistyczny i wolny od aproksymacji asymptotycznych, co pociąga za sobą możliwość pełnego wnioskowania w przypadku małych prób. Wyróżnić można dwa podstawowe kryteria doboru rozkładu a priori. W pierwszym z nich rozkład dobiera się tak, aby odzwierciedlał całą wstępną wiedzę badacza o badanym parametrze (przed wglądem w dane), np. z wcześniejszych pomiarów – mówi się wówczas o informacyjnym rozkładzie a priori. W drugim kryterium, w przypadku całkowitego braku wiedzy, rozważa się tzw. nieinformacyjne rozkłady a priori nazywane również referencyjnymi lub wzorcowymi. Idea wyboru nieinformacyjnego rozkładu ma pozwolić, aby dane „mówiły” same za siebie. Rozkłady takie zazwyczaj nie są miarami probabilistycznymi, a wyłącznie miarami σ-skończonymi (zwłaszcza gdy przestrzeń parametrów jest nieograniczona) (Szreder, 1994). W literaturze przedmiotu nazywa się je rozkładami niewłaściwymi, ponieważ miara całej przestrzeni probabilistycznej liczona względem nich jest nieskończona. Mankamentem struktury a priori opartej na sformalizowanych rozkładach wzorcowych jest możliwość zastosowania jej wyłącznie w przypadku prostego 42.

(43) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. modelu statystycznego. Dla bardziej skomplikowanych modeli przyjmuje się rozkłady a priori, które jedynie w sensie intuicyjnym są nieinformacyjne. W dalszej części pracy rozważane są tylko miary probabilistyczne (rozkłady „właściwe”). Załóżmy, że badamy populację ze względu na zmienną X, której rozkład zależy od parametru θ ∈ Ω. Na podstawie prostej próby losowej x = (x 1 , x 2 , …, x n ) należy podjąć decyzję d ∈ D, gdzie D jest zbiorem wszystkich możliwych decyzji o wielkości parametru θ. Ponieważ decyzję d podejmujemy na podstawie wyników z próby, możemy ją uznać za zmienną losową zwaną funkcją decyzyjną. Funkcją straty przy podejmowaniu decyzji dotyczącej wartości parametru θ nazywa się funkcję L(θ, d) określoną dla θ ∈ Ω i d ∈ D, której wartościami są wielkości straty poniesionej na skutek podjęcia określonej decyzji d. Najczęściej stosowanymi funkcjami starty są funkcje określone w następujący sposób (Domański i inni, 1998): • funkcja kwadratowa L(θ, d) = C(d - θ)2, C > 0,. (5.29). L(θ, d) = C|d – θ|, C > 0.. (5.30). • funkcja modułowa. W analizie bayesowskiej wprowadza się również pojęcie funkcji ryzyka, które jest spowodowane podjęciem decyzji d przy ustalonej wartości parametru θ. Funkcja ryzyka ma postać: R(θ, d) = E θ L(θ, d(x)),. (5.31). gdzie: E θ L(θ, d(x)) – wartość oczekiwana straty spowodowanej decyzją d przy ustalonej wartości parametru θ. Skoro parametr θ (zgodnie z głównymi założeniami analizy bayesowskiej) jest zmienną losową to wobec tego funkcja ryzyka R(θ, d) jest również zmienną losową. Można zatem rozpatrywać wartość oczekiwaną tej zmiennej.. 43.

(44) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. Ryzykiem bayesowskim odpowiadającym ustalonej funkcji decyzyjnej d nazywa się następującą funkcję: r(p, d) = E d R(θ, d),. (5.32). gdzie: E d R(θ, d) – wartość oczekiwana funkcji ryzyka przy ustalonej decyzji d, p – funkcja gęstości prawdopodobieństwa rozkładu a priori parametru θ. Jeżeli. parametr. θ. jest. zmienną. typu. skokowego. o. funkcji. prawdopodobieństwa p(θ k ) = P(θ = θ k ), dla k = 1, 2, …, gdzie: 0 ≤ p(θ k ) ≤ 1 i. (5.33). ∑ p(θ ) = 1 to: k. k. r(p, d) =. ∑ R(θ, d ) p(θ ) , k. (5.34). k. natomiast jeśli θ ma rozkład ciągły o gęstości p to:. r (p, d ) = ∫ R(θ , d ) p(θ ) dθ .. (5.35). Ω. Przy podejmowaniu decyzji dotyczącej szacowania wartości parametru θ dąży się do tego, aby wielkość starty i ponoszone ryzyko były najmniejsze. Dlatego estymatorem bayesowskim parametru θ względem rozkładu a priori określonego przy pomocy funkcji prawdopodobieństwa lub gęstości nazywamy statystykę d 0 = d 0 (X 1 , X 2 , …, X n ), dla której zachodzi:. r (p, d 0 ) = inf r (p, d ) . d∈D. (5.36). Znając rozkład a priori parametru θ oraz dodatkowe informacje o jego rozkładzie, uzyskane na podstawie próbki wylosowanej z populacji, możemy określić rozkład warunkowy tego parametru. Jeżeli założymy, że p(x|θ) jest łączną funkcją prawdopodobieństwa lub łączną funkcją gęstości próbki losowej x = (x 1 , x 2 , …, x n ) zależnej od parametru θ, którego rozkład jest określony przez funkcję p(θ) (funkcję gęstości lub prawdopodobieństwa) to łączny rozkład próby losowej i parametru θ jest wyznaczony przez funkcję: 44.

(45) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. p(x, θ) = p(x|θ) p(θ).. (5.37). Jeżeli znamy funkcję (5.37) to możemy wyznaczyć rozkład warunkowy parametru θ stosując wzór będący uogólnieniem wzoru Bayesa: • gdy θ ma rozkład skokowy o funkcji prawdopodobieństwa p(θ) (Domański i inni, 1998): p (θ x ) =. p (x θ ) p (θ ). ∑ p(x θ ) p(θ ) k. ,. (5.38). k. k. • gdy θ ma rozkład ciągły o funkcji gęstości p(θ) (Candy, 2009; Gamerman i inni, 2006; Osiewalski, 2001): p(θ x ) =. p(x θ ) p(θ ). ∫ p(x θ ) p(θ ) dθ. .. (5.39). Ω. Rozkład ten nazywa się rozkładem a posteriori parametru θ. Warto zauważyć, że w mianownikach wzorów (5.38) i (5.39) występuje złożenie łącznego rozkładu próby losowej (zależnej od parametru θ) określonego przez p(x|θ) z rozkładem a priori parametru θ zadanym przez p(θ). Zatem rozkład a posteriori parametru θ jest określony przy pomocy wzoru (uogólnionego) Bayesa z zastosowaniem złożenia rozkładów.. 5.3.1. Metody numeryczne bayesowskim Wraz. z. postępem. stosowane. technologicznym,. który. we. wnioskowaniu. umożliwia. stosowanie. procesorów wykonujących złożone operacje numeryczne w coraz krótszym czasie,. zaczęto. zwracać. uwagę. na. możliwość. wykorzystania. technik. numerycznych jako wspomagających bayesowskie ujęcie wnioskowania statystycznego. Na początku lat 80. ubiegłego wieku ujęcie bayesowskie było traktowane jako ciekawa i spójna koncepcja, która jednocześnie jest niezwykle trudna, a czasami wręcz niemożliwa do zastosowania w konkretnych problemach empirycznych (Berger, 2000). Obserwowany od 1990 roku wzrost zainteresowania ujęciem bayesowskim w wielu dziedzinach nauki jest ściśle związany. z. coraz. większym. zaangażowaniem. metod. numerycznych. 45.

(46) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. W dzisiejszych czasach bardzo złożone i nowoczesne modele często mogą być stosowane jedynie z pomocą numerycznie wspomaganego wnioskowania bayesowskiego (Berger, 2000; Geweke, 1999). Jako narzędzia umożliwiające całkowania numeryczne w analizie bayesowskiej stosowano najpierw kwadratury, a później aproksymacje typu Laplace’a (Tierney i inni, 1986) oraz metodę Monte Carlo z funkcją ważności (Monte Carlo with importance sampling, MCIS) (Geweke, 1989; Kostrzewski, 2006; Osiewalski, 2001; Pipień, 2006). W literaturze nazywane są one metodami tradycyjnymi, podkreślając w ten sposób ich nienowoczesność (Berger, 2000; Robert, 1994). Co prawda, ani kwadratury, ani aproksymacje i MCIS nie stanowią w chwili obecnej głównego narzędzia numerycznego, jednak są one nadal teoretycznie rozwijane na gruncie bayesowskim (Liang, 2002; Monahan i inni, 1996; Strawderman, 2000). Współcześnie najczęściej stosowane metody numeryczne to procedury umożliwiające przybliżoną symulację z rozkładu a posteriori (Candy, 2009; Chen i inni, 2000; Gamerman i inni, 2006; Krzykowski, 2000; Robert i inni, 2000). W tym podejściu stosuje się metodę eliminacji (Acceptance-Rejection sampling, A-R) (Candy, 2009; Gamerman i inni, 2006; Kostrzewski, 2006), a także metody Monte Carlo oparte na łańcuchach Markowa (Markov chain Monte Carlo, MCMC) (Candy, 2009; Gamerman i inni, 2006; Kostrzewski, 2006; Krzykowski, 2000; O’Hagan, 1994) w celu uzyskania numerycznego próbnika rozkładu a posteriori. Najczęściej stosowany jest tzw. algorytm Metropolisa-Hastingsa (Metropolis-Hastings sampling, M-H) (Hastings, 1970; Metropolis i inni, 1949; Metropolis i inni, 1953), a także losowanie Gibbsa (Gibbs sampling, G-S) (Candy, 2009; Casella i inni, 1992; Gamerman i inni, 2006; Tierney, 1994) oraz jego uogólniona wersja – slice sampling (S-S) (Candy, 2009; Neal, 2003; Robert i inni, 2000). Powyżej przedstawione metody znajdują odzwierciedlenie również w literaturze polskiej (Kostrzewski,. 2006;. Krzykowski,. współczesne. badania. nad. 2000;. Osiewalski,. wykorzystaniem. 2001).. MCMC. jako. Intensywne narzędzia. wspomagającego wnioskowanie bayesowskie dostarczają nowych, bardziej efektywnych próbników a posteriori w postaci algorytmów: „Hit-and-run”. 46.

(47) Estymacja niepewności wskaźników zagrożeń hałasowych środowiska. (Lovàsz, 1999; Smith, 1984), „Multiple try Metropolis” (Liu i inni, 2000) oraz „Dynamic weighting” (Chen i inni, 2000; Liu i inni, 2001). W niniejszej pracy, jako podstawowe narzędzie do generowania realizacji z rozkładów a posteriori, wykorzystano metodę błądzenia przypadkowego Metropolisa-Hastingsa (random walk Metropolis-Hastings sampling, random walk M-H) (Candy, 2009; Gamerman i inni, 2006; Kostrzewski, 2006; Krzykowski, 2000) będącą szczególnym przypadkiem algorytmu M-H. W celu zaprezentowania wybranej metody numerycznej rozważono rozkład prawdopodobieństwa p(θ|x) zadany przez gęstość: p(θ x ) =. p(x θ ) p(θ ). ∫ p(x θ ) p(θ ) dθ. =. g (x ) K. dla x ∈ ℜ d ,. (5.40). Ω. gdzie: gęstość g(x) nie musi być unormowana, jej stała normująca wynosi K (równa całce z g(x)). Funkcja g(x) nazwana jest jądrem rozkładu p(θ|x). Metoda błądzenia przypadkowego Metropolisa-Hastingsa, należąca do klasy metod MCMC, umożliwia wygenerowanie skorelowanej próby x BAY z rozkładu absolutnie ciągłego p(θ|x). W wyniku jej zastosowania otrzymywana jest. realizacja. jednorodnego. procesu. Markowa,. którego. rozkładem. stacjonarnym (inaczej niezmienniczym lub granicznym) jest rozkład p(θ|x). Aby zdefiniować wspomniany proces wprowadzone zostanie pojęcie gęstości generującej q i prawdopodobieństwa przejścia ρ. W metodzie tej kolejny stan łańcucha Markowa y jest wyznaczany poprzez zaburzenie aktualnego stanu x błędem losowym ξ i : y = x + ξi.. (5.41). Odwzorowanie q(x, •) oznacza symetryczną, tzn. q(x, y) = q(y, x) gęstość normalnego rozkładu prawdopodobieństwa N(0, σ ξ ), z której generowana jest kolejna propozycja błędu losowego ξ i .. 47.

Cytaty

Powiązane dokumenty

В  целом говорить об объективной по- зиции журналистов «Речьпосполитой», пишущих на тему Майдана и  событий в Украине того времени,

odjazdowy, niecodzienny, wyjątkowy, znakomity, rewelacyjny (Najlepsza lokata marca według Bankier.pl – Sprawdź; Fajny pomysł na rodzinne święta – dziec- ko Gratis!

Od stro- ny praktycznej, zielona architektura związana jest ze zrównoważonym budownictwem uwarunkowanym ściśle określonymi regułami, wśród których wymienia się m.in.:

posiłek, otrzymać nocleg dla siebie i koni. Były one również miejscem zebrań zamożnych mieszkańców, którzy przy dzbanie miodu lub piwa wesoło rozmawiali ze znajomymi. Do

Doroty, siostry od Aniołów, siostry Świętej Rodziny, siostry Rodziny Maryi, siostry Opatrzności Bożej, siostry Niepokalanego Serca Maryi, siostry Najświętszego Serca

W tym dyscyplinarnym kontekście dyskursu nie jest to rozumiane jako system abstrakcyjny, ale raczej jako „to, co ma miejsce, kiedy ludzie zbliżają się do zdobycia wiedzy na

Z podręcznika „Biologia na czasie 3” zapoznajcie się z metodami datowania, które są stosowane w paleontologii i krót- ko je scharakteryzujcie.. 1–6) i opisy

1. Zapis taki powinien się składać z następujących elementów ujętych w nawiasie kwadratowym: nazwisko autora cytowanej pracy, rok wydania publikacji i strona / strony, np.