• Nie Znaleziono Wyników

Index of /rozprawy2/10465

N/A
N/A
Protected

Academic year: 2021

Share "Index of /rozprawy2/10465"

Copied!
314
0
0

Pełen tekst

(1)

1

AKADEMIA GÓRNICZO-HUTNICZA W KRAKOWIE Wydział Geologii, Geofizyki i Ochrony Środowiska

Katedra Geoinformatyki i Informatyki Stosowanej

ROZPRAWA DOKTORSKA

PREDYKCJA WARTOŚCI PARAMETRÓW DOPŁYWU

ŚCIEKÓW DO OCZYSZCZALNI

Monika Anna Chuchro

Promotor pracy: dr hab. inż. Adam Walanus, prof. AGH

(2)

2

Spis treści

1. Wstęp ... 6

2. Podstawowa charakterystyka danych ... 8

2.1 Obiekty opisywane przez dane ... 8

2.2 Statystyczna eksploracja danych pomiarowych ... 10

2.2.1 Przepustowość- Natężenie dopływu ścieków. ... 10

2.2.2 Biochemiczne zapotrzebowanie na tlen ... 14

2.2.3 Chemiczne zapotrzebowanie na tlen. ... 17

2.2.4 Azot ogólny ... 19 2.2.5 Fosfor ogólny ... 20 2.2.6 Zawiesina ... 21 2.2.7 Podsumowanie ... 23 2.3 Dane uzupełniające ... 24 2.4 Korelacje ... 25

3. Metodyka analiz statystycznych ... 30

3.1 Rejestrowane dane jako szereg czasowy ... 31

3.2 Opis statystyczny a deterministyczny; niepewności pomiarowe ... 32

3.3 Zagadnienie stacjonarności szeregów czasowych ... 33

3.4 Przygotowanie danych do analizy ... 36

3.4.1 Usuwanie braków danych i błędów grubych ... 36

3.4.2 Transformacje danych ... 36

3.4.3 Filtracja górnoprzepustowa ... 37

3.4.4 Redukcja wymiarów – Analiza Składowych Głównych (PCA) ... 38

3.4.5 Redukcja wymiarów – Analiza Składowych Niezależnych (ICA) ... 40

3.5 Analiza danych ... 41

3.5.1 Autokorelacja, autokorelacja cząstkowa ... 42

3.5.2 Modele grupy ARIMA ... 42

3.5.3 Analiza w dziedzinie częstotliwości... 45

3.5.4 Census I, Census II, Metoda TRAMO-SEAT ... 46

3.6 Prognozowanie szeregów czasowych ... 48

3.6.1 Predykcja na podstawie modeli grupy ARIMA ... 48

3.6.2 Predykcja na podstawie analizy w dziedzinie częstototliwości ... 48

3.6.3 Metody adaptacyjne ... 49

3.6.4 Regresja wieloraka z uwzględnieniem opóźnień ... 52

3.6.5 Predykcja na podstawie trendów jednoimiennych ... 54

3.6.6 Metoda Kleina ... 54

(3)

3

3.7 Metody niestandardowe ... 56

3.7.1 Analiza graficzna... 56

3.7.2 Metody Monte Carlo ... 57

3.7.3 Sieci neuronowe ... 58

3.7.4 Algorytmy genetyczne ... 60

3.7.5 Inne metody data mining ... 60

3.8 Wykorzystywane oprogramowanie ... 61

4. Analiza danych dobowych ... 64

4.1 Analiza Fouriera ... 64

4.2 Modele wartości średnich ... 65

4.3 Autokorelacje i autokorelacje cząstkowe ... 67

4.4 Analiza Składowych Niezależnych ... 69

4.5 Analiza graficzna ... 69

4.6 Metody Monte Carlo ... 72

4.7 Algorytmy genetyczne ... 74

4.8 Inne metody data mining ... 76

4.9 Podsumowanie ... 77

5. Analiza danych miesięcznych ... 78

5.1 Analiza Fouriera ... 78

5.2 Modele wartości średnich ... 80

5.2.1 Dane surowe ... 80

5.2.2 Modele średnich dla danych zestandaryzowanych w obrębie lat ... 85

5.2.3 Podsumowanie ... 88

5.3 Autokorelacje i autokorelacje cząstkowe ... 89

5.4 Census I ... 93

5.5 Census II wariant X-11/Y2K ... 96

5.6 Metoda Tramo-Seat ... 98

5.7 Analiza Składowych Niezależnych ... 99

5.8 Podsumowanie ... 100

6. Predykcja ... 102

6.1 Cele i rodzaje prognoz ... 102

6.2 Predykcja danych dobowych ... 103

6.2.1 Predykcja na podstawie modeli grupy ARIMA. ... 104

6.2.2 Predykcja na podstawie analizy w dziedzinie częstotliwości... 107

6.2.3 Metody adaptacyjne ... 110

6.2.4 Regresja wieloraka ... 111

6.2.5 Sieci neuronowe ... 119

(4)

4

6.2.7 Estymacja nieliniowa ... 127

6.2.8 Podsumowanie ... 128

6.3 Predykcja danych miesięcznych ... 129

6.3.1 Predykcja na podstawie modeli grupy ARIMA. ... 130

6.3.2 Predykcja na podstawie analizy w dziedzinie częstotliwości... 132

6.3.3 Metody adaptacyjne ... 133

6.3.4 Regresja wieloraka ... 134

6.3.5 Sieci neuronowe ... 136

6.3.6 Podsumowanie ... 138

6.4. Predykcja przez analogię ... 139

7. Wyniki ... 141

7.1 Omówienie wyników dla danych dobowych... 172

7.2 Omówienie wyników dla danych miesięcznych ... 174

7.3 Modelowanie przez analogię ... 176

7.4 Podsumowanie ... 176

8. Wnioski ... 178

9. Bibliografia ... 182

Appendiks - teksty, tabele i rysunki uzupełniające umieszczone w osobnym tomie o objętości 119 stron.

(5)

5

Rozprawa doktorska współfinansowana przez Ministerstwo Nauki i Szkolnictwa Wyższego, projekt promotorski numer N N523 619939 .

Praca była częściowo finansowana w latach 2008-2011 z Małopolskiego Funduszu Stypendialnego w ramach projektu „Doctus”.

Serdecznie dziękuję:

dr hab. inż. Adamowi Walanusowi za opiekę, życzliwość i wszechstronną pomoc w napisaniu niniejszej pracy.

Mgr inż. Maciejowi Dwornikowi dziękuję za cenne rady i wskazówki, które wzbogaciły wartość pracy.

Dziękuję także wielu przedstawicielom jednostek gospodarczych, z którymi się kontaktowałam, za otwartość na propozycję wszechstronnego analizowania ich danych pomiarowych w celu, którego praktyczne, technologiczne zastosowanie mogło im się wtedy wydawać bardzo odległe.

(6)

6

1. W

STĘP

Wpływ człowieka na środowisko nie podlega dziś już dyskusji. Zmiany wprowadzane przez kolejne pokolenia coraz silniej zaburzają równowagę w środowisku naturalnym. Obecnie w wielu krajach wprowadza się w życie idee zrównoważonego rozwoju, której celem jest osiągnięcie równowagi między rozwojem gospodarczym, a dbałością o środowisko i zdrowie człowieka. Wprowadzenie tej idei w życie musi być związane z poznaniem mechanizmów zjawisk przyrodniczych oraz dokładnej oceny wpływu działalności człowieka na środowisko.

Oczyszczalnie ścieków są obiektami kluczowymi dla prawidłowego funkcjonowania środowiska oraz rozwoju cywilizacyjnego. Optymalne funkcjonowanie oczyszczalni ścieków, a także utylizacji odpadów jest niezbędne dla utrzymania lub poprawienia obecnego stanu środowiska. Do właściwego oczyszczania ścieków potrzebna jest wiedza o czynnikach wpływających na zmienność parametrów pracy obiektów. Potrzebne są też coraz dokładniejsze modele zmienności tych parametrów.

Celem poniższej pracy jest poznanie czynników mających wpływ na kształtowanie się zmienności natężenia dopływu ścieków do oczyszczalni oraz podstawowych parametrów fizyko-chemicznych oznaczanych w ściekach surowych. Możliwość modelowanie szeregów czasowych podstawowych parametrów pracy oczyszczalni ścieków ułatwiłaby projektowanie nowych oczyszczalni ścieków, a także planowanie modernizacji już istniejących. Dodatkowo, znajomość cech zmienności parametrów pracy oczyszczalni, pozwoliłaby na bardziej efektywne dobieranie parametrów procesów oraz środków chemicznych służących do oczyszczania ścieków. Dzięki temu jakość oczyszczonych ścieków, odprowadzanych do odbiorników może się poprawić, a zużycie środków chemicznych i energii zmniejszyć się. W optymistycznym przypadku może nastąpić wzrost efektywności oczyszczalni, co z kolei umożliwia bezinwestycyjne rozszerzenie zasięgu oczyszczalni. Dzięki poprawie jakości odpływu z oczyszczalni ścieków, woda na cele przemysłowe wymaga mniejszego nakładu środków dla dalszego jej użycia.

W pracy rozważane są następujące tezy:

1. Modele parametrów dopływu ścieków można zbudować na bazie stałych, periodycznych cech dobowych szeregów czasowych tych parametrów.

2. Ze względu na naturalną losowość, ale także ograniczoną ergodyczność i stacjonarność szeregów otrzymane modele mogą wyjaśniać jedynie pewną część zmienności.

(7)

7

3. Analizowane szeregi czasowe wykazują obecność wyraźnych składowych periodycznych rocznej i tygodniowej.

4. Istotną cechą periodyczności tygodniowej jest stosunkowo stabilna wewnętrzna struktura tygodnia.

5. Modele predykcyjne względnie dobrze odzwierciedlają zmiany krótkookresowe i są w stanie wskazać kierunki zmian długookresowych.

Ponadto:

6. Budowane modele bazują na wynikach uzyskanych za pomocą szerokiego spektrum metod statystycznych.

Praca jest podzielona na cztery główne części. Pierwsza zawiera opis oczyszczalni ścieków i danych opisujących ich pracę oraz opis dodatkowych szeregów czasowych wykorzystanych w analizach. Kolejna część pracy zawiera omówienie wszystkich zagadnień teoretycznych stanowiących podstawę analiz i budowy modeli predykcyjnych.

W trzeciej części pracy przedstawiono analizy szeregów czasowych natężenia dopływu ścieków do oczyszczalni oraz parametrów oznaczanych w ściekach surowych, o rozdzielczości dobowej i miesięcznej. W części tej znajdują się także różnorodne modele predykcyjne. Ze względu na dużą liczbę uwzględnionych metod analiz i metod modelowania szeregów czasowych skupiono się głównie na wybranych analizach i modelach regresyjnych. W trakcie wyboru metod analiz i predykcji posługiwano się dwoma kryteriami:

1. Czy dana metoda może dostarczyć zadowalających wyników w przypadku silnie zaszumionych, niestacjonarnych szeregów czasowych z wyraźnym wpływem składowej okresowej.

2. Czy wykonane modele i analizy można będzie realnie stosować w oczyszczalniach ścieków jako narzędzie pomocnicze w zarządzaniu procesem technologicznym.

Czwarta część pracy zawiera ocenę uzyskanych modeli predykcyjnych. Została oceniona jakość dopasowania modeli do danych rzeczywistych, a także wyciągnięto wnioski z wykonanych analiz i modeli.

Wynikami uzyskanymi w tej pracy doktorskiej zainteresowane są Miejskie Przedsiębiorstwo Wodociągów i Kanalizacji S. A. w Krakowie oraz Przedsiębiorstwo Wodociągów i Kanalizacji m. st. Warszawy S. A.

(8)

8

2. P

ODSTAWOWA CHARAKTERYSTYKA DANYCH

Podstawą pracy są dane oraz informacje udzielone przez następujące jednostki gospodarcze:

 Miejskie Przedsiębiorstwo Wodociągów i Kanalizacji S. A. w Krakowie,  Zakład Oczyszczania Ścieków w Sandomierzu (obecnie PGKiM Sandomierz),  Przedsiębiorstwo Gospodarki Komunalnej Sp. z o.o. w Tarnobrzegu

 Miejskie Przedsiębiorstwo Wodociągów i Kanalizacji m. st. Warszawy S. A. Dane uzyskane z wymienionych powyżej firm dotyczyły jakości ścieków surowych oraz oczyszczonych, wielkości natężenia przepływu ścieków, produkcji biogazu, a także ilości powstających odpadów, dla sześciu komunalnych oczyszczalni ścieków o zbliżonym procesie technologicznym, ale różniących się objętością oczyszczanych ścieków.

2.1

O

BIEKTY OPISYWANE PRZEZ DANE

Wybrane do analizy dane pochodzą z sześciu miejskich oczyszczalni ścieków biologicznych z podwyższonym usuwaniem związków azotu (N) i fosforu (P), spełniające standardy odprowadzanych ścieków dla aglomeracji ≥ 15 000 równoważnej liczby mieszkańców (RLM), typu PUB1 i PUB2 według klasyfikacji umieszczonej w załączniku do aktualizacji Krajowego Programu Oczyszczania Ścieków Komunalnych z roku 2009 (KPOŚK, 2009). Cechą wspólną tych oczyszczalni ścieków jest ich położenie w zlewni Wisły. Zlokalizowane są one w czterech województwach: małopolskim, podkarpackim, świętokrzyskim oraz mazowieckim.

Najmniejszym zakładem jest sandomierska oczyszczalnia. Obiekt ten obsługuje aglomerację należącą do I grupy, o wielkości od 15 tys. do 100 tys. równoważnej liczby mieszkańców (RLM). Obecnie w sandomierskiej oczyszczalni ścieków oczyszcza się ścieki w ilości około 3 tys. m3

/d (Piotrzkowski 1998, KPOŚK 2009, bip.um.sandomierz.pl). Dodatkowy opis oczyszczalni wraz z procesem technologicznym znajduje się w Appendiksie (A1).

Kolejnym pod względem wielkości zakładem oczyszczania ścieków jest komunalna oczyszczalnia Orzechowo-Dębe położona w aglomeracji Serock, w powiecie nowodworskim. Aglomeracja ta należy do 2 grupy, skupiającej miejscowości o RLM

(9)

9

pomiędzy 10 000 a 15 000. Z sieci kanalizacyjnej korzysta tam 10 350 osób, co stanowi 75% wszystkich mieszkańców aglomeracji. Obecnie do oczyszczalni dopływa ok. 4 tys. m3 ścieków na dobę (KPOŚK 2009, mpwik.com.pl; A2).

Trzecia co do wielkości oczyszczalnia położona jest w Tarnobrzegu. Tarnobrzeg należy do I grupy aglomeracji. Aglomeracja liczy około 52 tys. mieszkańców. Z sieci kanalizacyjnej korzysta 41,6 tys. mieszkańców (84%). Oczyszczalnia może oczyścić 15 tys. m3/dobę co odpowiada wydajności oczyszczalni dla 76 tys. RLM. W latach 2000 do 2007 natężenie dopływu ścieków do oczyszczalni wynosiło 4,85 tys. m3/dobę (KPOŚK, 2009, Żmuda 1998, wios.rzeszow.pl, A3).

Kolejny z badanych zakładów oczyszczania ścieków zlokalizowany jest w Krakowie. Miasto Kraków jest zaklasyfikowane jako aglomeracja typu 0, czyli o RLM >100 000. W mieście działa kilka oczyszczalni w tym dwie typu biologicznego z podwyższonym usuwaniem azotu i fosforu, pozostałe obiekty należą do biologicznych oczyszczalni ścieków spełniających warunki dla aglomeracji mniejszych od 15 000 RLM. Oczyszczalnia ścieków „Kujawy” położona jest w dzielnicy Nowa Huta i oczyszcza ścieki od 250 tys. mieszkańców tej dzielnicy. Oczyszczalnia funkcjonuje od 1999 roku. Została zaprojektowana na przepustowość 70 tys. m3/d, która docelowo może zostać powiększona do 110 tym m3/d. Obecnie przepustowość dobowa oczyszczalni wynosi 51 350 m3 (KPOŚK 2009, Krüger, 1999, A4).

Dwie kolejne oczyszczalnie ścieków, zlokalizowane są w Warszawie. W aglomeracji tej RLM wynosi 2.448.500, natomiast z systemu kanalizacyjnego korzysta 1.787.000 mieszkańców, co stanowi 88% wszystkich mieszkańców stolicy. Na obszarze aglomeracji działają trzy oczyszczalnie biologiczne z podwyższonym usuwaniem związków azotu i fosforu spełniające standardy odprowadzanych ścieków dla aglomeracji powyżej 100 000 RLM.

Zakład Oczyszczalni Ścieków „Południe” zarządzany jest przez Wodociągi Warszawskie. Usytuowany jest w Gminie Wilanów i od 2006 roku oczyszcza ścieki z południowej części miasta. Oczyszczalnia ta jest obiektem całkowicie zhermetyzowanym, a powietrze odciągane z obiektów oczyszczane jest w układzie dezodoryzacji. Przepustowość oczyszczalni wynosi 112 tys. m3/d, co pozwala oczyścić ścieki od 746 tys. RLM (KPOŚK 2009, materiały informacyjne oczyszczalni ścieków „Południe”, mpwik.com.pl, A5).

(10)

10

Zakład oczyszczalni ścieków „Czajka” jest jedną z największych oczyszczalni ścieków w Europie i największą w Polsce. Obiekt ten został oddany do eksploatacji w 1991 roku. W procesach technologicznych oczyszczane są ścieki z prawobrzeżnych dzielnic Warszawy oraz przyległych gmin. Oczyszczalnia została zaprojektowana jako oczyszczalnia mechaniczno – biologiczna, w układzie klasycznym, w celu oczyszczania ścieków przemysłowych i gospodarczych z terenu prawobrzeżnej Warszawy i okolic. Projektowa przepustowość obiektu wynosi 400 tys. m3/d, obecnie przepustowość tej oczyszczalni ścieków wynosi 240 tys. m3

/d (KPOŚK 2009, mpwik.com.pl, A6).

2.2

S

TATYSTYCZNA EKSPLORACJA DANYCH POMIAROWYCH

2.2.1 Przepustowość- Natężenie dopływu ścieków.

Podstawowym parametrem charakteryzującym oczyszczalnie ścieków jest natężenie dopływu ścieków (Łomotowski, Szpindor 2003). Ze względów metodycznych należy zwrócić uwagę, że dane różniły się interwałem czasowym oddzielającym poszczególne pomiary, sposobem przedstawiania wartości natężenia przepływu oraz długością szeregu czasowego. Wszystkie dane liczbowe o przepływach w postaci średniodobowych lub średniomiesięcznych szeregów czasowych, wykorzystane w analizach są podawane w tys. m3/dobę.

Jak widać w Tabeli 2.1 średnie wartości natężenia przepływu ścieków różnią się dla trzech oczyszczalni o niemal dwa rzędy wielkości. Najmniejszy zakład oczyszczania ścieków spośród analizowanych znajduje się w Sandomierzu. Średnia przepustowość tej oczyszczalni przekracza niewiele ponad 3 tys. m3/d. Natomiast najwyższa średnia przepustowość została zaobserwowana w oczyszczalni ścieków „Czajka”. Jest ona jedną z największych oczyszczalni ścieków w Europie, a jej średnie natężenie dopływu ścieków wynosi prawie 180 tys. m3/d.

(11)

11

Tabela 2.1. Statystyki opisowe wartości natężenia przepływu ścieków dla analizowanych oczyszczalni ścieków. Wielkości mianowane (nie liczność i współczynniki) podane są w tys. m3

/d.

a) Dane o rozdzielczości dobowej.

Kraków „Kujawy” Sandomierz Warszawa „Czajka”

Liczność, N 2856 2660 2911 Średnia 52,3 2,86 179 Mediana 50,5 2,80 174 Minimum 23,8 1,20 92,6 Maksimum 166 10,9 329 Odch. std. 8,8 0,63 31 Wsp. zmn. 17 22 17 Wsp. skośn. 3,2 3,3 0,9

b) Dane o rozdzielczość miesięcznej. (Odchylenie standardowe wsp. skośności dla N=100 wynosi 0,22, a dla N=15; 0,64.)

Kraków

„Kujawy” Sandomierz Tarnobrzeg

Warszawa „Czajka” Warszawa „Dębe” Warszawa „Południe” N 93 101 84 120 72 15 Średnia 52,5 3,04 4,85 184 3,28 63,4 Mediana 52,6 3,02 4,76 184 3,11 62,8 Minimum 44,8 2,10 3,47 131 2,35 57,6 Maksimum 69,5 3,82 6,85 234 4,90 69,3 Odch. std. 3,8 0,33 0,71 21 0,57 3,7 Wsp. zmn. 7,2 11 15 12 17 5,9 Wsp. skośn. 1,0 -0,4 0,5 0,0 0,8 -0,1

Dane z najmniejszej oczyszczalni, w Sandomierzu charakteryzowały się rozdzielczością dobową i obejmowały okres czasu od 1 stycznia 2000 roku do 31 grudnia 2007 roku. Przepływy te wykazują wysoką prawostronną asymetrię; wartość współczynnika skośności jest wyższa od 3. Własność tę można zaobserwować na histogramie na Rys. 2.1 w postaci wydłużonego prawego ramienia rozkładu. W przypadku

(12)

12

analizy danych miesięcznych można zauważyć wzrost wartości średniej z 2,86 tys.m3 /d do 3,04 tys.m3/d, co związane jest z zaokrąglaniem wartości parametrów, z których obliczana jest średnia miesięczna w oczyszczalni ścieków. Dodatkowo obserwuje się naturalne przy sumowaniu wielkości losowych zmniejszenie skośności, która staje się tu nawet ujemna.

Histogram Sandomierz

0 1 2 3 4 5 6 7 8 9 10 11 12

natężenie przepływu [tyś m3/d]

0 200 400 600 800 1000 1200 1400 1600 1800 2000 L ic z b a o b se rw a c ji

Rys. 2.1. Histogram natężenia dopływu do oczyszczalni ścieków w Sandomierzu. Widoczna jest prawostronna skośność rozkładu.

Drugą co do wielkości oczyszczalnią jest Orzechowo-Dębe. W przypadku tej oczyszczalni ścieków dysponujemy jedynie danymi o rozdzielczości miesięcznej. Średnie natężenie przepływu ścieków wynosi 3,2 tys. m3/d. Cechą charakterystyczną dla tej oczyszczalni jest wysoka wartość współczynnika zmienności (17,3), która jest powiązana z lewostronną asymetrią rozkładu (Tabela 1b oraz Rys. A7 - Appendiks).

Trzecim co do wielkości obiektem spośród analizowanych jest oczyszczalnia ścieków znajdująca się w Tarnobrzegu. Średnie natężenie dopływu ścieków wynosi 4,85 tys.m3/d dla analizowanego okresu czasu (od stycznia 2000 roku do grudnia 2007). Dane charakteryzują się rozdzielczością miesięczną.

Czwartą pod względem wielkości natężenia dopływu oczyszczalnią, jest należąca do MPWiK w Krakowie oczyszczalnia ścieków „Kujawy”. Średnie natężenie przepływu dla danych dobowych przekracza 52 tys. m3/dobę. Niższa wartość mediany od średniej oraz wysoka dodatnia wartość kurtozy wskazują na obecność lepidokurtyczności, co

(13)

13

można zaobserwować na histogramie (Appendiks, Rys. A8). Dane wykazują wysoką skośność o wartości zbliżonej do zaobserwowanej w oczyszczalni ścieków w Sandomierzu. Wśród analizowanych danych z oczyszczalni o rozdzielczości dobowej, krakowska oczyszczalnia wykazuje najmniejszą zmienność danych. Wyniki analiz dla oczyszczalni ścieków Kraków-„Kujawy” widoczne są w Tabeli 2.1, oraz na rysunkach A8 i A9. Wartość średnia w przypadku danych miesięcznych wykazuje niewielki wzrost o około 150 m3/dobę, w przypadku mediany różnica ta wynosi 2 tys. m3/dobę. Tak jak w przypadku poprzedniej oczyszczalni, w przypadku danych miesięcznych wartość współczynników zmienności, skośności oraz kurtozy zmniejsza się (Tabela 2.1). Pomimo niższych wartości wymienionych powyżej parametrów, dane wykazują niewielką prawostronną skośność oraz wysmuklenie histogramu.

Dwie największe spośród analizowanych oczyszczali należą do Miejskiego Przedsiębiorstwa Wodociągów i Kanalizacji m. st. Warszawy. Najmniejszą warszawską oczyszczalnią jest oczyszczalnia ścieków „Południe”. Ostatni etap budowy został zakończony w 2006 roku. Pod koniec 2007 roku nie osiągnięto jeszcze zamierzonych wartości natężenia dopływu ścieków, które wynosi 112 tys. m3

na dobę z możliwością rozbudowy do 224 tys. m3 na dobę. W latach 2006- 2007 średnie natężenie przepływu ścieków wyniosło 63,4 tys. m3/d, natomiast wartość mediany była niższa o 500 m3

/d. Dane wykazują niewielką względną zmienność, a także ujemną wartość kurtozy (Rys. A10). Pozostałe wyniki analiz widoczne są w Tabeli 2.1b.

Największą oczyszczalnią w Polsce jest obiekt zlokalizowany w Warszawie-„Czajka”. Średnie natężenie przepływu dla tego obiektu wynosi 179 tys. m3

/d dla danych dobowych oraz 184 tys. m3/d dla danych miesięcznych. W przypadku danych dobowych wartość mediany jest niższa od wartości średniej arytmetycznej o 4,4 tys. m3/dobę, odwrotnie niż w przypadku danych miesięcznych, gdzie mediana jest wyższa od średniej arytmetycznej o 390 m3/dobę. Różnice w rozkładzie wartości natężenia dopływu dla obu rodzajów danych widoczne są w Tabeli 2.1 a i 2.1 b oraz na rysunkach A11 i A12. Dane dobowe wykazują niewielką skośność, której wartość nie przekracza 1, co wydaje się być naturalne dla dużej oczyszczalni, która zbiera ścieki z dużego, zróżnicowanego obszaru, co jest rodzajem uśredniania. Dla danych miesięcznych współczynnik skośności wynosi liczbowo 0. Cechą charakterystyczną jest zmiana wartości oraz znaku dla kurtozy. Kurtoza obliczona dla danych dobowych wynosi 1,7, co oznacza niewielkie wysmuklenie histogramu, natomiast w przypadku danych miesięcznych wartość ta wynosi -0,34.

(14)

14

2.2.2 Biochemiczne zapotrzebowanie na tlen

Ważnym parametrem określającym stopień zanieczyszczenia ścieków substancją organiczną jest biochemiczne zapotrzebowanie na tlen (Łomotowski, Szpindor 2003). Liczba wykonywanych analiz pięciodobowego biochemicznego zapotrzebowania na tlen w ciągu technologicznym regulowana jest Rozporządzeniem Ministra Środowiska z dnia 24.07.2006 w sprawie warunków, jakie należy spełnić przy wprowadzaniu ścieków do wód lub do ziemi, oraz w sprawie substancji szczególnie szkodliwych dla środowiska wodnego. Oczyszczalnia ścieków w Sandomierzu oraz Dębe mają obowiązek wykonać minimum 12 pomiarów w ciągu roku, natomiast pozostałe oczyszczalnie minimalnie 24 pomiary w ciągu roku (Dziennik Ustaw z 2006 r. Nr 137 poz. 984). Tak więc analizy danych zostały przeprowadzone na szeregach o rozdzielczości miesięcznej, od stycznia 2000 do grudnia 2007 lub krótszych ze względu na braki danych.

Wartość średnia BZT5 (pięciodobowe Biochemiczne Zapotrzebowanie na Tlen) w ściekach surowych dla poszczególnych zakładów oczyszczania waha się od 270 mg O2/dm3 do 608 mg O2/dm3. Przy czym największe stężenie zanieczyszczeń organicznych łatwo rozkładalnych występuje w sandomierskiej oczyszczalni ścieków. Dość wysokie wartości zaobserwowano także w zakładzie oczyszczania ścieków „Południe” w Warszawie (361 mg O2/dm3). W pozostałych obiektach wartość parametru BZT5 była w przedziale od 270 do 290 mg O2/dm3 (Tabela 2.2). Dla wszystkich zakładów oczyszczania, za wyjątkiem Warszawy – „Południe”, wartość mediany jest niższa od wartości średniej, co świadczy o dodatniej asymetrii rozkładu. Mediana jest bardziej odporna na wartości odstające, które występują w danych, dlatego też w seriach, w których średnia jest wyższa od mediany można spodziewać się występowania wartości odstających po stronie wysokich stężeń.

Najbardziej wyróżniającą się oczyszczalnią spośród badanych pod względem parametru BZT5 jest sandomierska oczyszczalnia ścieków. Rozstęp między wartością minimalną a maksymalną analizowanego parametru wynosi aż 950 mg O2/dm3, w przypadku pozostałych zakładów oczyszczalnia wartość ta nie przekracza 450 mg O2/dm3. O dużej rozbieżność wyników w sandomierskiej oczyszczalni świadczy także wartość odchylenia standardowego (160 mg O2/dm3), co można zaobserwować w Tabeli 2.2. Niższe wartości zaobserwowano w zakładach oczyszczania ścieków „Dębe” oraz miasta Tarnobrzeg, jednakże są one znacznie wyższe od wartości oznaczanych

(15)

15

w większych oczyszczalniach ścieków (Tabela 2.2). Zakłady oczyszczania ścieków o średniodobowym natężeniu przepływu większym od 50 tys. m3/d charakteryzują się niższymi wartościami odchylenia standardowego pięciodobowego biochemicznego zapotrzebowania na tlen. Kolejną różnicę miedzy poszczególnymi obiektami dla analizowanego parametru BZT5 można zaobserwować na histogramach. Poniżej, na rysunku 2.2 widoczny jest histogram rozkładu parametru BZT5 dla oczyszczalni ścieków znajdującej się w Sandomierzu. Można zaobserwować silną prawostronną skośność rozkładu (wsp. skośności γ1=1,5). Histogramy rozkładu BZT5 dla poszczególnych oczyszczalni ścieków znajdują się w Appendiksie (A13 do A17).

Tabela 2.2. Statystyki opisowe dla pięciodobowego biochemicznego zapotrzebowania na tlen. Wielkości mianowane podane są w mg O2/dm3.

N

W ściekach surowych i oczyszczonych

Śr. Med. Min Maks. σ σ/Śr.% γ1 Śr. Med. Min. Maks. σ σ/Śr %. γ1

Kraków "Kujawy" 93 292 288 200 448 46 16 0,84 6,7 4,8 2,2 26,2 4,3 64 2,4 Sandomierz 90 608 560 360 1310 160 27 1,52 4,7 4,5 2,0 8,1 1,2 26 1,1 Serock "Dębe" 72 269 251 1 472 900 33 0,78 5,2 4,1 2,1 32,4 4,4 84 4,6 Tarnobrzeg 84 283 267 100 500 107 38 0,38 5,8 5,1 2,6 12,9 2,2 38 1,4 Warszawa "Czajka" 132 275 268 107 562 69 25 0,89 12,8 9,3 1,6 78,7 14 109 3,1 Warszawa "Południe" 15 361 361 261 435 39 11 -0,73 4,2 3,5 2,1 8,5 1,9 46,7 1,1

(16)

16 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 0 5 10 15 20 25 30 35 40 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500

Mediana, rozstęp kw artylow y, zakres nieodstających Średnia, 95% przedział ufności

Średnia, 95% przedział predykcji

Rys. 2.2. Histogram BZT5 oznaczanego w ściekach surowych w oczyszczalni ścieków w Sandomierzu. Poniżej statystyki opisowe w formie wykresów ramka-wąsy.

Stopień redukcji zanieczyszczeń oraz dopuszczalne wartości poszczególnych parametrów w ściekach oczyszczonych zostały zawarte w Rozporządzeniu Ministra Środowiska; Dz. U.06.137.984. Dla zakładów oczyszczania ścieków o RLM większym od 15 tys. wymagane jest uzyskanie dla wskaźnika BZT5 wartości nieprzekraczającej 15 mg O2/dm3 lub 90% redukcji zanieczyszczeń podatnych na biodegradacje.

Stopień redukcji zanieczyszczeń zależy od stopnia obciążenia oczyszczalni ścieków. W przypadku obiektów słabo obciążonych (o niższym niż zamierzonym w projekcie natężeniu dopływu ścieków) rezultaty oczyszczania ścieków są lepsze. Do takich słabo obciążonych oczyszczalni należy tarnobrzeski, sandomierski i serocki zakład oczyszczania ścieków. Do tej grupy można też zaliczyć oczyszczalnię ścieków „Południe”, która pod koniec roku 2007 nie wykorzystała jeszcze nominalnej przepustowości. Dodatkowe informacje można znaleźć w Appendiksie (A18).

(17)

17 2.2.3 Chemiczne zapotrzebowanie na tlen.

Do najważniejszych wskaźników chemicznego zanieczyszczenia ścieków zalicza się chemiczne zapotrzebowanie na tlen. Wskaźnik ten oznacza ilość tlenu, jaka jest zużywana na utlenienie związków organicznych na drodze chemicznej i wyrażana jest w mg O2/dm3(Łomotowski, Szpindor 2003). Dopuszczalne wartości tego parametru w ściekach odprowadzanych do gruntu lub odbiornika regulowane są Rozporządzeniem Ministra Środowiska Dz.U. z 2006 r. Nr 137 poz. 984. Tak samo jak w przypadku BZT5 zakłady oczyszczania ścieków mają obowiązek wykonania minimum 12 (Sandomierz, Dębe), lub 24 oznaczeń w ciągu roku (pozostałe oczyszczalnie).

Tabela 2.3. Statystyki opisowe dla chemicznego zapotrzebowania na tlen. Wielkości mianowane podane są w mg/dm3.

N

W ściekach surowych i oczyszczonych

Śr. Med. Min. Maks. σ σ/Śr.

% γ1 Śr. Med. Min. Maks. σ

σ/Śr %. γ1 Kraków "Kujawy" 93 560 543 355 976 116 21 0,65 24 23 18 35 3,6 15 0,6 Sandomierz 90 1015 933 604 2812 370 36 2,68 27 26 14 58 5,7 21 2,4 Serock "Dębe" 72 558 495 229 1018 192 34 0,63 31 30 20 67 7,1 23 3,2 Tarnobrzeg 84 681 617 292 1768 253 37 1,34 43 41 22 85 10,1 24 1,3 Warszawa "Czajka" 132 662 650 399 1080 126 19 0,43 66 59 22 233 30 45 2,5 Warszawa "Południe" 15 831 790 447 1119 186 22 -0,38 26 26 21 33 3,4 13 0,2

(18)

18

Rys. 2.3. Wartości ekstremalne, kwartyle, średnia i mediana (zawsze poniżej średniej) dla chemicznego zapotrzebowania na tlen w ściekach oczyszczonych (mg/dm3

), dla sześciu oczyszczalni uporządkowanych wg średniej (niewidoczne maksimum dla Czajki wynosi 233).

Podobnie jak w przypadku BZT5 najwyższą średnią wartość chemicznego zapotrzebowania na tlen zaobserwowano dla danych z zakładu oczyszczania ścieków komunalnych z Sandomierza. Wartość tego parametru wynosiła 1014 i była wyższa o 450 mg O2/dm3 od wartości średniej dla oczyszczalni Kraków „Kujawy”. Tak samo jak w przypadku biochemicznego zapotrzebowania na tlen wysoką wartość średniej zaobserwowano także w warszawskiej oczyszczalni ścieków „Południe”. Dane z tej oczyszczalni ścieków charakteryzują się dość niskim współczynnikiem zmienności, który wynosi 22% (patrz tabela 2.3). Bardzo podobne wartości współczynnika zmienności zaobserwowano w danych z warszawskiej oczyszczalni „Czajka” (19%) jak i z krakowskiej (20%). Ciekawym, lecz zrozumiałym zjawiskiem jest różnica w wielkości współczynnika zmienności pomiędzy małymi, a dużymi zakładami oczyszczania ścieków. W trzech najmniejszych oczyszczalniach ścieków, współczynniki zmienności danych dotyczących ChZT są również pomiędzy sobą podobne, lecz niemal dwukrotnie wyższe od współczynników dla dużych oczyszczalni (osiągając 34%, 36%, i 37% dla oczyszczalni: „Dębe”, Sandomierz, Tarnobrzeg).

(19)

19

Dane z wszystkich oczyszczalni oprócz sandomierskiej i tarnobrzeskiej wykazują niewielką skośność, której wartość nie przekracza 0,65. Natomiast najwyższą skośność (γ1=2,7) zaobserwowano w danych z najmniejszej, sandomierskiej oczyszczalni (histogram Rys. A19).

Charakterystyczne dla analizowanych szeregów czasowych jest niższa wartość mediany od wartości średniej oraz wzrost wartości ekstremalnych dla większych oczyszczalni (niewidoczne maksimum dla Czajki wynosi 232 m3/dobę dla ścieków oczyszczonych) zarówno dla ścieków surowych i oczyszczonych. Szczegóły rozkładu szeregów czasowych chemicznego zapotrzebowania na tlen widoczne są na wykresie powyżej (Rys. 2.3), w Tabeli 2.3 i na histogramach znajdujących się w Appendiksie (A19 do A24).

Maksymalna dopuszczalna wartość chemicznego zapotrzebowania na tlen oznaczona w ściekach oczyszczonych wprowadzanych do gruntu lub wody wynosi 125 mg O2/dm3, lub minimum 75% redukcja zanieczyszczeń chemicznych oznaczanych w tej analizie chemicznej. Każda z badanych oczyszczalni ścieków spełnia wymagania zawarte w rozporządzeniu Ministra Środowiska (Dz. U. z 2006 r. Nr 137 poz. 984). Dodatkowe informacje o ChZT w ściekach oczyszczonych znajdują się w Appendiksie (A18).

2.2.4 Azot ogólny

Na jakość odbiornika ścieków duży wpływ ma zawartość substancji biogennych w ściekach. Podstawowymi pierwiastkami biogennymi są azot i fosfor. Oczyszczalnie ścieków w zależności od wielkości obiektu i ustaleń wewnętrznych oznaczają w ściekach różne związki azotu. Wszystkie oczyszczalnie ścieków spośród badanych oznaczają zawartość azotu ogólnego. Azot ogólny jest to suma związków: azotu organicznego, azotu amonowego, związków azotu III i V wartościowego (azotynowego i azotanowego) (Łomotowski, Szpindor 2003).

W Tabeli 2.4 widoczne są wartości statystyk opisowych dla zawartości azotu ogólnego w ściekach surowych, natomiast histogramy rozkładu można zobaczyć w Appendiksie (A25 do A30). Najwyższe średnie wartości zaobserwowano w dwóch sąsiednich oczyszczalniach ścieków, znajdujących się w Sandomierzu i Tarnobrzegu (83 i 82 mg N/dm3). Wysoka wartość została oznaczona także w ściekach z oczyszczalni Warszawa „Południe” (72 mg N/dm3

(20)

20 średnia wynosiła ok. 50 mg N/dm3

. Różnica między minimalną a maksymalną zawartością związków azotu w ściekach surowych wskazuje na dużą zmienność danych potwierdzoną także wartościami współczynnika zmienności. Zmienność wartości tego parametru związana jest z warunkami pogodowymi oraz porami roku.

W ściekach oczyszczonych zmienność zawartości azotu ogólnego dla poszczególnych miast jest mniejsza. Najniższa średnia wartość tego parametru wynosi 5,5 mg N/dm3 dla oczyszczalni ścieków „Kujawy”, najwyższa natomiast 20, dla oczyszczalni ścieków „Czajka”. Dane wykazują prawostronną skośność, wyjątek stanowią dane o rozkładzie normalnym z oczyszczalni ścieków „Południe”. Współczynnik zmienności obliczony dla azotu ogólnego, dla ścieków oczyszczonych wskazuje na duże zróżnicowanie danych, które potwierdzają także pozostałe miary statystyczne przedstawione w Tabeli 2.4.

Tabela 2.4. Statystyki opisowe dla zawartości azotu ogólnego w ściekach. Wielkości mianowane podane są w mg/dm3.

2.2.5 Fosfor ogólny

Średnia zawartość związków fosforu oznaczanych parametrem fosforu ogólnego w ściekach surowych osiąga podobne wartości we wszystkich analizowanych oczyszczalni ścieków za wyjątkiem oczyszczalni „Południe”. Jednakże, ze względu na małą liczbę pomiarów nie można do tej wartości przywiązywać wagi. Dane dla wszystkich stacji wykazują prawostronną skośność, której najmniejszą wartość zaobserwowano dla Krakowa natomiast najwyższą dla oczyszczalni „Czajka” (Tabela 2.5, histogramy A31 do

N

w ściekach surowych i oczyszczonych

Śr. Med. Min. Maks. σ σ/Śr γ1 Śr. Med. Min. Maks. σ σ/Śr . γ1

Kraków "Kujawy" 93 54 54 30 80 12 22 -0.1 5 5 2 18 4 64 1.8 Sandomierz 90 83 85 39 111 14 17 -0.8 8 8 3 16 3 35 0.7 Serock "Dębe" 71 50 49 26 73 11 21 0.2 14 13 7 40 5 33 3.2 Tarnobrzeg 84 82 76 47 181 26 32 1.6 12 11 8 22 3 21 1.3 Warszawa "Czajka" 132 50 50 10 73 10 19 -0.4 20 18 10 36 5 26 1.0 Warszawa "Południe" 15 72 70 60 91 9 13 0.6 9 9 6 13 2 23 -0.1

(21)

21

A36). Wartość współczynnika zmienności dla wszystkich oczyszczalni ścieków jest umiarkowana, tylko w przypadku 3 szeregów czasowych przekracza ona 30%.

Zawartość fosforu ogólnego w ściekach oczyszczonych jest silnie zróżnicowana, stuprocentowy współczynnik zmienności pojawia się dwa razy. Średnia zawartość tych związków w ściekach wynosi od 0,55 mg P/dm3

dla oczyszczalni w Sandomierzu do 2,8 mg P/dm3 dla oczyszczalni „Dębe” w Serocku. W analizowanych szeregach czasowych istnieje wyraźna różnica między wartościami maksymalnymi i minimalnymi, co można zaobserwować w Tabeli 2.5.

Tabela 2.5. Statystyki opisowe dla zawartości fosforu ogólnego w ściekach. Wielkości mianowane podane są w mg P/dm3.

N

W ściekach surowych i oczyszczonych

Śr. Med. Min. Maks. σ σ/Śr

% γ1 Śr. Med. Min. Maks. σ σ/Śr % γ1 Kraków "Kujawy" 94 8,8 8,5 5,8 13,7 1,7 20 0,7 1,2 1,0 0,3 11,0 1,2 99 8,0 Sandomierz 90 12,3 12 8,3 24,0 2,8 22 2,6 0,6 0,6 0,1 1,1 0,2 36 0,5 Serock "Dębe" 72 8,9 7,7 4,3 18,7 3,1 35 1,2 2,8 2,5 0,5 8,4 1,4 50 1,2 Tarnobrzeg 84 8,7 8,5 3,4 20,8 2,9 33 1,6 1,0 1,0 0,4 1,3 0,2 20 -0,6 Warszawa "Czajka" 132 11,1 10 5,6 31,0 3,2 29 2,6 1,9 1,4 0,2 12,0 1,9 99 3,5 Warszaw "Południe” 15 16,4 16 9,4 31,2 6,2 38 1,1 0,9 0,9 0,5 1,5 0,3 31 0,9 2.2.6 Zawiesina

W skład zawiesiny wchodzą substancje organiczne i mineralne nierozpuszczalne, pływające lub zawieszone, wydzielone ze ścieków lub wody przez przesączanie, opadanie lub odwirowanie (Łomotowski, Szpindor 2003). Najwięcej zawiesin zawierają ścieki surowe w oczyszczalni w Sandomierzu. Zarówno średnia zawartość zawiesin dla tej oczyszczalni wynosząca 549 mg/dm3

jak i wartość maksymalna wynosząca 2044 mg/dm3, są wartościami najwyższymi dla analizowanych szeregów czasowych. Wysokie zawartości zawiesin są także charakterystyczne dla obu warszawskich oczyszczalni ścieków. W ich przypadku wartość maksymalna wynosi ok. 1000 mg/dm3, natomiast średnia spada do 458 mg/dm3 dla oczyszczalni ścieków „Czajka i 535 mg/dm3 dla oczyszczalni „Południe”. W przypadku pozostałych analizowanych oczyszczalni średnia zawartość zawiesiny w ściekach nieoczyszczonych nie przekroczyła 300 mg/dm3. Można także przypuszczać, że widoczna w Tabeli 2.6 wartość minimalna zaobserwowana w oczyszczalni ścieków

(22)

22

w Krakowie, dla ścieków nieoczyszczonych (11 mg/dm3) jest typowym przykładem błędu operatora wynikającym z błędnego przepisania danych z formy analogowej na cyfrową. Wartość współczynnika zmienności dla danych surowych zbliża się do 50% dla oczyszczalni ścieków w Sandomierzu oraz Tarnobrzegu. Dane z tych stacji wykazują także najwyższą skośność (Tab. 2.6). Oprócz oczyszczalni ścieków „Kujawy”, pozostałe szeregi czasowe dla tego parametru wykazują różnej wartości prawostronną skośność (Tab. 2.6,). Dodatkowe informacje o rozkładzie danych można zaobserwować na histogramach znajdujących się w Appendiksie (A37 do A42).

Zawartości zawiesiny w ściekach oczyszczonych dla trzech oczyszczalni ścieków w Krakowie, Sandomierzu oraz Serocku mają zbliżone wartości statystyk opisowych. Średnia wynosi nieco powyżej 6 mg/dm3, natomiast mediana poniżej 6 mg/dm3. Większe rozbieżności między tymi szeregami można zauważyć w wartościach odchylenia standardowego oraz współczynnika zmienności. Spośród tych trzech szeregów najbardziej zróżnicowane dane zaobserwowano w szeregu z oczyszczalni „Dębe”. W oczyszczalniach ścieków z Tarnobrzegu oraz Warszawy zawartość zawiesiny w ściekach oczyszczonych jest wyższa od analogicznej wartości dla trzech omówionych wcześniej oczyszczalni ścieków. Najwyższą średnią wartość obliczono dla danych z największej warszawskiej oczyszczalni ścieków „Czajka”, wynosiła ona 33 mg/dm3. Wartości minimalne dla tych trzech oczyszczalni (Tarnobrzeg, „Czajka”, „Południe”) wynoszą ok. 4 mg/dm3, różni je natomiast wartość maksymalna, która w przypadku oczyszczalni ścieków „Czajka” przekracza 150 mg/dm3. Dodatkowo szereg czasowy zawartości zawiesiny w ściekach oczyszczonych dla oczyszczalni ścieków „Czajka” posiada największą wartość współczynnika zmienności, przekraczającego 2/3. Ma też najwyższą prawostronną skośność (patrz tabela 2.6 ), co wiąże się z dużą względną zmiennością.

(23)

23

Tabela 2.6. Statystyki opisowe dla zawartości zawiesiny w ściekach. Wielkości mianowane podane są w mg/dm3.

N

W ściekach surowych i oczyszczonych

Śr. Med. Min. Maks. σ σ/Śr

% γ1 Śr. Med. Min. Maks. σ

σ/Śr % γ1 Kraków "Kujawy" 94 291 297 11 523 73 25 -0,6 6,3 6,0 2,4 14,3 2,3 36 1,2 Sandomierz 90 549 493 294 2044 250 46 3,3 6,1 5,6 3,5 14,7 2,0 32 1,9 Serock "Dębe" 72 274 254 133 573 105 38 1,0 6,1 5,7 2,4 15,3 2,9 47 1,5 Tarnobrzeg 84 282 254 120 718 135 48 1,3 11,6 10,1 4,0 35,2 6,1 52 1,3 Warszawa "Czajka" 132 458 452 179 1052 123 27 0,9 33,3 27,1 4,0 157,0 22,4 67 2,3 Warszawa "Południe" 15 535 489 301 959 199 37 1,2 9,5 8,7 4,5 17,5 3,6 38 1,1 2.2.7 Podsumowanie

Na podstawie analiz opisowych dla poszczególnych parametrów pracy oczyszczalni ścieków można stwierdzić, że raczej trudno będzie wykonać jeden wspólny model dla wszystkich oczyszczalni. Wartości poszczególnych statystyk wskazują na fakt różnego kształtowania się poszczególnych szeregów. Nie wydaje się też mieć zbyt wielu szans pomysł wykonania modeli dla oczyszczalni podzielonych ze względu na ich wielkość. Oczyszczalnie ścieków z Sandomierza, Serocku i Tarnobrzega w pierwsze grupie, Kraków i Warszawa „Południe” w drugiej grupie, oraz Warszawa „Czajka” jako osobna trzecia grupa. Niestety wyraźne różnice dla statystyk opisowych wskazują konieczność wykonywania modeli dla każdej oczyszczalni ścieków osobno.

Wspólną cechą analizowanych szeregów czasowych jest natomiast wzrost wartości współczynnika zmienności dla danych oczyszczonych w stosunku do analogicznych danych dla ścieków surowych. Lecz i tu jest wyjątek, który stanowią szeregi czasowe biochemicznego zapotrzebowania na tlen.

Najbardziej stężone ścieki oczyszczane występują w oczyszczalni w Sandomierzu. W przypadku tej oczyszczalni redukcja zanieczyszczeń wynosi 130 razy dla biochemicznego zapotrzebowania na tlen oznaczanego w ciągu pięciu dób. Dla chemicznego zapotrzebowania na tlen redukcja wynosi 38, a jest 90 krotna w przypadku zawiesiny oraz 10 i 22 krotna dla azotu i fosforu ogólnego. Wysoka zawartość zanieczyszczeń w ściekach surowych na wlocie do oczyszczalni jest tu spowodowana dowożeniem wozami asenizacyjnymi silnie stężonych ścieków z szamb przydomowych

(24)

24

z dużej liczby gospodarstw oraz występowaniem kanalizacji rozdzielczej. Silnie stężone ścieki na wlocie do oczyszczalni występują także w oczyszczalni ścieków „Południe”. Natomiast najmniej stężone ścieki doprowadzane są do oczyszczalni ścieków „Czajka”. Dla tej oczyszczalni redukcja zanieczyszczeń wynosi 21 razy dla BZT5 i zaledwie około 2,5 dla związków azotu.

W przypadku oczyszczalni „Kujawy”, „Dębe” i „Czajki” wyższą wartość skośności zaobserwowano dla danych oczyszczonych, z reguły jest to prawostronna skośność. Odmiennie zmienia się skośność dla szeregów czasowych z Sandomierza. W przypadku tej oczyszczalni wartość współczynnika skośności maleje w ściekach oczyszczonych, co wydaje się pozytywne. Dla szeregów czasowych z oczyszczalni ścieków w Tarnobrzegu oraz „Południa” z Warszawy nie stwierdzono występowania wyraźnych wzorców.

Najniższe wartości skośności zostały otrzymane dla szeregów czasowych z „Kujaw” oraz „Południa”. Jednakże wyniki i wnioski uzyskane dla oczyszczalni ścieków „Południe” powinny być zweryfikowane po otrzymaniu większej ilości danych.

2.3

D

ANE UZUPEŁNIAJĄCE

Kształtowanie się zmienności wartości parametrów oznaczanych w ściekach surowych oraz natężenia przepływu ścieków zależy od wielu czynników. Ważną informacją jest też, jaka była wartość oznaczanego parametru dnia poprzedniego, a jest to wielkość dostępna dla celów predykcyjnych. Wpływ na wartości analizowanych szeregów czasowych może mieć także: pora roku, dzień tygodnia, a także warunki pogodowe. Dlatego też przygotowano pewną liczbę zmiennych objaśniających uwzględniających czynniki, które potencjalnie mają wpływ na analizowane dane.

W trakcie analiz wykorzystano dane pogodowe dostępne w serwisie TuTiempo (tutiempo.net) dotyczące pogody, również w Polsce, w latach od 2000 do 2007. Informacje pogodowe dostępne były dla miast: Krakowa- dane z lotniska w Balicach, Warszawy- dane z lotniska w Okęciu oraz dla Sandomierza. Odległość 15 km pomiędzy Tarnobrzegiem a Sandomierzem pozwala na wykorzystanie danych pogodowych z Sandomierza również dla sąsiedniego miasta. W podobny sposób dane pogodowe z lotniska w Okęciu zostały użyte w trakcie analiz szeregów czasowych z Serocka. Dane pogodowe, o czasowej rozdzielczości dobowej obejmowały informację o:

(25)

25

 temperaturze średniej dobowej, oraz dobowej minimalnej i maksymalnej,  wysokości opadów,

 wilgotności,

 ciśnieniu atmosferycznym,

 prędkości wiatru średniej, maksymalnej, prędkości podmuchów,  widoczności,

 indykatorach powstawania mgły, piorunów, deszczu, śniegu lub gradu.

Ilość ścieków dopływających do oczyszczalni zależy, oczywiście także od czynników antropogenicznych. Do najważniejszych z nich można zaliczyć zmiany w użytkowaniu wody i produkcji ścieków na przestrzeni lat, zmienność produkcji w obrębie miesiąca i tygodnia, występowanie dni wolnych, świątecznych i okresu wakacyjnego, a także zwiększone zużycie wody i produkcja ścieków w okresach przedświątecznych. Informacje takie można kodować w postaci binarnej. Do najważniejszych szeregów czasowych w postaci binarnej, wykorzystanych w analizach należą:

 sześć zmiennych opisujących dzień tygodnia (nie siedem, ze względu na ścisłą relację),

 jedenaście zmiennych opisujących miesiące,  zmienna oznaczająca dni świąteczne,

 zmienna opisująca dni wzmożonego wykorzystywania wody przed świętami wielkanocnymi i Bożego Narodzenia,

2.4

K

ORELACJE

W celu wybrania najlepszego zestawu zmiennych do analiz wykonano liczne macierze korelacyjne dla danych dobowych, tygodniowych oraz miesięcznych. W przypadku danych dobowych macierze korelacyjne wykonano dla natężenia dopływu ścieków z Krakowa, Sandomierza oraz Warszawy „Czajka”. Oprócz danych nieprzekształconych (punkt 3.4 Przygotowanie danych do analizy), w trakcie analizy siły korelacji wykorzystano dane natężenia dopływu ścieków poddane filtracji górnoprzepustowej o oknie wygładzania równym 60 oraz 14 dni. Spośród danych pogodowych, jako najważniejsze wybrano: temperaturę średnią oraz wysokość opadu (w mm). Do analizy siły wzajemnych związków między badanymi szeregami czasowymi

(26)

26

wykorzystano współczynnik korelacji liniowej Pearsona oraz współczynniki korelacji nieliniowej Tau Kendalla i korelacji rang Spearmana. Podczas wstępnych analiz stwierdzono brak korelacji temperatury średniej z natężeniem dopływu ścieków, dlatego w dalszych analizach wykorzystano głównie dane dotyczące wysokości opadu. W celu znalezienia optymalnych przekształceń danych, które w najbardziej dokładny sposób będą tłumaczyć zmienność badanych szeregów czasowych, dane dotyczące opadów zapisano w formie binarnej. Wysokość opadów poddano także pierwiastkowaniu. W poniższej tabeli (2.7) widoczny jest fragment macierzy korelacji Pearsona dla danych dobowych natężenia dopływu ścieków do oczyszczalni oraz danych pogodowych. Wszystkie wartości współczynnika korelacji liniowej Pearsona zawarte w Tabeli 2.7 są istotne statystycznie. Pogrubioną czcionką zaznaczone są wartości korelacji silniejszej od 0,4.

Tabela 2.7. Macierz korelacji dobowych danych opadowych i dopływu ścieków. Dla orientacji w sile zależności podane są również współczynniki korelacji pomiędzy różnymi lokalizacjami (np. Warszawa – Kraków).

Współczynniki Korelacji Kraków Sando-mierz Czajka Kraków filtracja 60 Sando-mierz filtracja 60 Czajka filtracja 60 Kraków filtracja 14 Sando- mierz filtracja 14 Czajka filtracja 14 Opad Kraków 0,58 0,41 0,15 0,60 0,38 0,20 0,44 0,25 0,11 Opad Sandomierz 0,41 0,54 0,15 0,43 0,53 0,20 0,28 0,41 0,12 Opad Czajka 0,19 0,21 0,31 0,21 0,21 0,41 0,15 0,16 0,31 Pogoda Kraków -0,58 -0,30 -0,23 -0,58 -0,32 -0,30 -0,41 -0,19 -0,17 Pogoda Sandomierz -0,34 -0,31 -0,28 -0,33 -0,31 -0,28 -0,21 -0,22 -0,18 Pogoda Warszawa -0,27 -0,18 -0,39 -0,28 -0,18 -0,45 -0,17 -0,12 -0,31 Pierwiastek z opadów Kraków 0,57 0,39 0,26 0,58 0,37 0,29 0,41 0,25 0,17 Pierwiastek z opadów Sandomierz 0,42 0,49 0,24 0,43 0,49 0,28 0,29 0,37 0,18 Pierwiastek z opadów Warszawa 0,29 0,24 0,42 0,30 0,24 0,52 0,20 0,18 0,38 Sandomierz 0,52 - 0,38 0,49 0,90 0,27 0,34 0,70 0,18 Warszawa 0,30 0,37 - 0,27 0,23 0,80 0,18 0,15 0,62 Kraków - 0,52 0,30 0,96 0,51 0,33 0,74 0,35 0,21

(27)

27

gdzie: pogoda oznacza wysokość opadu w postaci binarnej (0-wysokość opadów powyżej 1mm, 1-brak opadów i wysokość opadu poniżej 1mm- w tym przypadku korelacja rangowa Spearmana) filtracja oznacza filtracje górnoprzepustową o szerokości okna filtracji podanej w tabeli.

Obliczanie korelacji liniowej Pearsona miało na celu sprawdzenie czy występuje powiązanie między opadami a danymi z oczyszczalni. Wysoka wartość tego współczynnika świadczyłaby o wysokiej zależności między objętością ścieków dopływających do oczyszczalni a opadami, czego można się spodziewać. Szeregi czasowe z trzech analizowanych oczyszczalni ścieków wykazują dodatnią korelacje z dobowymi wartościami opadów, wynoszącą od 0,3 dla „Czajki” do 0,6 dla „Kujaw”. Są to dość wysokie wartości, biorąc pod uwagę charakter badanych szeregów czasowych. Dodatnia korelacja występuje również pomiędzy przepływami z poszczególnych analizowanych oczyszczalni ścieków. Największa wartość korelacji występuje między oczyszczalnią „Kujawy” Kraków, a obiektem w Sandomierzu i wynosi 0,5. Najmniejsza wartość korelacji występuje miedzy danymi pochodzącymi z oczyszczalni ścieków w Warszawie i Krakowie, wynosi ona 0,3. Wzrost korelacji, tak jak się można spodziewać odpowiada zmniejszenia odległości między analizowanymi oczyszczalniami ścieków.

Wysoka wartość korelacji liniowej między dwoma oczyszczalniami ścieków może wystąpić, gdy obiekty położone są w niewielkim oddaleniu od siebie oraz przyjmują ścieki o podobnej strukturze. W takim przypadku możliwe jest wykonanie jednego modelu dla obu obiektów lub też wykorzystanie fragmentów modelu z jednej oczyszczalni do wykonania modelu dla drugiej oczyszczalni ścieków.

Nieznaczną poprawę korelacji zaobserwowano po wykonaniu filtracji górnoprzepustowej o oknie równym 60 dni. Wartość współczynnika korelacji spada natomiast w przypadku, gdy dane poddane są filtracji dolnoprzepustowej o oknie wygładzania węższym od 30 dni. Korelacja, szeregów czasowych wysokości opadu z danymi przefiltrowanymi o oknie wygładzania równym 14 dni, osłabła o wartości 0,1 do 0,2 w stosunku do korelacji dla danych nieprzetworzonych. Różnice w wartościach współczynnika korelacji liniowej Pearsona dla danych nieprzetworzonych oraz poddanych filtracji górnoprzepustowej świadczy o silnym wpływie opadów na kształtowanie się zmienności krótkookresowej w danych.

Zastosowanie przekształceń danych dla wysokości opadu, także nie przyniosło spodziewanej poprawy siły zależności liniowych z szeregami natężenia dopływu ścieków

(28)

28

do oczyszczalni. Współczynnik korelacji nieznacznie maleje dla danych poddanych binaryzacji i pierwiastkowaniu w przypadku oczyszczalni ścieków w Krakowie. Przekształcenia szeregu czasowego opadów przyniosły wzrost wartości współczynnika korelacji liniowej Pearsona tylko w przypadku oczyszczalni ścieków „Czajka” w Warszawie, zmienne te powinny zostać uwzględnione w dalszych analizach.

Obliczone współczynniki korelacji nieliniowej Tau- Kendalla i rangowe Spearmana są niższe od wartości współczynników korelacji liniowej Pearsona. Można zatem uznać, że związki jakie zachodzą między danymi dotyczącymi opadów a natężeniem przepływu ścieków wystarczająco dobrze odzwierciedlają zależności liniowe.

W przypadku danych miesięcznych poszukiwane były zależności liniowe i nieliniowe pomiędzy szeregami czasowymi zawierającymi informacje o temperaturze średniej i wysokości opadu z trzech stacji pogodowych z wszystkimi szeregami czasowymi parametrów oznaczanych w ściekach surowych oraz natężenia dopływu. Ciekawą zależność zaobserwowano w przypadku danych z oczyszczalni ścieków w Tarnobrzegu oraz „Czajki” w Warszawie. Średniomiesięczne natężenie dopływu dla tych oczyszczalni ścieków wykazuje ujemną korelację liniową Pearsona z temperaturą średniomiesięczną. W przypadku danych z oczyszczalni ścieków w Tarnobrzegu wartość współczynnika wynosiła -0,6 natomiast dla Warszawy -0,3. W przypadku pozostałych parametrów brak jest istotnych korelacji z danymi pogodowymi.

Wykonano także optymalizację procesu dzielenia danych na klasy w celu uzyskania jak najwyższej wartości współczynnika korelacji Spearmana. Dobowe dane dotyczące opadów oraz natężenia dopływu ścieków zostały podzielone na 5 klas każda. Pierwsza klasa zaczynała się od wartość minimalnej danego szeregu czasowego, a piąta kończyła się wartością maksymalną. Dodatkowym założeniem było ustalenie minimalnej liczebności klasy, przy czym zbadano cztery wersje: 100, 150, 200 i 250. Wykonano losowanie 1000 zestawów wartości granicznych klas dla każdego założenia. Najwyższą wartości korelacji wynoszącą 0,59 osiągnięto dla minimalnej liczebności klas wynoszącej 100 (która dawała największą elastyczność wyboru granic klas). Osiągnięty wzrost współczynnika korelacji liniowej Pearsona wynoszący 0,1 w stosunku do danych nieprzetworzonych nie jest jednak w stanie w znaczący sposób poprawić jakości prognoz modeli.

Wykonane macierze korelacji wykazały istnienie statystycznie istotnych zależności pomiędzy oczyszczalniami ścieków, a także pogodą. Wartości współczynników świadczą o istotnym wpływie wysokości opadów na kształtowanie się zmienności dobowego

(29)

29

natężenia przepływu ścieków. W przypadku danych miesięcznych widoczny jest wpływ temperatury na natężenie przepływu ścieków. Wykonane przekształcenia danych nie podniosły wartości współczynników korelacji. Wyjątkiem był wzrost korelacji dla danych dobowych z Warszawy (Tabela 2.7) z wysokością opadów w postaci binarnej i po pierwiastkowaniu.

(30)

30

3. M

ETODYKA ANALIZ STATYSTYCZNYCH

W podręczniku „Introduction to statistical time series” (Fuller, 1996) autor pisze o znacznym rozwoju matematycznej teorii szeregów czasowych w ostatnich latach” (The mathematical theory of time series has been an area of considerable activity in recent years). A był to koniec ubiegłego wieku. Dziś wyszukiwarka Google znajduje niemal 20 milionów stron na hasło „time series”.

Szeregi czasowe wiąże się najczęściej z prognozowaniem. Autorzy M.P. Clemens i D.F. Hendry zdefiniowali regułę prognozowania jako procedurę operacyjną dla formułowania stwierdzeń o przyszłych zdarzeniach (A forecasting rule is any operational procedure for making statements about future events.). Dostępnych jest bardzo wiele publikacji dotyczących różnorodnych zagadnień związanych z analizą i predykcją szeregów czasowych. Spośród najważniejszych można wymienić „Analizę szeregów czasowych. Prognozowanie i sterowanie” autorstwa G.E.P. Box’a i G.M. Jenkins’a, „Time series: Theory and methods” autorstwa P.Brockwell’a i R. Davis’a oraz „Time series analysis” J.D. Hamilton’a. Na uwagą z polskich publikacji zasługuje „Ekonometria” autorstwa G.S. Maddali.

M. Wesołowska w swojej pracy „ O szeregach czasowych i ich prognozowaniu” dzieli współczesne badania szeregów czasowych na pięć klasycznych technik badawczych, stosujących (Wesołowska 2008):

 schematy autokorelacji i średnich ruchomych, zaproponowane w wymienionej powyżej publikacji Box’a i Jenkins’a,

modele transfer-function, zakładające zależność między dwoma procesami stochastycznymi, zwykle modele ARIMA,

 filtry Wienera-Kołmogorowa, Kalmana, Kalmana-Bucy’ego,  metody wygładzania,

 techniki dekompozycji procesu.

Oprócz nich istnieje wiele nowych, rozwijanych metod (np. analiza falkowa). Analiza szeregów czasowych zwykle adaptuje nowe metody, powstające do analizy procesów stochastycznych oraz innych działów statystyki. W umieszczonych tutaj podrozdziałach będą omówione szerzej techniki badawcze wymienione powyżej,

(31)

31

a w rozdziale szóstym zostaną szerzej omówione niestandardowe metody zaadaptowane w pracy do badania szeregów czasowych.

3.1

R

EJESTROWANE DANE JAKO SZEREG CZASOWY

Szereg czasowy jest ciągiem obserwacji pokazującym kształtowanie się badanego zjawiska w kolejnych chwilach czasu. O konkretnych szeregach czasowych mówi się często, że są realizacjami pewnego procesu stochastycznego (stat.gov.pl). Zasadniczym czynnikiem kształtującym dane jest tu zmienna czasowa. Analiza szeregu czasowego, z uwagi na twierdzenie Fouriera może odbywać się na dwa sposoby, poprzez:

- analizę w dziedzinie czasu,

- analizę w dziedzinie częstotliwości.

Analiza w dziedzinie czasu polegać może na próbie wyodrębnieniu składowych szeregu. W szeregu czasowym może występować wiele składowych, łączonych addytywnie, multiplikatywnie, lub na sposób mieszany. Najogólniej, szereg czasowy składa się z trendu, składowych okresowych oraz nieregularnych (Box, Jenkins 1983, Larose 2008). W praktyce szereg można rozpisać także bardziej szczegółowo w następującej postaci (Kot et al. 2007):

Y=M+T+C+S+K+I+ξ (3.1)

gdzie: Y- szereg czasowy, M- stały przeciętny poziom zjawiska, T- trend (tendencja rozwojowa), C- cykle długookresowe, S- wahania sezonowe, K- wahania krótkookresowe, I- jednorazowe zmiany w szeregu czasowym wynikające z wpływu czynników zewnętrznych, ξ-składnik losowy.

Podejście częstotliwościowe natomiast traktuje szereg czasowy jako sumę pewnej liczby funkcji harmonicznych o różnych częstotliwościach oraz składnika losowego. Analiza danych polega tu na dekompozycji szeregu czasowego na poszczególne, istotne składowe harmoniczne (Chatfield 2004, Larose 2008).

(32)

32

3.2

O

PIS STATYSTYCZNY A DETERMINISTYCZNY

;

NIEPEWNOŚCI

POMIAROWE

Pierwszym krokiem analizy szeregów czasowych jest ustalenie, czy jest to szereg w istotnym stopniu deterministyczny, czy też raczej statystyczny. W przypadku, gdy szereg czasowy może być opisany za pomocą funkcji matematycznej, mamy do czynienia z deterministycznym szeregiem czasowym. Jest to rzadkość w praktycznych zastosowaniach, takich jak te omawiane w poniższej pracy. Wartości statystycznego szeregu czasowego można opisać jedynie za pomocą rozkładu prawdopodobieństwa. Wielkość statystyczna, zmieniająca się w czasie zgodnie z danym rozkładem prawdopodobieństwa, nazywa się procesem stochastycznym (Box, Jenkins 1983). Analizowanych w tej pracy szeregów czasowych w najmniejszym stopniu nie da się opisać deterministyczną funkcją matematyczną, dlatego można je rozważać jako realizacje procesów stochastycznych.

Szeregi czasowe parametrów oznaczanych w ściekach surowych można traktować jako realizację wielu zmiennych losowych z łączną funkcją prawdopodobieństwa. Można przypuszczać, że na kształtowanie się zmienności analizowanych szeregów czasowych mają wpływ zarówno procesy deterministyczne jak i ściśle losowe. Wysokość opadu oraz temperaturę można uznać za procesy deterministyczne, oczywiście w sensie zmiennej objaśniającej – danej. Parametry te (zmienne pogodowe) uznać za deterministyczne, jeśli nie będzie się rozważać błędów pomiarowych oraz błędu wynikającego z wpływu odległości stacji meteorologicznej od oczyszczalni ścieków, a właściwie od całego obszaru, z którego ścieki spływają. Ze względu na brak odpowiednich danych, jako procesy stochastyczne traktować trzeba ilość ścieków odprowadzanych przez przemysł i gospodarstwa domowe.

Na kształtowanie się obserwowanych wartości szeregów czasowych zawsze mają wpływ błędy pomiarowe. Różnica między wartością obserwacji, a rzeczywistą wartością mierzonej wielkości stanowi błąd pomiaru. Błędy klasyfikuje się jako przypadkowe, systematyczne oraz błędy grube (Maddala 2008). Ze względu na fakt, że nie znamy rzeczywistej wartości wielkości mierzonej, Międzynarodowa Norma Oceny Niepewności Pomiaru zaleca posługiwanie się terminem niepewność pomiarowa. Niepewność pomiarowa jest to parametr charakteryzujący w sposób ilościowy wątpliwości dotyczące wyniku pomiarowego. Estymatorem niepewności pomiarowej, dla dużej ilości prób jest odchylenie standardowe (Zeliaś et al. 2003, Maddala 2008). Wpływ na kształtowanie

(33)

33

wielkości szeregów czasowych mają więc procesy stochastyczne i deterministyczne, a także niepewność pomiarowa.

3.3

Z

AGADNIENIE STACJONARNOŚCI SZEREGÓW CZASOWYCH

Procesy stochastyczne będące ciągiem zmiennych losowych można opisać za pomocą rozkładu prawdopodobieństwa oraz jego parametrów. Dystrybuantę procesu stochastycznego określonego dla całkowitych wartości t można zdefiniować jako (Box, Jenkins 1983):

( ) ( ) (3.2) Podstawowe parametry procesów stochastycznych to:

Wartość oczekiwana procesu stochastycznego Xt:

( ) (3.3)

Wariancja procesu stochastycznego Xt:

( ) ( ) (3.4)

Funkcja autokowariancji procesu stochastycznego Xt:

( ) ( ) ( ) (3.5) Funkcja autokorelacji procesu stochastycznego Xt:

( ) ( ) ( ) √ ( ) ( )

( )

. (3.6)

Wynika z tego, że wartość oczekiwana i wariancja procesu stochastycznego mogą być funkcjami czasu. Natomiast funkcja autokowariancji i autokorelacji są kowariancją i korelacją między dwoma zmiennymi losowymi Xt i Xs. Obie funkcje są funkcjami dwuargumentowymi i zależą od t i od s.

Proces stochastyczny będący w szczególnym stanie równowagi statystycznej jest procesem stacjonarnym (Chatfield 2004). Ściśle stacjonarny proces można zdefiniować jako taki, którego własności nie ulegają zmianie, w zależności od wyboru początku osi czasu. Z założenia stacjonarności wynika, że rozkład prawdopodobieństwa jest ten sam dla wszystkich momentów. Dlatego też proces stacjonarny ma stała wartość średnią oraz wariancję (Box, Jenkins 1983, Chatfield 2004). Taką stacjonarność określa się jako stacjonarność w węższym sensie. Ma ona miejsce, jeśli dla n= 1,2,... i dla dowolnych t1 i t2,…, tn oraz τ zachodzi warunek (Kot et al. 2007):

(34)

34

( ) ( ) ( ) ( ) (3.7)

W przypadku procesów stacjonarnych w węższym sensie wartość oczekiwana i wariancja mają stałą wartość, a funkcja autokorelacji i autokowariancji zależą tylko od odległości τ. W tym przypadku funkcje te są jednoargumentowe. Charakterystyki procesów stochastycznych stacjonarnych kształtują się jak poniżej (Maddala 2008):

( ) . ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) √ ( ) ( ) ( ) ( ) (3.8) Częściej jednak zachodzi konieczność posłużenia się pojęciem słabej stacjonarności lub stacjonarności w szerszym sensie. W takim przypadku momenty spełniają założenia zestawu równości (3.8). Gdy jeden z wymienionych powyżej warunków nie jest spełniony to proces ma charakter niestacjonarny (Box, Jenkins 1983, Maddala 2008).

Badanie stacjonarności w sensie szerszym szeregów czasowych przeprowadza się z użyciem testów: Dickeya-Fullera (DF), rozszerzonego testu DF (ADF) – Saida-Dickeya, oraz testu Kwiatkowskiego, Philipsa, Schmidta i Shina (KPSS) lub na podstawie funkcji autokorelacji (Tatarczak 2007, Maddala 2008).

Rozszerzony test Dickeya-Fullera jest testem pierwiastka jednostkowego. Hipoteza zerowa zakłada niestacjonarność badanego szeregu, spowodowaną przez występowanie pierwiastka jednostkowego. Alternatywna hipoteza zakłada stacjonarność szeregu. Przeprowadzenie testu polega na oszacowaniu regresji postaci (Kufel 2007, Maddala 2008):

(3.9) gdzie: - szereg obserwacji badanej zmiennej, k- liczba opóźnionych wartości przyrostów zmiennej, dobranych w celu wyeliminowania autokorelacji składnika losowego

.

Statystyka testu DF obliczana jest jako iloraz:

̌ ̌ (3.10)

W przypadku, gdy obliczona wartość statystyki jest większa niż odpowiednia wartość krytyczna, nie ma podstaw do odrzucenia hipotezy zerowej o niestacjonarności

(35)

35

badanego szeregu czasowego. Gdy obliczona wartość statystyki jest mniejsza od wartości krytycznej, przyjmujemy hipotezę alternatywną o stacjonarności szeregu czasowego (Syczewska 2005). Jeśli nie odrzucamy hipotezy o braku stacjonarności, należy wykonać test stacjonarności przyrostów (Maddala 2008):

∑ (3.11)

Testy ADF oraz KPSS wykonano w programie GRETL (Kufel 2007). W przypadku danych miesięcznych wybrano rzędy opóźnienia 12 oraz 24 kroki. Dla danych dobowych wykorzystano opóźnienia będące wielokrotnością 7. Wykonano trzy rodzaje testów w zależności od kształtu wykresu szeregu czasowego. Pierwszy z nich, dla danych z wyrazem wolnym, drugi dla danych z wyrazem wolnym i trendem liniowym oraz trzeci dla danych z wyrazem wolnym, trendem liniowym oraz trendem kwadratowym. Otrzymane p-wartości (p-value), przy założeniu prawdziwości hipotezy zerowej, są wyższe od założonego poziomu istotności α=0,05, w przypadku większości analizowanych szeregów czasowych. W tych przypadkach nie ma podstaw do odrzucenia hipotezy zerowej o niestacjonarności tych szeregów czasowych. Wartość testu ADF dla szeregów czasowych zawartości zawiesiny w ściekach surowych z oczyszczalni ścieków z Krakowa oraz Sandomierza jest niższa od założonej wartości krytycznej, dla wszystkich wersji testu. Wartość testu ADF dla danych z wyrazem wolnym, trendem liniowym i kwadratowym dla danych z oczyszczalni ścieków „Dębe” dla parametrów zawiesina, BZT5 oraz natężenia przepływu pozwala na odrzucenie hipotezy zerowej o niestacjonarności szeregów czasowych. Spośród 30 analizowanych szeregów czasowych o rozdzielczości miesięcznej, 5 wykazuje słabą stacjonarność. Pozostałe szeregi wystarczy jednokrotnie zintegrować w celu uzyskania stacjonarności, czyli przyrosty zmiennych są stacjonarne. Wartości testów ADF nie pozwalają na odrzucenie hipotezy zerowej o niestacjonarności dobowych szeregów czasowych natężenia dopływu ścieków do oczyszczalni w Krakowie, Sandomierzu oraz „Czajki” w Warszawie.

Drugim testem wykorzystanym do oceny stacjonarności szeregów czasowych był test Kwiatkowskiego, Philipsa, Schmidta i Shina (KPSS). Hipotezy, zerowa i alternatywna są tu odwrotnie ułożone niż w teście ADF. Jako estymator wariancji długookresowej przyjmuje się (Maddala 2008):

2 2 1 1 1 1 2 ˆ ( ) ( ) p N N t j t t j t j t j p e w p e e N N     

(3.12)

Cytaty

Powiązane dokumenty

Gazy szklarniowe powodują efekt cieplarniany, który niestety nie jest zja- wiskiem korzystnym dla naszego globu. Dlatego też istotne jest dążenie do zmniejszania wielkości

W stanie faktycznym kazusu nie wskazywano, że mobilny pawilon miał być w szczególny sposób wbudowany w grunt (wbrew swojemu przeznaczeniu, z przebudową jego konstrukcji), a więc

- poręczenia bankowego w wysokości: …... zł, zostanie zwrócone WYKONAWCY w terminie 30 dni od daty odbioru końcowego, pozostała część zabezpieczenia tj. zł

kładach oprócz ścieków popr odukcyjnyc h powsta j ą dość znaczne ilości śc iekó-w saoni• ta• myrch odp• rowadzane z budynków administracyjnych, na- tryskó w,

Jeżeli wartości tego stężenia nie można okr~ślić w sposób jednoz nacz ny, to za miarodajne przyjmuje się wi elkości pochodzące z ostatnich 2 lat, których

Realizowana przez gabinet rządowy Akcji Wyborczej Solidarność oraz Unii Wolności pod koniec lat dziewięćdziesiątych XX wie- ku koncepcja „czterech reform” (systemu

4) Zamawiający w razie odstąpienia od umowy z przyczyn, za które Wykonawca nie odpowiada, obowiązany jest do dokonania odbioru robót przerwanych oraz przejęcia od Wykonawcy

Pr- zyrównanie mapy podatnoœci wód podziemnych na zanie- czyszczenia oraz mapy zawartoœci stê¿eñ azotanów na ob- szarze badañ wskazuje na bardzo œcis³y zwi¹zek podatnoœci