• Nie Znaleziono Wyników

Dane surowe

W dokumencie Index of /rozprawy2/10465 (Stron 80-85)

5. A NALIZA DANYCH MIESIĘCZNYCH

5.2.1 Dane surowe

Żaden wynik pomiaru nie jest równy dokładnie wartości rzeczywistej, można go więc przedstawiać jako przedział na osi liczbowej, wewnątrz którego, z zadanym prawdopodobieństwem znajduje się wartość prawdziwa. Dotyczy to również średniej z wyników pomiarów, choć wtedy dysponujemy dodatkowym źródłem wiedzy o niepewności (obserwowanym rozrzutem). Stosuje się tu różne miary statystyczne. Na Rys 5.3 i 5.4 przedstawione zostały przykładowe wykresy wartości średnich analizowanych szeregów czasowych dla poszczególnych miesięcy wraz z przedziałami niepewności zdefiniowanymi jako błąd standardowy, czyli niepewność średniej (na poziomie ufności 68%).

Wykresy średnich miesięcznych z ośmiu lat dla analizowanych parametrów wykazują zmiany w natężeniu zjawiska. Dla pięciodobowego biochemicznego zapotrzebowania na tlen wydaje się charakterystyczne, dla wszystkich stacji, obniżenie wartości średniej na początku każdego roku oraz w miesiącach letnich. Istotna statystycznie jest różnica między pierwszymi trzema miesiącami w roku, a miesiącami od kwietnia do czerwca, dla danych uzyskanych z oczyszczalni ścieków „Dębe”. Ze względu na nie spełnione założenie o rozkładzie normalnym (test Shapiro-Wilka) wykonano test alternatywny do testu t-Studenta, w celu określenia istotności wartości średnich dla dwóch grup danych.

Wybrano test U Manna-Whitney’a, który jest najmocniejszą nieparametryczną alternatywą dla testu t dla prób niezależnych.

81

Tabela 5.1. Test U Manna-Whitney’a istotności różnic wartości średnich dla szeregu czasowego BZT5 z oczyszczalni ścieków „Kujawy”

Suma rang - A Suma rang - B U Z p N ważn. - A N ważn. - B 246,5 419,5 75,5 -2,72 0,0065 18 18 gdzie:

U- wartość statystyki testowej Manna-Whitney’a dla małych liczebności (<20), Z- przybliżenie normalne statystyki U, p- p-wartość.

Jak widać test U Manna-Whitney’a (tabela 5.1) pozwala zdecydowanie odrzucić hipotezę H0 o równości średnich, na poziomie istotności 0,05, ze względu na niemal o rząd wielkości niższą p-wartość. Test U Manna-Withney’a przeprowadzono także w celu sprawdzenia istotności różnic w wartościach średnich pomiędzy miesiącami od kwietnia do lipca włącznie, a miesiącami od sierpnia do grudnia włącznie dla szeregu czasowego biochemicznego zapotrzebowania na tlen w okresie pięciodobowym z oczyszczalni ścieków w Sandomierzu (tabela 5.2). P-wartość, przy hipotezie zerowej o równości średnich wynosi 0,00006, należy więc przyjąć hipotezę alternatywną, oznaczającą, że na początku roku poziom BZT5 jest niższy.

Tabela 5.2. Test U Manna-Whitney’a istotności różnic wartości średnich dla szeregu czasowego BZT5 z oczyszczalni ścieków w Sandomierzu

Suma rang - A Suma rang - B U Z p N ważn. - A N ważn. - B 726 1485 230 -4,01 0,000061 31 35

Natomiast nie można odrzucić hipotezy zerowej w przypadku różnicy w wartościach średnich dla dwóch grup danych, z których pierwsza zawierała miesiące od stycznia do marca, a druga grupa zawierała miesiące od sierpnia do grudnia. W tym przypadku wartość Z testu U Manna-Whitney’a wynosiła -1,77, co daje p-wartość 0,076.

Przebieg zmienności średniej wartości chemicznego zapotrzebowania na tlen nie wykazuje wspólnych elementów dla analizowanych oczyszczalni ścieków. Istotnie statystycznie różni się wartość średnia parametru ChZT dla oczyszczalni w Sandomierzu obliczona dla pierwszych siedmiu miesięcy roku od wartości średniej pozostałych

82

miesięcy. Wartość testu U MannaWhitney’a, widoczna jest w Tabeli 5.3 i wynosi ona -4,46 (p=0,000008), można więc odrzucić hipotezę zerową o równości wartości średnich.

Tabela 5.3. Test U Manna-Whitney’a istotności różnic wartości średnich dla szeregu czasowego ChZT z oczyszczalni ścieków w Sandomierzu

Suma rang - A Suma rang - B U Z p N ważn. - A N ważn. - B 8059 3722 1038 -4,46 0,000008 118 35

W powyższych testach badano zgodność średnich dla grup miesięcy wyznaczonych na podstawie właśnie niezgodności średnich, a nie niezależnie. Jest to postępowanie, w zasadzie nieprawidłowe, jednak otrzymane p-wartości są tak niskie, a grupy miesięcy są spójne, że można chyba pozostać przy wyciągniętych wnioskach, przynajmniej na zasadzie analizy eksploracyjnej.

Zawartość w ściekach substancji oznaczanych parametrem ChZT maleje w okresie letnim. Wzorzec ten został zaobserwowany na wykresach z oczyszczalni ścieków w Krakowie, Tarnobrzegu oraz Warszawie „Czajce”. Największa różnica w wartościach średnich dla tego parametru występuje w największej oczyszczalni ścieków i tam wartość średnia obliczoną dla miesięcy lipca i sierpnia różni się istotnie od wartości średniej obliczonej dla pozostałych miesięcy w roku. W przypadku oczyszczalni ścieków w Tarnobrzegu osiągnięto podobny wynik, za to wynik testu U Manna-Whitney’a nie potwierdził wzorca widocznego na wykresie dla danych z oczyszczalni ścieków „Kujawy” w Krakowie.

Podobnie, cechą charakterystyczną dla przebiegu wartości średniej azotu ogólnego jest obniżenie wartości tego parametru dla miesięcy letnich. Wyjątek od tej reguły stanowi przebieg średniej wartości tego parametru dla danych uzyskanych z najmniejszej oczyszczalni ścieków, która zlokalizowana jest w Serocku i przyjmuje ścieki z Warszawy oraz gminy Serock. W przypadku wartości średnich obliczonych dla fosforu ogólnego, za wyjątkiem oczyszczalni ścieków w Sandomierzu, wykresy mają podobny do siebie, monotonny kształt, bez wyraźnych zmian wartości średniej. Odmiennie przebiega wykres wartości średniej dla tego parametru dla danych z oczyszczalni ścieków w Sandomierzu, co jest widoczne na wykresie poniżej (Rys.5.3). W przypadku tej oczyszczalni dość wyraźnie zmienia się wartość średnia parametru, a także szerokość przedziału ufności

83

(miesiące od sierpnia do listopada wykazują większą zmienność pomiędzy różnymi latami). Jednakże wartość testu U Manna-Whitney’a wynosząca - 1,82 nie pozwala na odrzucenie hipotezy H0 przy standardowym poziomie istotności 0,05.

Rys. 5.3. Średnie miesięczne wraz z przedziałem błędu standardowego dla zawartości fosforu ogólnego w ściekach surowych z oczyszczalni w Sandomierzu.

Rozważając przebieg wartości średnich dla natężenia przepływu można zauważyć niższe wartości w okresie letnim. W przypadku dwóch oczyszczalni ścieków w Krakowie i Serocku nie zaobserwowano wyraźnych różnic w wartości średnich pomiędzy poszczególnymi miesiącami w roku. Wykres wartości średnich dla natężenia przepływu ścieków danych z oczyszczalni ścieków w Sandomierzu wykazuje wzrost natężenia przepływu ścieków w drugiej połowie roku, jednakże, jak wskazują szerokie przedziały ufności dla tych średnich, różnice pomiędzy tymi wartościami nie są istotne statystycznie. Istotnie różnią się wartości średnie obliczone dla pierwszej i drugiej połowy roku dla danych z oczyszczalni ścieków w Warszawie. Wartość Z testu U-Manna-Whitney’a (zmienna losowa praktycznie normalna) dla tych danych wynosi 3,62. Średnie wartości natężenia przepływu ścieków z oczyszczalni ścieków w Tarnobrzegu także wykazują istotne statystycznie różnice w zależności od pory roku. Najniższe natężenie dopływu ścieków do oczyszczalni zaobserwowano w miesiącach najcieplejszych, czyli od maja do sierpnia. Średnia wartość natężenia przepływu dla tych miesięcy rożni się istotnie od wartości średniej obliczonej dla pozostałych miesięcy.

Wykresy wartości średnich parametru „zawiesina” nie wykazują cech wspólnych dla wszystkich analizowanych oczyszczalni ścieków. Zawartość zawiesiny w ściekach

1 2 3 4 5 6 7 8 9 10 11 12 M iesiąc 10 11 12 13 14 15 16 17 S an dom ie rz P og Średnia Średnia±Błąd std

84

nieoczyszczonych wzrasta w marcu i kwietniu i maleje w miesiącach letnich w przypadku oczyszczalni ścieków „Kujawy” w Krakowie. Test U Manna-Whitney’a wykazał, że wartość średnia dla marca i kwietnia różni się istotnie od wartości średniej obliczonej dla pozostałych miesięcy roku. Wartość U testu Manna-Whitney’a dla danych z oczyszczalni ścieków w Krakowie nie pozwala na odrzucenie hipotezy H0 o równości średnich pomiędzy miesiącami letnimi: od czerwca do lipca, a pozostałymi miesiącami w roku.

Odwrotnie niż w przypadku danych z oczyszczalni „Kujawy” kształtuje się zmienność wartości średniej dla danych z oczyszczalni ścieków w Sandomierzu. Zawartość zawiesiny w ściekach surowych dla tej oczyszczalni rośnie w okresie od lipca do września a następnie powoli maleje do grudnia. Istotna statystycznie jest różnica między wartościami średnimi obliczonymi dla pierwszych siedmiu miesięcy w roku a pozostałymi.

W przypadku danych z oczyszczalni ścieków „Czajka” w Warszawie, zawartość zawiesiny w ściekach surowych rośnie w pierwszej połowie roku i osiąga maksimum dla maja, następnie maleje osiągając minimum w sierpniu. Dla tych danych można znaleźć niewielkie grupy składające się z dwóch lub trzech miesięcy. Grupy te różnią się istotnie od siebie pod względem wartości średniej oraz szerokości przedziałów ufności, np. grupa zawierające miesiące od marca do czerwca różni się istotnie od grupy zawierającej miesiące od sierpnia do października.

Zawartość zawiesiny w ściekach surowych dla danych z oczyszczalni ścieków „Dębe” w Serocku w pierwszych trzech miesiącach jest niska i osiąga minimum w marcu. Test U Manna-Whitney’a pozwala na obalenie hipotezy H0 o równości wartości średnich pomiędzy grupą zawierającą miesiące od stycznia do marca, a drugą grupą zawierająca pozostałe miesiące w roku.

Przebieg wartości średniej parametru „zawiesina” dla danych z oczyszczalni ścieków w Tarnobrzegu jest dość niestacjonarny. Wartości niskie poprzedzielane są wysokimi, bez możliwości sensownego wyznaczenia grup miesięcy. Wysokie średnie zawartości zawiesiny w ściekach surowych otrzymano dla miesięcy: marca, listopada i grudnia.

85

5.2.2 Modele średnich dla danych zestandaryzowanych w obrębie lat

W dokumencie Index of /rozprawy2/10465 (Stron 80-85)