• Nie Znaleziono Wyników

3. Metody badań cech fzykochemicznych wód

3.4. Metody statystyczne, wizualizacja danych

3.4. Metody statystyczne, wizualizacja danych

W celu scharakteryzowania jednej lub wielu zmiennych fzykochemicznych oraz identyfkacji czynników kształtujących ich czasowo-przestrzenną zmienność użyto powszechnie stosowanych w hydrochemii statystyk (wskaźników liczbo-wych). W opracowaniu wykorzystano miary położenia, zmienności i asymetrii (Stanisz 1998, 2000; Dobosz 2001; Koronacki, Mielniczuk 2001, Luszniewicz, Słaby 2001; Węglarczyk 2010). Spośród miar położenia najczęściej w opracowa-niu używane są: mediana (Me), średnia arytmetyczna (x –), minimum (min), mak-simum (max) oraz kwantyle (kwartyle: Q i Q ; decyle: D i D ). W celu 25% 75% 10% 90%

określenia zmienności cech diagnostycznych użyto miar dyspersji (rozproszenia), takich jak: rozstęp, rozstęp międzykwartylowy (IQR, interquartile range), współ-czynnik zmienności (Cv) zdefniowany jako iloraz odchylenia standardowego i średniej wyrażony w procentach. Skomplikowana budowa geologiczna uwidacz-nia się ekstremalnie dużymi różnicami stężeń i często asymetrycznym rozkładem wartości cech i dlatego częściej do interpretacji rozproszenia używano kwarty-lowego współczynnika zmienności (Ψ), który wyraża procentowy iloraz odchy-lenia kwartylowego i mediany [IQR/(2Me)]. Wstępna analiza statystyczna cech diagnostycznych została przeprowadzona przy pomocy wykresów pudełkowych (np. Aczel 2000; Stanisz 1998).

Według A. Macioszczyk (1976, 1990, 1987), dysponując odpowiednio liczną populacją danych empirycznych pochodzących z jednolitego obszaru, można uzyskać geometryczny obraz rozkładu populacji ze względu na badaną cechę diagnostyczną poprzez przedstawienie uporządkowanego szeregu rozdzielczego w postaci histogramu, diagramu lub diagramu kumulacyjnego (rozkładów empi-rycznych). Podczas badania diagramów rozkładu cech fzykochemicznych przy występowaniu rozkładów jednomodalnych można wyróżnić cztery podstawowe typy, które służą do dalszej interpretacji hydrochemicznej w zakresie np. genezy jonów czy też ustalenia tła i anomalii hydrochemicznych. Zaleca się, aby szero-kość przedziałów była tak dobrana, by histogram był wizualnie czytelny i w zwar-tej części wykresu miał 6–12 klas. Przedziały powinny mieć jednakową szerokość, skalę logarytmiczną stosowaną w wyjątkowych przypadkach, w wartościach gra-nicznych należałoby uwzględnić wartości normatywne. Szerokość przedziałów powinna uwzględniać również dokładność oznaczeń. W literaturze statystycznej można spotkać się z zaleceniem, aby w przedziale klasowym liczba elementów nie była mniejsza od 5 do 10 (Węglarczyk 2010). Spełnienie tych wszystkich postula-tów nie jest w praktyce możliwe, co można było zauważyć szczególnie w trakcie intensywnej dyskusji prowadzonej w latach 80. i 90. XX wieku, dotyczącej meto-dyki wyznaczania zakresu, tła i anomalii hydrochemicznych, podczas której przy-taczano argumenty zarówno natury matematyczno-statystycznej, jak i ograniczeń

wynikających z posiadanych materiałów hydrochemicznych (Macioszczyk 1976, 1987, 1990; Liszkowska 1989a, b; Roszak 1988).

Według S. Węglarczyka (2010), budując histogram (empiryczną funkcję gęsto-ści), którego kształt zależy od arbitralnie przyjętego przedziału klasowego, nie uzyskujemy jasnego poglądu co do liczby występujących mód. Ponadto, jak wyka-zali S. Węglarczyk, M. Kulig (2001) w publikacji O wyższości nieparametrycznego estymatora funkcji gęstości nad histogramem, histogram mimo swojej prostoty jest strukturą bardzo czułą zarówno ze względu na wybór liczby przedziałów klaso-wych, jak i wybór punktu początkowego, co może prowadzić do błędnych wnio-sków dotyczących poszukiwanego rozkładu i jego pewnych charakterystyk, np.

maksimum. S. Węglarczyk (1998) przedstawił alternatywny sposób bezpośredniej (nieparametrycznej) estymacji nieznanej funkcji gęstości na podstawie informa-cji zawartej w próbie losowej (danych empirycznych). Metoda ta daje wygładzony histogram (tj. empiryczną funkcję gęstości), a wielkość wygładzenia zależy od zadanego współczynnika gładkości h. Wartość h jest krytyczna dla metody, gdyż jeśli h jest zbyt małe empiryczna funkcja gęstości ukazuje zbyt dużo szczegółów, a jeśli h jest zbyt duże zbyt wiele szczegółów jest ukrytych. Spośród wielu metod znajdowania optymalnej wartości h S. Węglarczyk (1998, 2010) oraz S. Węglar-czyk, M. Kulig (2001) podają prostą regułę Silvermana (1986):

[2] h = 1,06 σ gdzie: √n

h – współczynnik gładkości,

σ – odchylenie standardowe z próby, n – liczebność próby.

Ten sposób wstępnej analizy danych – przy użyciu nieparametrycznej estyma-cji funkestyma-cji gęstości – jest bardziej obiektywny, ponieważ metoda nie jest czuła na szerokość przedziału oraz na wybór punktu początkowego, a maksimum funkcji gęstości jest precyzyjniej zlokalizowane.

Autor w opracowaniu, w celu identyfkacji rozkładu prawdopodobieństwa zastosował tę metodę do określenia kształtu rozkładu prawdopodobieństwa bada-nych cech 1018 źródeł tatrzańskich. Dwu-, trój- lub wielomodalność rozkładu sugeruje istnienie wielu subpopulacji badanej cechy.

Podany przykład ilustruje sposób badania empirycznej funkcji gęstości stęże-nia Mg2+ w źródłach. Badania realizowano kolejno w czterech etapach. W pierw-szej kolejności utworzono dla całej populacji (tj. 1018 źródeł) empiryczną funkcję gęstości prawdopodobieństwa (dalej w skrócie nazywaną funkcją gęstości) stę-żenia logarytmu Mg2+ z wartościami logarytmu stężenia zaznaczonymi na osi x (ryc. 3.7). Wstępnie można wyrazić opinię, iż stężenie Mg2+ (logarytm) ma roz-kład asymetryczny z ujemną skośnością, którą A. Macioszczyk (1976, 1987) nazywa

typem III; jest on jest słabo poznany,

zwykle powstaje w wyniku mieszania kilku populacji. Kształt funkcji jest wyraźnie dwumodalny, co sugeruje ist-nienie co najmniej dwóch subpopulacji.

Naturalny wydaje się podział na źródła drenujące trzon krystaliczny i część osadową (ryc. 3.8). W wydzie-lonych dwóch subpopulacjach źró-deł widoczna jest ujemna asymetria stężenia logMg2+ w przypadku źró-deł występujących w części osadowej, natomiast w źródłach występujących w trzonie krystalicznym pojawia się przesłanka, że jest to rozkład dwumo-dalny, z niewielką dodatnią asymetrią.

Bardziej rozproszone stężenie logMg2+ występuje w trzonie krystalicznym, o czym świadczy wartość rozstępu (oś x). W celu ułatwienia interpretacji wszystkie wydzielone indywidualne obrazy funkcji gęstości logMg2+ (trzon krystaliczny [TK] lub część osadowa [CzO]) posłużyły do skonstruowa-nia jednego zbiorczego wykresu, w tle którego jest wykres dla całej populacji (ogólnie); takie zestawienie ułatwia wykrycie ewentualnej wielomodalno-ści. Widać, że obraz gęstości funkcji dla stężeń logMg2+ wszystkich źródeł (ujemna skośność) ma odmienny cha-rakter niż dla źródeł w trzonie krysta-licznym (dodatnia skośność). Ta cecha stężenia logMg2+ dla całej populacji źródeł była „maskowana” poprzez

Rycina 3.8. Empiryczne funkcje gęsto-ści logarytmu stężenia Mg2+ w części osadowej (CzO) i trzonie krystalicznym (TK) na tle wszystkich źródeł

Rycina 3.7. Empiryczna funkcja gęstości logarytmu stężenia Mg2+ w wodach źródeł (z zaznaczonymi wartościami logMg2+ na osi x)

Rycina 3.9. Empiryczne funkcje gęstości logarytmu stężenia Mg2+ w części osado-wej podzielonej na trzy grupy źródeł (SW, SR, PP) na tle wszystkich źródeł

nałożenie się stężeń logMg2+ z dwóch różnych subpopulacji. Dodatkowo poja-wia się przesłanka, że prawdopodobnie występuje trzecia moda w całej popula-cji, a może ich być jeszcze więcej!

Na trzecim etapie, źródła w części osadowej podzielono na występujące w utworach serii wierchowych (SW), reglowych (SR) oraz paleogenie Pod-hala (PP). Łatwo zauważyć, że subpo-pulacje stężenia logMg2+ źródeł dre-nujących utwory SR i PP są bardzo do siebie podobne i prawdopodobnie mają dodatkowe subpopulacje, w kie-runku ujemnej skośności, charaktery-zujące się niższymi stężeniami logMg2+ (ryc. 3.9). Stężenie logMg2+ w źródłach drenujących SW jest niższe, a funkcja gęstości bardziej symetryczna.

Na ostatnim etapie badania funkcji gęstości stężenia logMg2+ ze względu na uwarunkowania litologiczne wyko-nano analogiczne obliczenia dla 16 grup źródeł opisanych w tabeli 3.4 i przedsta-wionych na rycinie 3.10. Warto zauważyć, że o ile na poprzednich etapach obliczeń liczba źródeł była relatywnie duża (naj-mniejsze n=64 dla PP), to w nawiąza-niu do budowy geologicznej pojawiają się grupy o małej liczbie źródeł (np.

n=7; czarne wapienie/łupki/uskok?).

W praktyce nie byłoby możliwe skon-struowanie żadnego obrazu gęstości funkcji przy pomocy popularnego histogramu. Oczywiście można założyć, że stężenie logMg2+ w rozpatrywanych grupach źródeł ma rozkład normalny lub lognormalny i obliczyć stosowne statystyki. W ocenie autora takie założenie odnośnie do źródeł drenujących stoki o tak skomplikowanej budowie geologicz-nej w obszarze wysokogórskim Tatr, jest jednak zbyt daleko idącym

uproszcze-Rycina 3.10. Empiryczne funkcje gęstości logarytmu stężenia logMg 2+ w wodach źródeł ze względu na uwarunkowania litologiczne

niem. Należy zatem analizować empiryczne funkcje gęstości prawdopodobień-stwa stężenia logMg2+ na każdym poziomie grupowania wód źródeł. Stężenie logMg2+ w większości z 16 grup źródeł uwidacznia występowanie generalnie symetrycznych obrazów gęstości funkcji. Niezwykle interesujący jest przypa-dek wspomnianej powyżej dwumodalności logarytmu stężenia Mg2+ w trzonie krystalicznym. Okazuje się, że zaproponowany podział źródeł sugeruje istnienie co najmniej trójmodalności; jedynie źródła drenujące alaskity/mylonity są silnie rozproszone. Także w części osadowej w wydzielonych grupach źródeł ujawniają się kolejne subpopulacje źródeł (np. stężenie logMg2+ w grupach źródeł drenu-jących dolomity lub wapienie itd.), niemniej jednak ograniczają się one do kilku lub kilkunastu źródeł. Niektóre grupy źródeł charakteryzuje duże rozproszenie stężenia logMg2+, np. źródła drenujące margle/wapienie czy też alaskity/mylonity oraz pozostałe. W ocenie autora trafne wydzielenie grup źródeł dla danej cechy diagnostycznej (zmiennej) ma miejsce wtedy, kiedy można je wyrazić w pro-stej formule: „im mniejsze rozproszenie zmiennej i bardziej symetryczny roz-kład, to pod względem genetycznym występuje bardziej jednorodne środowisko hydrogeochemiczne”, co dobrze ilustrują empiryczne funkcje gęstości logarytmu stężenia Mg2+ w związku z uwarunkowaniami litologicznymi (ryc. 3.11).

Na tym etapie badań ważne było wskazanie, czy w zakresie stężenia danej cechy diagnostycznej funkcja gęstości jest jedno-, dwu- czy wielomodalna, a także, w przypadku jednomodalności, czy jest symetryczna. W celu ułatwienia interpre-tacji pojedyncze funkcje gęstości zostały przedstawione na syntetycznym wykresie zbiorczym (ryc. 3.11), na którym ze względów technicznych nie jest możliwe przed-stawienie na osi x poszczególnych stężeń. Analiza wykresu zbiorczego logarytmu stężenia Mg2+ daje silną przesłankę do wskazania kilku mód, można więc przyjąć, że rozkład stężenia logMg2+ w źródłach TPN jest wielomodalny. Warto zauważyć, że nie można połączyć wód tych grup źródeł, które są bardzo podobne, czego wyrazem są pokrywające się pola funkcji gęstości (np. wapienie/piaskowce – 7;

margle/wapienie – 8; wapienie – 6 lub dolomity – 13; zlepieńce dolomitowe – 11). Taki sposób generalizacji, pozwalający zmniejszyć liczbę wydzielonych grup źródeł poprzez łączenie ich w większe grupy na poziomie pojedynczej cechy (logMg2+), jest niewłaściwy, ponieważ powstałaby nowa grupa źródeł, a wtedy należałoby od nowa obliczyć wszystkie statystyki. Policzone wartości współczynników rozpro-szenia powinny ulec zmniejszeniu, jednak z doświadczeń autora wynika, że nie zawsze ten oczekiwany efekt występuje, ponieważ istnieje wiele czynników, które nie są przedmiotem analizy, a mogą wpływać na wartość analizowanej cechy (np.

uwarunkowania geomorfologiczne, stopień pokrycia obszaru alimentacji źró-dła itd.). Zagadnienie znalezienia wspólnych wzorców jednocześnie dla wszyst-kich cech diagnostycznych w wielowymiarowej przestrzeni wykracza poza ramy niniejszego opracowania. Analogiczne wykonano i zinterpretowano obliczenia

Rycina 3.11. Empiryczne funkcje gęstości logarytmu stężenia Mg2+ na tle wszystkich źró-deł – wykres zbiorczy

dla pH, mineralizacji, przewodności, Ca2+, Na+, K+, HCO3, SO24, Cl, NO3, uzy-

skując kilkaset obrazów gęstości funkcji.

Grafczna interpretacja nawet bez charakterystyk liczbowych (skośności, kur-tozy, współczynnika zmienności) jest użyteczna, ponieważ na poziomie poje-dynczej cechy można dostrzec subpopulacje stężeń, a co za tym idzie, można się zastanowić, czy istnieje czynnik różnicujący. Można by też odrzucić pojedyncze subpopulacje i interpretować tylko główną populację jako tę, która właściwie odzwierciedla stężenie jonu. A. Macioszczyk (1976) postuluje, aby w żadnym

wypadku nie odrzucać z dalszych badań pojedynczych oznaczeń anomalnych, ponieważ mogą one zawierać informacje o istnieniu lokalnych, nierozpoznanych jeszcze warunków hydrogeochemicznych. Na tym etapie badań autor nie wyklu-czył żadnego źródła, np. dolomity (13), ponieważ nie ma żadnego przyrodniczego uzasadnienia, aby nietypową wodę lub wody (subpopulację) traktować jako

„przeszkadzające”. Nietypowe źródła charakteryzujące się na obszarze o tak skom-plikowanej budowie geologicznej wysoką wartością lub stężeniem, np. grupa wód o niezwykle wysokich stężeniach SO24, traktuje jako zadanie badawcze.

Przy badaniu związku dwóch zmiennych zwykle wykorzystuje się współczyn-nik korelacji liniowej do określenia istotności, siły i kierunku współzależności.

Miara ta jest użyteczna wtedy, kiedy zmienne mają rozkłady zgodne z normalnym lub są co najmniej symetryczne. Warunek ten jednak w badaniach przyrodni-czych częściej nie jest, niż jest spełniony (Reimann, Filzmoser 2000). Pokazany na rycinie 3.12 przykład badania relacji dwuwymiarowej stężenia Ca2+, Mg2+, Na+, SO24 w 1018 źródłach uwidacznia jej niezwykłe skomplikowanie. Niekiedy uzy-skanie istotnego, bardzo wysokiego współczynnika korelacji może być wynikiem

„pozornym”, dlatego autor w opracowaniu korzystał z tej miary tylko w odniesie-niu do związku przewodności z mineralizacją.

W zastosowanych wielowymiarowych analizach statystycznych – korelacji, czynnikowej (FA), składowych głównych (PCA), wariancji (ANOVA) – zmienne powinny być zgodne z rozkładem normalnym (Łomnicki 1999) oraz powinny być standaryzowane (Ostasiewicz 1999). Zgodność zmiennych empirycznych (cech fzykochemicznych i stanu wody (lub przepływu) z rozkładem normalnym spraw-dzono przy pomocy testu Kołmogorowa–Lillieforsa (STATISTICA 9.0). Gdy analizowane zmienne okazywały się niezgodne z rozkładem normalnym, były transformowane – zwykle poprzez użycie logarytmu dziesiętnego. Jeśli rozkłady zmiennych pomimo zlogarytmowania w dalszym ciągu nie były zgodne z roz-kładem normalnym, to do dalszych obliczeń wybierano zmienną, która charak-teryzowała się wartością współczynnika skośności bliższą zeru, czyli taką, której rozkład był bardziej symetryczny.

Analizę czynnikową oraz analizę składowych głównych zastosowano w celu wykrycia struktury i ogólnych prawidłowości w związkach między zmiennymi oraz do identyfkacji i interpretacji nowych (ortogonalnych) przestrzeni zdefnio-wanych wyodrębnionymi czynnikami. Czynniki w analizie czynnikowej wyod-rębniono metodą składowych głównych. W interpretacji uwzględniono tylko te czynniki, które zgodnie z kryterium Kaisera mają wartości własne większe od jedności (Stanisz 2007). A. Macioszczyk (1975) zauważa, że w praktycznych rozważaniach hydrogeochemicznych wystarczy ograniczyć się najwyżej do kilku (3–4) czynników i należy rozpatrywać te, które mają wartości większe od jedności, a ich procentowy udział przekracza 10% ogółu wariancji.

Wygładzony histogram dwóch Izolinie jednakowych wartości Wykres (x,y) Histogram dwóch zmiennych zmiennych (nieparametryczny funkcji gęstości estymator funkcji gęstości)

Oś x logMg Oś x logCa

Oś x logCa

Oś y logNa Oś y logMg

Oś y logSO

4

Rycina 3.12. Analiza wybranych relacji dwuwymiarowych stężeniaCa 2+ , Mg 2+ , Na+ oraz S O 42

Jednoczynnikowa analiza wariancji (ANOVA) posłużyła do określenia istot-ności różnic średnich wartości cech między wydzielonymi grupami. Warunek jednorodności wariancji w wydzielonych grupach został sprawdzony testem Levene’a lub Browna–Forsythe’a. W celu porównania średnich międzygrupo-wych i wewnątrzgrupomiędzygrupo-wych zastosowano statystykę F Snedecora. Następnie, w celu zidentyfkowania, które spośród nich różnią się istotnie, zastosowano test post-hoc Schefego (Stanisz 1998). W przypadku niespełnienia założeń analizy wariancji stosowano jej nieparametryczny odpowiednik – test ANOVA Kru-skala–Wallisa, który bada nieistotność różnic między medianami.

Analiza skupień została zastosowana do wydzielenia najbardziej podobnych (jednorodnych) grup zmiennych (cech). Za miarę podobieństwa przyjęto odle-głość euklidesową i wykorzystano hierarchiczną metodę grupowania Warda.

W tej metodzie, podobnie jak w innych metodach klasyfkacji obiektów wielo-wymiarowych, nie ma jednoznacznej reguły ustalenia liczby skupień, na które należy podzielić badane obiekty. Decydującą rolę odgrywa intuicja autora, jego doświadczenie i znajomość badanych obiektów. Ścisłe stosowanie formalnych reguł podziału nie zawsze prowadzi do uzyskania zadowalającej liczby wewnętrz-nie jednorodnych skupień. W praktyce przy ustalaniu liczby skupień ważnym aspektem jest to, w jakim stopniu uzyskane skupienia poddają się interpretacji (Stanisz 2007).

Do podziału obiektów na grupy (skupienia – S) charakteryzujące się podobną zmiennością określonej cechy w ciągu roku zastosowano regułę R. Mojeny (1977), według której poziom „odcięcia” wyznacza odległość wiązania, dla której speł-niona jest nierówność:

[3] d i+1 > d + kss d gdzie:

di+1 – odległość wiązania dla i+1 etapu łączenia obiektów w skupienie,

d oraz ss d – odpowiednio: średnia i odchylenie standardowe odległości wiązań di, k – stała; R. Mojena (1977) sugerował k w zakresie 2,75–3,5, natomiast G.W. Milli-gan, M.C. Cooper (1985) – 1,25 (za: Stanisz 2007).

Analizę sezonowości hydrochemicznej oparto na unitaryzowanych średnich miesięcznych wartościach cech. Transformacje przeprowadzono według równa-nia (Ostasiewicz 1999; Walesiak, Gatnar 2009):

xi –min {xi} [4] z = i max {xi i}– min {xi i i} gdzie:

zi – unitaryzowana wartość cechy w i-tym miesiącu, xi – średnia z wielolecia wartość cechy w i-tym miesiącu,

min {xi i} – najniższa ze średnich miesięcznych wartości cechy, max i {xi} – najwyższa ze średnich miesięcznych wartości cechy.

W wyniku zastosowanej transformacji zmienne (cechy) zostały tak przeskalo-wane, by w każdym punkcie miały jednakowy rozstęp i mieściły się w przedziale 0–1, gdzie zero oznacza wartość najniższą, a jeden wartości najwyższą. Unitaryzowane wartości cech pozwalają na relatywnie łatwe porównanie średnich przebiegów zmiennych (cech) różniących się bezwzględnymi wartościami o rzędy wartości.

Na przykład po wydzieleniu według dowolnego kryterium grupy zlewni i oblicze-niu dla nich średniego przebiegu zmienności danej cechy wystarczy wyskalować oś y w zakresie 0–1; wtedy kiedy w danym miesiącu wartość cechy jest zawsze naj-niższa, na wykresie ma wartość zero, a gdy jest zawsze najwyższa, ma wartość jeden, tak więc rytm (przebieg) zmienności hydrochemicznej jest łatwy do zauważenia.

W rozdziale 4 zamieszczono 13 rycin (ryc. 4.4–4.16), które w sposób synte-tyczny obrazują sezonową zmienność danej cechy. Na każdej z rycin znajdują się cztery różne wykresy: A – dendrogram, B – chemogram, C – tzw. mapa ciepła (heat map) (Biecek 2008) i D – wykres z podwójną osią y (z wyjątkiem stanu wody na ryc. 4.D – jedna oś y) przedstawiający chemogram (lewa oś) na tle hydrogramu (y – prawa oś), które ilustrują sezonowy przebieg jednej cechy (zmiennej):

A. Lewa górna część ryciny – dendrogram podzielony na grupy potoków odwad-niających zlewnie (skupienia – S) o podobnej wartości zmienności danej cechy;

kolorem podkreślono przynależność zlewni do danego skupienia, oś y to odle-głość euklidesowa (d) – wartość niemianowana.

B. Prawa górna część ryciny – średni przebieg danej cechy w wydzielonych grupach potoków; kolor linii jest zgodny z kolorem skupienia, oś y jest niemianiowana.

C.Lewa dolna część ryciny – zmienność, średnie miesięczne wartości danej cechy w 23 potokach i pięciu źródłach została uporządkowana zgodnie z dendrogra-mem (A), natomiast do przedstawienia zmienności cechy w potokach zastoso-wano tzw. mapy ciepła (heat map). Jest to forma grafcznej prezentacji danych, w której wartości zmiennej w dwuwymiarowej przestrzeni przedstawiane są za pomocą skali barw. Rycina w opracowaniu tworzy siatkę, której kolumny reprezentują kolejne miesiące, a wiersze odpowiadają poszczególnym obiektom hydrologicznym (potoki, źródła). Dobór skali barw jest subiektywny; w niniej-szym opracowaniu przyjęto podział na 20 klas. Najwyższa wartość ma barwę przesuniętą w kierunku widma czerwonego, przyjmując odcień ciemnoczer-wony, a najniższa jest przesunięta w kierunku barw chłodnych – odcień ciem-nogranatowy. Pozostałym wartościom przyporządkowano barwy w oczkach siatki z krokiem 1/18 części wartości danej cechy. Dla wszystkich cech fzykoche-micznych i stanu wody (lub natężenia przepływu potoku i wydajności źródła) barwy na mapach ciepła są standaryzowane.

D.Prawa dolna część ryciny – zmienność, średnie miesięczne wartości cechy w wybranych potokach i źródłach na tle unitaryzowanego stanu wody (lub przepływu tylko w przypadku Kościeliskiego Potoku i Białki, a w źródłach – wydajności). Liczba wykresów została uzależniona od liczby skupień, przy czym górny wykres przedstawia przykład średniego przebiegu danej cechy dla pierwszego skupienia zachowano identyczny kolor linii, natomiast kolejne wykresy dotyczą kolejnych skupień. Wybór reprezentanta jest arbitralny.

Na osi y (lewa) wartości danej cechy są rzeczywiste, natomiast z reguły na dru-giej osi y (prawa) przedstawiony jest także przebieg stanu wody, przepływu lub wydajności źródła, który jest wyrażony w jednostkach unitaryzowanych. Na wszystkich wykresach kolor linii jest jednakowy – niebieski (z wyjątkiem ryc. 4.4).

W opracowaniu średnie miesięczne wartości danej cechy obliczono na podsta-wie badań 2002–2004. W obliczeniach statystycznych przyjęto w testach statystycz-nych poziom istotności p=0,05. Dane empiryczne w odniesieniu do używastatystycz-nych metod były w zależności od założeń: kodowane, normalizowane, standaryzo-wane lub unitaryzostandaryzo-wane w programach (Statistica 9.0, Aquachem 5.0, Mathe-matica), a prezentację grafczną przygotowano w CorelDraw X5, ArcView 9.3.

Szczegóły zawarte są w tabelach i rycinach.

Analizę morfometryczną zlewni przeprowadzono w ramach projektu pt. Czyn-niki warunkujące zróżnicowanie przestrzenne i dynamikę chemizmu wód w Tatrzań-skim Parku Narodowym N305 081 32/2824 we współpracy z TPN. Wykorzystano dane będące w posiadaniu Sekcji do spraw Zarządzania Danymi Przestrzennymi:

numeryczny model terenu (NMT) z 2004 roku, mapy geologiczne (skala 1:10000;

1:30 000), warstwy obrazujące pokrycie terenu poniżej oraz powyżej górnej granicy lasu opracowane przez M. Guzika (2008) w ramach projektu MNiSzW (2 P04G 03028). Warstwy zostały poddane kontroli topologicznej w programie ArcGIS oraz ArcINFO.

W rozdziale 5 dotyczącym zróżnicowania przestrzennego cech fzykoche-micznych źródeł, przyjęto na rycinach za granicę przedziałów miary pozycyjne (kwartyle: Q i Q , Me, decyle: D i D ). Zastosowanie miar pozycyjnych 25% 75% 10% 90%

pozwala łatwo interpretować zróżnicowanie przestrzenne zmiennych różnią-cych się w wartościach bezwzględnych rzędami wielkości, dodatkowo zmienne charakteryzują się asymetrią rozkładu, zatem w tym przypadku proponowane wartości przedziałów są jednoznacznie zdefniowane. Duże znaczenie miał także aspekt grafczny, ponieważ tylko w ten sposób w tak małej skali można było czy-telnie przedstawić rozmieszczenie 1018 źródeł oraz wskazać generalne prawidło-wości. Przyjęto zasadę, że górny wykres przedstawia wartość cechy fzykoche-micznej (pH, mineralizacja, twardość ogólna i stężenie jonów), a dolny – udział (% mval·L-1) danego jonu w strukturze składu chemicznego wody.