• Nie Znaleziono Wyników

Hybrydowy system klasyfikujący w inteligentnym wspomaganiu zarządzania siecią wodociągową

N/A
N/A
Protected

Academic year: 2021

Share "Hybrydowy system klasyfikujący w inteligentnym wspomaganiu zarządzania siecią wodociągową"

Copied!
9
0
0

Pełen tekst

(1)

Uniwersytet Kazimierza Wielkiego

Streszczenie

W artykule przedstawiono badania dotyczące systemów klasyfikujących wbudo-wanych w system inteligentnego wspomagania zarządzania siecią wodociągową. Pierwsze badania dotyczyły opracowania klasyfikatorów pojedynczych, póĨniej kla-syfikatorów wielokrotnych, aby w ostatnim etapie pokazaü hybrydowy system klasy-fikujący. System hybrydowy nie tylko zawiera typowe przykłady klasyfikujące oraz wyjątki dla awarii i nieprawidłowoĞci w sieci, ale równieĪ preferencje uĪytkowników i odbiorców systemu. Pozwala to na optymalną klasyfikacjĊ wartoĞci ciĞnienia i przepływu wody w sieci wodociągowej, bo te wartoĞci są bardzo waĪne z punktu wi-dzenia zarządzania siecią wodociągową. Modele klasyfikujące pozwalają kontrolo-waü bieĪące wartoĞci i reagokontrolo-waü na nieprawidłowoĞci w sieci wodociągowej.

Słowa kluczowe: zarzdzanie miejsk sieci wodocigow, hybrydowy system klasyfikujcy, inte-ligentne wspomaganie

1. Wprowadzenie

Przedsibiorstwo wodocigowe w zakresie sieci wodocigowej powinno zajmowa si dystry-bucj wody dobrej jakoci w iloci gwarantujcej zaspokojenie potrzeb odbiorców, poprawn eks-ploatacj sieci wodocigowej zapewniajc właciwe cinienie w wzłach odbiorczych, sprawnym usuwaniem awarii oraz planowaniem i wykonywaniem prac zwizanych z konserwacj, moderni-zacj i rozbudow sieci [1]. Zarzdzanie sieci wodocigow jest trudnym i kompleksowym proce-sem, ze wzgldu na dynamik i stochastyczno zmian zachodzcych w sieci. Tego typu zmiany wymuszaj zastosowanie metod inteligencji obliczeniowej.

Problemy zarzdzania sieci wodocigow dotycz optymalizacji jej struktury i parametrów, energooszczdnej eksploatacji zapewniajcej poprawn dystrybucj wody o odpowiedniej jakoci, optymalizacji prac projektowych przy rozbudowie sieci, wykrywania i lokalizacji stanów awaryj-nych, opracowywania planów remontów sieci z uwzgldnieniem jej awaryjnoci, kosztów inwesty-cyjnych i eksploatainwesty-cyjnych.

W szczególnoci, wanym problemem jest energooszczdne zarzdzanie pompami w sieci oraz kontrolowanie poziomu wody w zbiornikach retencyjnych.

Na pocztku prowadzone były badania dotyczce analizy, czy cinienie i przepływ wody w sieci wodocigowej mieszcz si w normie, czy te nie. W tym celu opracowano modele klasyfi-kujce kontrolujce, czy te wartoci s w normie, czy te nie. W przypadku, gdy wartoci były po-za norm system ekspertowy sygnalizował potrzeb uruchomienia pomp. Opracowane modele kla-syfikujce były opracowane w postaci klasyfikatorów pojedynczych i wielokrotnych. Modele

(2)

stały przetestowane na danych rzeczywistych z miejskiego przedsibiorstwa wodno-kanalizacyjnego.

Jednak dalsze badania wykazały potrzeb budowy klasyfikatora hybrydowego, który w swojej postaci łczy oprócz typowych przypadków, wyjtków dotyczcych awarii dodatkowo preferencje uytkownika i odbiorcy systemu.

2. Modele klasyfikujce

Przeanalizowano róne metody analizy danych [2,3]. Specyfika wiedzy dotyczcej sieci wo-docigowej wykazała, e szczególnie interesujc metod analizy danych jest klasyfikacja. Klasy-fikacja jest problemem, w którym okrela si przynaleno obiektów do znanych kategorycznych klas. Proces przydziału danych do klas (klasyfikowanie) wykorzystuje tzw. klasyfikator. Klasyfika-tor jest pewnym modelem, którego parametry identyfikowane s w procesie uczenia pod nadzorem, w którym do celów uczenia dostpny jest treningowy zbiór danych (obiektów) oraz ich klas. Model ten jest po zakoczeniu procesu uczenia wykorzystywany do klasyfikacji nowych danych.

Opracowano szereg modeli klasyfikacyjnych w postaci: klasyfikatorów pojedynczych (drzew decyzyjnych) i klasyfikatorów wielokrotnych złoonych z drzew decyzyjnych. Obecnie dodano nowy klasyfikator hybrydowy, który przeprowadzi indukcj reguł na podstawie typowych przykła-dów, wyjtków i preferencji.

Modele porównywane s dla uzyskania optymalnej klasyfikacji. Modele zostały przetestowane na danych rzeczywistych z miejskiego przedsibiorstwa wodno-kanalizacyjnego. Opracowane kla-syfikatory pozwol na kontrolowanie w czasie rzeczywistym, czy przepływ i cinienie wody w sie-ci wodosie-cigowej s w normie. W przypadku nieprawidłowosie-ci zostan uruchomione odpowiednie procedury dotyczce pracy pomp.

Bazujc na modelach klasyfikacji inteligentny system wspomagania pozwala na tworzenie scenariuszy dla zarzdzania sieci wodocigow. Dlatego wbudowane modele ulepszaj zarzdza-nie sieci wodocigow.

Przygotowanie danych dla modeli klasyfikacji

Z punktu widzenia monitorowania działania sieci wodocigowej najwaniejsze s dwa para-metry, tj. cinienie i przepływ wody. Parametry te w celu poprawnego działania sieci wodocigo-wej musz mieci si w okrelonej normie. W zbiorze uczcym i testujcym naley okreli, czy mierzona warto parametru mieci si w normie, czy te nie. Dlatego metoda klasyfikacji jest w przypadku rozwizania tego problemu najbardziej przydatna.

Do budowy pliku uczcego i testujcego wykorzystano pomiary cinienia i przepływu z bazy danych monitoringu sieci wodocigowej. Dane pomiarowe zostały zebrane z trzech wzłów pomia-rowych. Plik uczcy i testujcy ma nastpujc budow:

atrybuty wejciowe: dzie tygodnia, dzie miesica, miesic, czas, przepływ, cinienie, − atrybuty wyjciowe: decyzja, czy warto pomiaru mieci si w normie, czy te nie.

W pierwszym etapie bada do utworzenia modeli wykorzystano dane zawierajce pomiary z okresu jednego miesica, od 20 pa dziernika do 19 listopada 2006 roku. W sumie dawało to 204370 rekordów. Uzyskane dane podzielono na dwa pliki. Pierwszy uczcy, zawierajcy 90% pomiarów oraz drugi testowy złoony z 10% pomiarów. Poniewa oba pliki zawieraj bardzo po-dobne dane, wic do pełniejszego przetestowania otrzymywanych modeli utworzono drugi plik testowy zawierajcy 100 rekordów z wartoci atrybutu decyzyjnego o wartoci „0” symulujcych

(3)

błdne pomiary lub sygnalizujce awari. W danych rzeczywistych warto cinienia wahała si pomidzy 3 a 3,6 [bar], a warto przepływu od 0 do około 1500 [m3/h].

Model pojedynczego klasyfikatora

Metoda indukcji drzew decyzyjnych pozwala na przyblienie funkcji klasyfikacyjnych o dys-kretnych wartociach wejciowych odnoszcych si do pewnych poj, klas decyzyjnych.

Dzisiaj drzewa decyzyjne stanow podstawow metod indukcyjnego uczenia si maszyn. Spowodowane jest to du efektywnoci, moliwoci prostej programowej implementacji, jak i intuicyjn oczywistoci dla człowieka. Ta metoda pozyskiwania wiedzy opiera si na analizie przykładów, przy czym kady przykład musi by opisany przez zestaw atrybutów, gdzie kady atrybut moe przyjmowa róne wartoci.

Drzewo decyzyjne jest to skierowany graf acykliczny, przy czym krawdzie takiego grafu na-zywane s gałziami, wierzchołki, z których wychodzi, co najmniej jedna krawd , nana-zywane s wzłami, a pozostałe wierzchołki - limi. Ponadto przyjmuje si, e w takim grafie istnieje tylko jedna cieka midzy rónymi wierzchołkami. Konstrukcj drzewa na podstawie zbioru przykła-dów, najprociej przedstawi w postaci algorytmu rekurencyjnego uruchamianego dla kadego wzła w drzewie.

Pierwszym krokiem algorytmu jest podjcie decyzji, czy rozpatrywany wzeł powinien sta si liciem kocowym drzewa wg kryterium stopu albo wzłem-rozgałzieniem.

Zaklasyfikowanie wzła jako li kocowy drzewa spowoduje zakoczenie algorytmu. Podj-cie decyzji, e dany wzeł staje si rozgałzieniem spowoduje wybór atrybutu (z dostpnej puli atrybutów) wg kryterium wyboru atrybutu. Nastpnie na podstawie wartoci, jakie przyjmuje wy-brany argument, z zestawu przykładów tworzone s kolejne wzły drzewa. Algorytm uruchamiany jest rekurencyjnie. Odpowiednia technika wyboru argumentu ma kluczowy wpływ na wygld drzewa decyzyjnego, gdy włanie od kolejnoci wyboru atrybutów zaley w głównej mierze gł-boko i stopie rozbudowy drzewa.

Wywołania rekurencyjne algorytmu tworzcego drzewo naley kiedy zakoczy, odpowiada za to włanie "kryterium stopu". Okrela ono czy dany wzeł drzewa powinien by traktowany jako kocowy li drzewa zawierajcy w swoim opisie etykiet klasy-decyzji.

Natomiast Kryterium wyboru atrybutu jest to w zasadzie najwaniejsza cz algorytmu, to od niej zaley kolejno wyboru atrybutów do zbudowania testu, na którego podstawie nastpi w w -le podział zbioru przykładów. W znaczcym stopniu wpływa to na pó niejszy wygld drzewa. Mona stwierdzi, e "dobrym" testem jest ten, którego uycie w w le spowoduje skrócenie cieki prowadzcej przez ten wzeł do lici wskazujcych klas decyzyjn.

Wybór odpowiedniego atrybutu ze zbioru atrybutów jest dokonywany dziki wprowadzeniu systemu ocen. System ocen atrybutów opiera si na załoeniu, i najbardziej "bezuytecznym" atrybutem jest taki, w którym rozkład czstoci wystpowania kolejnych klas-wyboru jest taki sam przed i po podziale zbioru danych przykładów wg ocenianego atrybutu.

Do tworzenia drzewa zostało wykorzystane kryterium wyboru na podstawie miary przyrostu informacji, które jest powizane z pojciem miary entropii (1) wywodzcej si z teorii informacji.

Niech S bdzie zbiorem uczcym zawierajcym przykłady nalece do jednej z k klas decy-zyjnych oznaczonych przez K1,...,Kk. Niech n bdzie liczb przykładów z S oraz ni niech oznacza

(4)

¦

=

=

k i i i

p

p

S

Ent

1 2

lg

)

(

(1)

gdzie pi jest prawdopodobiestwem, e losowo wybrany przykład z S naley do klasy Ki,

es-tymowanym jako ni/n. Podstawa logarytmu jest równa 2, poniewa entropia mierzy oczekiwan

liczb bitów do zakodowania informacji o klasyfikacji losowo wybranego przykładu ze zbioru S. W sytuacji analizowania klasyfikacji binarnej (k=2) entropia przyjmuje wartoci z przedziału [0, l]. Maksymalna warto równa l bdzie osigana wtedy tylko wtedy, gdy dla p1=p2=0,5, czyli

przypadek taki wystpi dla przykładów o równomiernym rozkładzie klas. Minimaln warto en-tropii, równ 0, osignie si, gdy wszystkie przykłady nale do tej samej klasy. Warto entropii mona interpretowa nastpujco: im warto entropii jest mniejsza, tym w zbiorze S wystpuje wiksza przewaga przydziału przykładów do jednej z klas nad pozostałymi klasami. Z miar entro-pii zwizana jest miara przyrostu informacji i wybiera si atrybut, dla którego wyliczono najwik-szy przyrost informacji.

W trakcie powstawania drzewa decyzyjnego istnieje ryzyko nadmiernego dopasowania do przykładów trenujcych. Drzewo decyzyjne skonstruowane w sposób opisany powyej moe oka-za si zbyt złoone i odzwierciedla przypadkowe zalenoci 'wystpujce w zbiorze przykładów, zwłaszcza, jeli jest on "zaszumiony" (zawiera mał ilo błdnych danych), dlatego oprócz samej konstrukcji drzewa uywa si te sposobów słucych do uproszczenia drzewa w taki sposób, aby zachowa jak najwiksz spójno ze zbiorem przykładów i zminimalizowa błd rzeczywisty (powstajcy podczas testowania obiektami nie nalecymi do zbioru przykładów). Takie algorytmy nosz potocznie nazw algorytmów przycinania.

Narzdzia wspomagajce analiz za pomoc drzew decyzji generuj diagram drzewa decyzji oraz statystyki klasyfikacji. Liczony jest łczny błd klasyfikowania (2). Jest on zdefiniowane jako:

.

test w ov

n

n

=

ε

(2)

nw – liczba błdnie sklasyfikowanych przykładów testowych, ntest – liczba przykładów

testo-wych

Klasyfikator jest dobry, jeli

ε

ov jest najniszy. Jeli my chcemy analizowa głbiej to mo-emy uy tzw. MC (ang.: confusion matrix), czyli tablicy, w której pokazane s wyniki klasyfika-cji wraz z rzeczywistymi kategoriami przypadków ze zbioru testowego [3]. Weryfikacj

przepro-wadza si w odniesieniu do zbioru przykładów testowych, które nie były czci zbioru uczcego. Przykłady testowe s klasyfikowane za pomoc klasyfikatora powstałego ze zbioru uczcego. Po-nadto dla przykładu testowego znana jest jego rzeczywista klasyfikacja. Pozwala to na porównanie proponowanej przez klasyfikator decyzji z rzeczywist i stwierdzenie, czy decyzja klasyfikatora jest poprawna, czy błdna.

Na podstawie klasyfikatora w postaci drzewa mog zosta automatycznie wygenerowane regu-ły decyzyjne, które zostan umieszczone w bazie wiedzy systemu ekspertowego.

Eksperymenty zwizane z tworzeniem modeli drzew decyzyjnych były parametryzowane dwoma parametrami: minimaln liczb przykładów tworzcych li drzewa oraz przycinaniem drzewa decyzyjnego.

(5)

Pierwszy parametr minimalna liczba przykładów tworzących liĞü drzewa zwizana jest z wła-snoci algorytmów uczenia si drzew decyzyjnych, w których poszczególne gałzie drzewa s rozbudowywane tak głboko, a przykłady w w le zostan zaklasyfikowane do pojedynczej klasy decyzyjnej, czyli pojedynczego licia. Strategia rozbudowywania gałzi drzewa w celu jedno-znacznego rozrónienia przykładów z rónych klas prowadzi do bardzo złoonych drzew nych. Dlatego mona okreli parametr, który zatrzymuje dalsz rozbudow gałzi drzew decyzyj-nych. W eksperymencie parametr minimalna liczba przykładów w liĞciach przyjmował wartoci: 1,2,5,10,25.

Natomiast drugi parametr przycinanie drzewa pozwala redukowa rozmiary drzewa. Idea po-stpowania polega na tym, e w pełnym drzewie decyzyjnym usuwa si pewne fragmenty (pod-drzewa) o niewielkim znaczeniu dla klasyfikacji obiektów. W eksperymencie ten drugi parametr przyjmował wartoci w zakresie: bez przycicia, 80%, 40%, 25%,15% , 5%, 2%.

Dla obu parametrów rozpatrywano procentowe wartoci błdnie zaklasyfikowanych rekordów z pliku testowego. Najlepsze rezultaty otrzymano w drzewach zawierajcych jeden przykład w li-ciu, czyli reguły tworzone dla kadego przykładu, oraz o parametrze przycicie drzewa równym 40%. Procentowa warto błdnie zaklasyfikowanych rekordów wyniosła 0,61% [4].

Na podstawie drzewa decyzyjnego zostały automatycznie wygenerowane reguły decyzyjne, które nastpnie umieszczone zostały w bazie wiedzy systemu wspomagania decyzji. W mar przy-bywania danych z kolejnych miesicy reguły bd aktualizowane.

Model klasyfikatora wielokrotnego

W ostatnich latach obserwuje si rosnce zainteresowanie tworzeniem złoonych systemów klasyfikujcych. Idea ta polega na integracji wielu pojedynczych algorytmów uczenia si w jeden system klasyfikujcy. Celem takiej integracji jest przede wszystkim osignicie lepszej trafnoci klasyfikacji od otrzymanej w rezultacie uycia oddzielnie pojedynczych klasyfikatorów wchodz-cych w skład systemu [3].

W latach dziewidziesitych powstało wiele prac dotyczcych złoonych systemów klasyfi-kujcych. Wyniki eksperymentalne potwierdzaj wzrost trafnoci klasyfikowania dla proponowa-nych systemów. Integracja jednorodproponowa-nych lub rónorodproponowa-nych klasyfikatorów (lub algorytmów ucze-nia si) moe by przeprowadzona rónymi sposobami.

Jedn z dwóch głównych kategorii złoonych systemów klasyfikujcych s systemy wielokrot-ne. Pojcie systemu wielokrotnego (odpowiednik terminu angielskiego multiple model, multiple classifier lub ensemble of classifiers) odnosi si do zbioru pojedynczych klasyfikatorów, których odpowiedzi s zagregowane do jednej odpowiedzi całego systemu. Klasyfikatory składowe mog by jednorodne (homogeniczne) lub rónorodne (heterogeniczne). W pierwszym przypadku klasy-fikatory uczone s na zrónicowanych danych. Zasadnicze pytanie dotyczy sposobów budowania złoonych systemów, tak aby pozwalały na osignicie wyszej trafnoci klasyfikacji ni klasyfika-tory składowe działajce oddzielnie.

Agregacja odpowiedzi pojedynczych klasyfikatorów w globaln odpowied systemu dokony-wana jest w sposób grupowy albo specjalizowany. W pierwszym sposobie wszystkie klasyfikatory bior, udział w wypracowaniu decyzji kocowej dla nowego obiektu. W drugim sposobie wyzna-cza si te klasyfikatory, których specjalizacja obejmuje charakterystyk klasyfikowanego obiektu. Sama agregacja realizowana jest najczciej poprzez głosowanie proste (głos kadego klasyfi-katora ma równy priorytet) lub waone.

(6)

Istnieje wiele sposobów tworzenia złoonych systemów klasyfikujcych. Cz z nich polega na modyfikowaniu danych uczcych dla poszczególnych jednorodnych klasyfikatorów, inne zakła-daj rónicowanie samych modeli klasyfikujcych.

Systemy wielokrotne dziel si na klasyfikatory oparte na: − zrónicowanych klasyfikatorach

o Generalizacja stosowa (Stacking) - Jest to model hierarchicznego, wielowarstwowego klasyfikatora złoonego zaproponowany przez Wolperta. Klasyfikatory składowe pierwszej warstwy uczone s na oryginalnych danych, a ich odpowiedzi s danymi wejciowymi do kolejnej warstwy. W ostatniej warstwie umieszczony jest pojedyn-czy klasyfikator wypracowujcy ostateczn decyzj. Klasyfikatory wyszych warstw staraj si minimalizowa błdy popełniane przez klasyfikatory z niszych warstw. − jednorodnych klasyfikatorach

o Technika bagging - Model wprowadzony przez Breimana wykorzystuje ide powie-lania zbioru uczcego za pomoc wielokrotnego próbkowania technik "bootstra-ping". Kady powielony zbiór ma t sam wielko, co oryginalny, lecz w wyniku próbkowania niektóre przykłady uczce s kopiowane, podczas gdy inne nie mog si wielokrotnie powtórzy. Z kadego z tych zbiorów generuje si klasyfikator tym sa-mym algorytmem uczcym. Odpowiedzi klasyfikatorów s agregowane poprzez pro-ste głosowanie.

o Technika "boosting" - Podana została poprzez Freunda i Schapirego. Idea metody po-lega na skojarzeniu z kadym obiektem uczcym wagi, której warto odzwierciedla jego istotno. Algorytm uczenia si uruchamiany jest iteracyjnie nad modyfikowa-nym zbiorem uczcym. Modyfikacje dotycz zmiany wag w kolejnych kopiach zbio-ru uczcego, które skupiaj działanie algorytmu uczcego wokół tzw. tzbio-rudnych przy-kładów, dla których klasyfikatory popełniały błdy w poprzednich iteracjach. Odpo-wied kocowa systemu opiera si na waonym głosowaniu (tutaj wagi głosujcych klasyfikatorów uzalenione s od błdów popełnianych przez odpowiednie klasyfika-tory składowe).

Kolejno opracowano klasyfikatory wielokrotne w celu poprawienia dokładnoci klasyfikacji. Uyto nastpujcych klasyfikatorów wielokrotnych: AdaBoost, LogitBoost, RacedIncremental-LogitBoost, FilteredClassifier, Bagging, Stacking, AttributeSelectedClassifier, OrdinalClassClas-sifier, RandomCommittee.

Do oszacowania skutecznoci klasyfikatorów wykorzystano technik 10-krotnej oceny krzy-owej.

Porównano wybrane klasyfikatory wielokrotne ze wzgldu na: − prawidłowo zaklasyfikowane przykłady,

− nieprawidłowo zaklasyfikowane przykłady, − prawidłowo zaklasyfikowane przykłady w %, − nieprawidłowo zaklasyfikowane przykłady w %, − redni błd absolutny,

− pierwiastek błdu redniokwadratowego, − wraliwo,

(7)

Porównanie klasyfikatorów pojedynczych z wielokrotnymi wykazało lepsze cechy klasyfiko-wania u klasyfikatorów wielokrotnych. Najlepszym klasyfikatorem okazał si RandomCommittee, który prawidłowo klasyfikował w 100%.

3. Hybrydowy system klasyfikujcy

Z punktu widzenia inteligentnego wspomagania zarzdzania sieci wodocigow naleało do-datkowo opracowa preferencje uytkownika i odbiorcy systemu [5], a pó niej naleało je doda do hybrydowego systemu klasyfikujcego.

Motywacje dla tworzenia systemów hybrydowych wynikaj z obserwacji, e dla kadego algo-rytmu uczcego istnieje pewna klasa problemów, dla których jest skuteczny. Dla pozostałych pro-blemów algorytm moe by mniej skuteczny od innych algorytmów. Ponadto niektóre dane uczce mog mie złoon struktur wymagajc modelowania wicej ni jedn form reprezentacji wie-dzy. W tych sytuacjach mona tworzy system hybrydowy, który przyblia róne obszary danych za pomoc rónych reprezentacji. W rezultacie synergii połczonych modeli cały system ma dzia-ła skuteczniej. Badania nad tworzeniem rónych systemów hybrydowych zapocztkowano ju w latach osiemdziesitych. Istnieje wiele propozycji łczcych np. paradygmaty uczenia si drzew decyzyjnych czy reguł decyzyjnych z uczeniem si na wczeniej zapamitanych przypadkach lub z uczeniem si sieci neuronowych [3].

Motywacje do zbudowania systemu hybrydowego łczcego w sobie typowe przypadki, wy-jtki oraz preferencje wynikaj z obserwacji i oczekiwa odbiorców systemu.

Załoeniem jest, aby system inteligentnego wspomagania uczył si jak i wspomagał podejmo-wanie właciwej decyzji i działania ju z uwzgldnieniem nie tylko typowych przypadków, czy tez nieprawidłowoci zachodzcych w sieci traktowanych jako wyjtki, ale te preferencje operatora sieci jak i odbiorcy wody. W ten sposób system bdzie miał moliwo generowania scenariuszy zarzdzania sieci wodocigow w optymalny sposób, z uwzgldnieniem preferencji odbiorców i uytkowników systemu ju na etapie najwczeniejszym działania systemu, z moliwoci przewi-dywania jak i reagowania na sytuacje nietypowe.

Na rys. 1 przedstawiona została propozycja hybrydowego systemu klasyfikujcego. Nowe przykłady przybywaj i s gromadzone w zbiorze przykładów. Te przykłady gromadzone s na podstawie monitoringu sieci wodocigowej. Nastpnie zbiór przykładów naley podzieli na wy-jtki, typowe przykłady i preferencje. Zbiór preferencji powstaje na podstawie przewidywania ob-cienia sieci wodocigowej i poboru wody. Podział zbioru przykładów moe wynika z sugestii eksperta, czy analizy statystycznej (np. moe by rezultatem analizy skupie). Po dokonaniu po-działu zbioru przykładów naley przeprowadzi indukcj reguł typowych przykładów, wyjtków oraz preferencji, wykorzystujc najlepszy opisany wczeniej algorytm indukcji drzew decyzyjnych. Nowy przykład klasyfikowany jest jako wyjtek, typowy przypadek lub preferencja i nastpnie uruchamiane s procedury działania z odpowiednim priorytetem.

(8)

Rys. 1. Hybrydowy system klasyfikujący 4. Uwagi kocowe

Proponowany hybrydowy system klasyfikujcy pozwala na optymaln klasyfikacj pomiarów zbieranych z sieci wodocigowej. Klasyfikuje on nie tylko typowe przykłady klasyfikacyjne, wy-jtki dotyczce awarii, ale równie preferencje uytkowników i odbiorców systemu inteligentnego wspomagania zarzdzania sieci wodocigow. Opracowanie takiego systemu klasyfikujcego moliwe było dziki przeprowadzeniu wczeniej bada dotyczcych opracowania modeli klasyfi-kacyjnych w postaci pojedynczych i wielokrotnych klasyfikatorów, modeli predykcji i modeli pre-ferencji. Wykorzystanie inteligencji komputerowej pozwala automatyzowa wiele procesów za-chodzcych w sieci wodocigowej, a przez to zmniejsza udział czynnika ludzkiego w tych czynno-ciach, czyli udział operatora sieci.

Kolejny etap rozbudowy systemu bdzie dotyczył opracowania metod i modeli reagowania na awarie w miejskiej sieci wodocigowej, w szczególnoci na wycieki. W przypadku sygnalizacji alarmu, system powinien wskaza przyczyn awarii i uruchomi odpowiedni procedur działania.

(9)

Bibliografia

1. Studziski J., Bogdan L.: Informatyczny system wspomagania decyzji do zarzdzania, sterowania operacyjnego i planowania miejskiego systemu wodno-ciekowego. W: Stu-dziĔski J., Drelichowski L., Hryniewicz O. (Red.): Rozwój i zastosowania metod iloĞcio-wych i technik informatycznych wspomagających procesy decyzyjne, Instytut Bada Sys-temowych Polska Akademia Nauk, Badania Systemowe 49, Warszawa 2006.

2. Michalski R.S., Bratko I., Kubat M.: Machine learning and data mining, John Wi-ley&Sons, 1998.

3. Stefanowski J.: Algorytmy indukcji reguł decyzyjnych w odkrywaniu wiedzy, rozprawa habilitacyjna, Wydawnictwo Politechniki Poznaskiej, seria Rozprawy, nr 361, Pozna 2001.

4. Rojek I.: Inteligentny system wspomagania decyzji dla sterowania sieci wodocigow, materiały konferencyjne II Krajowej Konferencji Naukowej „Technologie przetwarzania danych”, wydawnictwo Politechniki Poznaskiej, Pozna 2007, 186-194.

5. Rojek I., Inteligentne zarzdzanie preferencjami poboru wody w sieci wodocigowej, red. Arkadiusz Januszewski, Studia i Materiały Polskiego Stowarzyszenia Zarzdzania Wie-dz, ISSN 1732-324X, vol. 14 , Bydgoszcz 2008, 67-74.

HYBRID SYSTEM OF CLASSIFICATION IN INTELLIGENT SUPPORT OF MANAGE-MENT OF WATER NETWORK

Summary

Research concerning classification systems embedded in system of intelligent support of management of water network present in the paper. The first research concerned description of simple classifiers, next multiple classifiers. Last research shows hybrid system of classification. Hybrid system includes typical classification examples, exceptions of failures and preferences users and consumers of system. The system allows on optimal classification of values of pressure and water flow in water network. The classification models allow controlling current values and responding on failures in water network.

Keywords: management of water network, hybrid system of classification, intelligent support

Izabela Rojek

Instytut Mechaniki rodowiska i Informatyki Stosowanej Uniwersytet Kazimierza Wielkiego

85-064 Bydgoszcz, ul. Chodkiewicza 30 e-mail: izarojek@ukw.e

Cytaty

Powiązane dokumenty

Dziêki wykorzystaniu podziemnych magazynów wydobycie ze z³ó¿ gazu wysokometanowego i produkcja w odazotowniach w Polsce ma stabilny przebieg i nie wykazuje silnych wahañ pomimo

Je´sli dwie p laszczyzny maj¸ a wsp´ olny punkt, to takich punkt´ ow jest wi¸ecej ni˙z jeden..

niu 246. Przyjmując tezę o Niepokalanym Poczęciu Maryi, lektorzy kwalifikowali ją jako naukę Szkota i teologów jezuickich przeciwko dominikanom. Także co do czasu

jest wymierna, czy niewy-

Prezydent Miasta Ruda Śląska informuje o wywieszeniu na tablicy ogłoszeń urzędu Miasta (obok pokoju 236) wykazu lokalu użytkowego nr 01 mieszczącego się w Rudzie Śląskiej w

[r]

[r]

Bez wzglêdu jednak na metodê mo¿na stwierdziæ, ¿e marka stanowi istot- ny element wartoœci niematerialnych i prawnych i z pewnoœci¹ przyczynia siê do generowania