• Nie Znaleziono Wyników

4. Charakterystyka algorytmów klasteryzacji

4.1. Wybór reprezentacji obiektów

Ponieważ procesowi grupowania podlegają nie same obiekty, lecz ich abstrakcyjne reprezentacje, ich wybór, zwany również ekstrakcją cech, powinien wskazać najbardziej odpowiedni zbiór cech, który najlepiej opisuje grupowane obiekty. Wybór reprezentacji obiektów ma bowiem kluczowe znaczenie dla efektywności i jakości procesu grupowania [65].

Obiektami w przypadku analizy sygnałów EA od WNZ są informacje o tych sygnałach, zarejestrowane w plikach pomiarowych w bazie sygnałów EA, natomiast reprezentacjami odpowiednio wybrane ich cechy lub też parametry. Reprezentacje te określa się mianem deskryptorów. Istnieje wiele deskryptorów opisujących sygnały EA od WNZ. Ogólnie dzieli się je na:

 deskryptory określane w dziedzinie czasu,

 deskryptory określane w dziedzinie częstotliwości,

 deskryptory określane w dziedzinie czasowo-częstotliwościowej,

ekstrakcja danych podobieństwo

obiektów

grupowanie

obiekt reprezentacja obiektu

sprzężenie zwrotne

klastry

9

 wskaźniki statystyk opisowych,

 wyniki analizy falkowej [12, 15, 16, 19, 53].

Szczegółowo deskryptory opisujące sygnały EA od WNZ przedstawiają m.in. autorzy prac [16, 53, 61, 62].

W trakcie przeprowadzonych przez Autora prac naukowo-badawczych, jako parametr opisujący obiekty – informacje o sygnałach EA zawarte w plikach pomiarowych – wykorzystano gęstość mocy zarejestrowanego sygnału, którą wyznaczono przy użyciu dyskretnej transformaty Fouriera DFT (ang. Discrete Fourier Transform). Wybór tego deskryptora wynikał z dotychczasowych doświadczeń zebranych przez pracowników Katedry Wysokich Napięć Instytutu Elektroenergetyki i Energii Odnawialnej Politechniki Opolskiej – widmo gęstości mocy sygnału EA było już wykorzystywane m.in. w badaniach prowadzonych przez dr hab. inż. S. Boruckiego oraz dr inż. P. Kurtasza [22, 54].

Dla każdego z sygnałów EA, będącego czasowym przebiegiem wartości napięcia generacji wyładowania o długości 20 ms, wyznaczano charakterystykę jego widma gęstości mocy. Wykorzystano w tym celu dostępną w środowisku symulacyjno-obliczeniowym Matlab funkcję widmo gęstości mocy PSD (ang. Power Spectrum Density). Parametrem wpływającym na dokładność wyznaczenia widmowej gęstości mocy jest dla funkcji PSD wybrana liczba punktów uśredniających. Na podstawie wniosków przedstawionych w pracy [22], w prowadzonych analizach przyjęto wartość 128 punktów uśredniających. Następnie na wyznaczonych obrazach PSD, dla danego sygnału EA z wybranej klasy WNZ, wskazano dwie wartości wagi gęstości widma dla dwóch wartości częstotliwości, wyznaczonych w drodze eksperymentu. Uzyskano w ten sposób dwuelementowy wektor, z którego pierwszy element przyjęty został jako tzw. składowa X, a drugi jako tzw. składowa Y, wyznaczając współrzędne punktu w przestrzeni euklidesowej. Współrzędne te, będąc reprezentacją wybranego sygnału EA z wybranej klasy WNZ, dla wybranej pary częstotliwości PSD, stanowiły podstawę obliczeń prowadzonych w dalszej części eksperymentu.

Opisany powyżej proces tworzenia dwuelementowych wektorów schematycznie przedstawiono na rysunku 4.2. Wybrano przykładowy sygnał EA od WNZ w układzie ostrze-ostrze (Klasa 1), dla częstotliwości PSD o wartościach 40 kHz dla składowej X oraz 700 kHz dla składowej Y. Postępując w opisany sposób z każdym z zarejestrowanych sygnałów EA, w każdej badanej klasie WNZ otrzymano osiem 100-tu elementowych, dwukolumnowych, macierzy danych, zawierających wektory współrzędnych punktów na płaszczyźnie XY, wyznaczonych dla wybranej pary częstotliwości widma gęstości mocy. Wyznaczone wektory są reprezentacjami poszczególnych obiektów – badanych przebiegów EA – uzyskanych w drodze zastosowania wybranego deskryptora, zaś punkty na płaszczyźnie XY ich graficznym obrazem.

10

0 100 200 300 400 500 600 700 800 900 1000 1100 1200

-6

Waga gęstości widma [dB] Widmo gęstości mocy

-3.5 -3.4 -3.3 -3.2 -3.1 -3 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2 -1.9 -1.8 -1.7 -1.6 -1.5

Gęstość widmowa dla f = 700 kHz

Uzyskany punkt

Składowa Y, f = 700 kHz

Składowa X, f = 40 kHz

Składowa Y, f = 700 kHz

Składowa X, f = 40 kHz

Rys. 4.2. Proces uzyskiwania współrzędnych punktu dla przykładowego sygnału EA od WNZ w układzie ostrze-ostrze (Klasa 1), dla częstotliwości PSD o wartościach 40 kHz dla składowej X oraz 700 kHz dla składowej Y:

a) zarejestrowany przebieg czasowy sygnału EA od WNZ, b) widmo gęstości mocy sygnału z zaznaczonymi, wybranymi częstotliwościami PSD, c) uzyskany punkt w układzie współrzędnych XY

Rysunek 4.3 przedstawia zbiór punktów obrazujących sygnały EA od WNZ dla przykładowej klasy WNZ w układzie ostrze-ostrze (Klasa 1), dla pary częstotliwości PSD o wartościach 30 kHz dla składowej X oraz 340 kHz dla składowej Y. Natomiast rysunek 4.4 ilustruje zbiory punktów opisujących sygnały EA od WNZ dla wszystkich badanych Klas WNZ i przykładowej pary częstotliwości PSD o wartościach 30 kHz dla składowej X oraz 340 kHz dla składowej Y.

Rys. 4.3. Zbiór punktów obrazujących sygnały EA od WNZ dla przykładowej klasy WNZ w układzie ostrze-ostrze (Klasa 1), wyznaczony dla pary częstotliwości PSD o wartościach 30 kHz dla składowej X

oraz 340 kHz dla składowej Y

11 Rys. 4.4. Zbiór punktów obrazujących sygnały EA od WNZ dla wszystkich, badanych klas WNZ i przykładowej

pary częstotliwości PSD o wartościach 30 kHz dla składowej X oraz 340 kHz dla składowej Y

Jak już wspomniano właściwy dobór pary częstotliwości PSD, dla których wskazywane są dwie wartości wagi gęstości widma będące współrzędnymi punktu reprezentującego wybrany sygnał EA z wybranej klasy WNZ, ma kluczowe znaczenie dla późniejszej skuteczności zastosowanych algorytmów badawczych. Niesatysfakcjonujący wynik analizy skupień może być następstwem niewłaściwego wyboru zbioru cech opisujących obiekt, które okazały się niereprezentatywne [65].

W celu właściwego doboru par częstotliwości PSD dokonano szerokiej analizy graficznych obrazów uzyskanych wektorów na płaszczyźnie euklidesowej, poszukując rozkładów charakteryzujących się występowaniem skupień. Analiza ta przeprowadzona została dla trzech wybranych klas WNZ występujących łącznie [25]. Wybrano Klasę 1 – wyładowania w układzie ostrze-ostrze, Klasę 3 – wyładowania w układzie ostrze-płyta oraz Klasę 5 – wyładowania w układzie powierzchniowym z jedną elektrodą płaską, drugą wieloostrzową, między którymi znajduje się izolacja papierowo-olejowa. Uzyskano na wstępie około 10 000 charakterystyk, wyznaczonych dla par częstotliwości PSD zmienianych dla składowej X i składowej Y w granicach od 10 kHz do 990 kHz, z krokiem 10 kHz. Połowę charakterystyk odrzucono, ze względu na ich powielenie się w przypadku tej samej pary częstotliwości PSD, lecz przypisanej do odmiennych składowych. Odrzucono również charakterystyki dla par częstotliwości PSD o tej samej wartości, ponieważ w takim przypadku wszystkie punkty grupują się w formę linii na przekątnej charakterystyki.

Zgodnie z dostępnymi w literaturze wynikami badań, jak również badaniami prowadzonymi przez pracowników Katedry Wysokich Napięć Instytutu Elektroenergetyki i Energii Odnawialnej Politechniki Opolskiej, m.in. [11, 15, 16, 23, 31], przedział częstotliwości, w którym zawarte są sygnały EA, powstające podczas występowania WNZ, zawiera się w granicach od fd = 20 kHz do fg = 700 kHz. W tym też zakresie częstotliwości, w celu poprawnego odwzorowania struktury sygnałów EA, ustawiono pasmo filtracji badanych sygnałów. Kolejne ograniczenie uzyskanej grupy charakterystyk wynikało więc z filtracji częstotliwości zastosowanej w toku gromadzenia badanych obiektów – przebiegów czasowych EA. Odrzucono charakterystyki dla par częstotliwości PSD, w których którakolwiek ze

12 składowych miała wartość poniżej 20 kHz lub powyżej 700 kHz. Ostatecznie analizowano dokładnie 2 346 charakterystyk.

Wśród uzyskanych, graficznych obrazów rozkładu wektorów wyznaczonych dla wybranych par częstotliwości PSD wyróżnić można 5 typów grupowań. Dla każdego z nich wybrano jedną, reprezentującą je parę częstotliwości PSD. Wybrane pary częstotliwości zestawiono w tabeli 4.1.

Tabela 4.1 Zestawienie wybranych par częstotliwości PSD Oznaczenie

w algorytmie badawczym Składowa X Składowa Y

20/80 20 kHz 80 kHz

40/700 40 kHz 700 kHz

170/350 170 kHz 350 kHz

430/550 430 kHz 550 kHz

570/670 570 kHz 670 kHz

Rysunki od 4.4 do 4.8 przedstawiają zbiory punktów obrazujące wektory wyznaczone dla wybranych klas WNZ – Klasy 1, 3 i 5 – przy wybranych parach częstotliwości PSD, wymienionych w tabeli 4.1.

Rys. 4.4. Zbiór punktów obrazujących wektory wyznaczone dla wybranych klas WNZ – Klasy 1, 3 i 5 przy wybranej parze częstotliwości PSD o wartościach 20 kHz dla składowej X oraz 80 kHz dla składowej Y

13 Rys. 4.5. Zbiór punktów obrazujących wektory wyznaczone dla wybranych klas WNZ – Klasy 1, 3 i 5 przy

wybranej parze częstotliwości PSD o wartościach 40 kHz dla składowej X oraz 700 kHz dla składowej Y

Rys. 4.6. Zbiór punktów obrazujących wektory wyznaczone dla wybranych klas WNZ – Klasy 1, 3 i 5 przy wybranej parze częstotliwości PSD o wartościach 170 kHz dla składowej X oraz 350 kHz dla składowej Y

Rys. 4.7. Zbiór punktów obrazujących wektory wyznaczone dla wybranych klas WNZ – Klasy 1, 3 i 5 przy wybranej parze częstotliwości PSD o wartościach 430 kHz dla składowej X oraz 550 kHz dla składowej Y

14 Rys. 4.8. Zbiór punktów obrazujących wektory wyznaczone dla wybranych klas WNZ – Klasy 1, 3 i 5 przy

wybranej parze częstotliwości PSD o wartościach 570 kHz dla składowej X oraz 670 kHz dla składowej Y

Powiązane dokumenty