Dr hab.
Sławomir Zadrożny,prof. PAN Warszawa, maj 2014 r.
Instytut
BadańSystemowych PAN ul. Newelska 6
01-447 Warszawa
Recenzja rozprawy doktorskiej mgr
inż.Krzysztofa ZANIEWSKIEGO
pt. "Konstrukcja i testowanie automatów rozmytych za
pomocątechnik metaheurystycznych"
Niniejsza recenzja
zostałaopracowana na
prośbęDyrektora Instytutu
BadańSystemowych Polskiej Akademii Nauk, prof. dr. hab.
inż.Zbigniewa Nahorskiego (por. pismo o znaku BA3-0004-9112/2014 z dnia 7 lutego 2014 roku).
Recenzowana rozprawa doktorska dotyczy metod konstruowania pewnej klasy automatów
skończonych,
zgodnie z zadanym na
wejściu ciągiem wejśći
wyjśćoraz metod testowania
zgodności
badanego automatu z
podaną specyfikacją.W
szczególnościrozprawa dotyczy rozmytych automatów
skończonych,co w
dużymstopniu decyduje o jej
oryginalności.W proponowanych w rozprawie
rozwiązaniachstosuje
siętechniki z zakresu inteligencji obliczeniowej. Tematyka rozprawy jest nowoczesna i bez
wątpienia należydo dyscypliny informatyka.
Zadaniem postawionym w rozprawie jest opracowanie nowych metod konstrukcji rozmytych automatów
skończonychoraz metod ich testowania. Zadanie to obejmuje kilka dodatkowych
podzadań,
takich jak opracowanie koncepcji zastosowania automatu dla danych
ciągłychczy uogólnienie modelu automatu rozmytego. Zaproponowane w rozprawie
rozwiązania można więc uznaćza istotny
wkładw
teorięautomatów rozmytych,
obejmujący różnorodneaspekty tej teorii oraz jej praktyczne zastosowania.
Recenzowana rozprawa doktorska
składa sięz 10
rozdziałówi liczy 142 strony.
Podstawową częśćrozprawy,
opisującąoryginalne
rozwiązaniepostawionego zadania,
stanowią rozdziałyod 6 do 9. Rozprawa zawiera bogaty spis literatury,
obejmujący125 pozycji.
Omówię
teraz
treśćposzczególnych
rozdziałów, wskazując główne osiągnięciadoktoranta i ewentualne
zauważone niedociągnięcia.We
Wstępiedoktorant pokrótce przedstawia
koncepcjęautomatu
skończonegoi jego zastosowania. Omawia
teżw sposób syntetyczny zakres pracy, jej oryginalny.
wkładoraz przeprowadzone eksperymenty obliczeniowe.
Ważną część wstępustanowi formalne postawienie zadania (celów pracy) oraz tez, które
mająjednak w nieunikniony sposób nieco sztuczny charakter, jak w
większościrozpraw doktorskich w obszarze nauk technicznych.
Wstęp kończy
krótki
przegląd zawartościrozprawy.
W rozdziale 2 wprowadza
siędefinicje
najważniejszychdla rozprawy
pojęć:automatu
skończonego
i jego rozmytej wersji, przy czym ta druga definicja ma raczej nieformainy
charakter.
Ścisładefinicja automatu rozmytego podana jest dopiero w rozdziale 5, co jest
nieco
niezręczne.Omawia
się teżinne warianty automatów (np. niedeterministyczne
automaty
skończone).Przedstawia
siętu
równieżkrótko
genezęautomatów rozmytych i ich
możliwe
praktyczne zastosowania. Omawia
sięzadanie konstrukcji automatu rozmytego na podstawie sekwencji
wejśći
wyjśći znane z literatury metody
rozwiązaniatego zadania, w
szczególnościz
użyciemsieci neuronowych. Wskazuje
się również, żew literaturze praktycznie brak prac
dotyczącychtestowania automatów rozmytych.
Rozdziałzawiera
też rozważania dotyczącetechnik uczenia aktywnego i uczenia na
bieżąco,które
później znajdujązastosowanie w proponowanych
rozwiązaniach.Doktorant stosuje
pojęcieautomatu
skończonegoz
wyjściem,co warto
byłoby wyraźnie zaznaczyćw rozprawie.
Rozdział
3 stanowi krótki
przeglądwybranych
pojęćz zakresu teorii zbiorów rozmytych i
związanychz nimi metod analizy danych. Podaje
się standardową definicjęzbiorów rozmytych oraz omawia
sięoperacje na nich, zdefiniowane za
pomocąnorm i konorm
trójkątnych.
Sporo miejsca
poświęconorozmytej analizie
skupień,a w
szczególnościalgorytmowi FCM. Algorytm ten jest stosowany w rozprawie do dyskretyzacji danych
ciągłych,
tak
żeby mogły byćprzetwarzane przez rozmyty automat
skończony.Warto
byłobyw tym rozdziale
omówić pojęcierelacji rozmytych i operacji na nich, jak
również pojęcie
iloczynu
kartezjańskiegozbiorów rozmytych.
Trochę mało przekonującejest przedstawienie ogólnego zadania analizy
skupieńi technik stosowanych do jego
rozwiązania.W rozdziale 4 omawia
sięmetaheurystyki zastosowane do
rozwiązaniapostawionego w rozprawie zadania. Opis obejmuje algorytmy symulowanego
wyżarzania, zachłannyi roju
cząstek.
Istota poszczególnych metaheurystyk
zostałapoprawnie opisana, ale
zostałyone nieco zbyt skrótowo przedstawione.
Rozdział
5 zawiera
szczegółoweomówienie
pOJęCIarozmytego automatu
skończonego,w
ujęciutakim, jakie
przyjętow rozprawie.
Zastępuje siępojedyncze elementy w definicji automatu zbiorami rozmytymi. Dotyczy to stanu w jakim znajduje
sięautomat, symbolu podanego na
wejściuoraz symbolu generowanego na
wyjściu.Funkcja
przejściatakiego automatu musi
również byćprzystosowana do tych zmian i przyjmuje
postaćrozmytej relacji
określonej
na iloczynie
kartezjańskimzbioru symboli
wejściowychi zbioru stanów, przy czym ten ostatni
występujew tym iloczynie dwukrotnie. Podobnie
przekształconazostaje funkcja
wyjściaautomatu, która
równieżprzybiera
postaćrelacji rozmytej
określonejna odpowiednim iloczynie
kartezjańskimzbiorów stanów, symboli
wyjściowychi, ewentualnie, symboli
wejściowych, zależnieod typu
rozważanegoautomatu. Pokazane
są przykładyrozmytych automatów
skończonych,zarówno w postaci diagramów, jak i tabel
reprezentujących
odpowiednie relacje rozmyte.
Należy podkreślić, żew
całejrozprawie, najistotniejsze
pojęcia sądobrze ilustrowane starannie przygotowanymi
przykładami.Podana jest
równieżalternatywna definicja rozmytego automatu
skończonego,w której wprowadza
się wartości
progowe dla stopni
przynależnościsymboli
wejściowychw ten sposób,
żete o mniejszym stopniu
przynależności sąprzez automat ignorowane.
Rozdział kończyprzedstawienie taksonomii omawianych typów rozmytych automatów
skończonych.Definicja rozmytego automatu
skończonegopodana jest nieco
nieprzejrzyście.Wynika to,
między
innymi, z sygnalizowanego
już wcześniejbraku wprowadzenia w rozdziale 3
pojęciarelacji rozmytych i operacji na nich, a w
szczególnościoperacji
złożeniarelacji.
Właściwsze byłobytu
posługiwanie się,na
przykład, pojęciemzbioru rozmytego symboli
wejściowychzamiast
pojęciem"wektora stopni
przynależności"(por. np. iloczyn
kartezjański q(K)i
x(K)na s. 34).
Występujątu
równieżpewne
niezręczności językowe,typu
"przynależnośćdo
stanów" czy
"przynależnoścido symboli
wejściowych",podczas gdy to stany i symbole
wejściowe mają określone
stopnie
przynależnoścido odpowiednich zbiorów rozmytych.
Trzeba jednak
przyznać, żemateria
niełatwopoddaje
siętu precyzyjnemu opisowi. Brak komentarza do rys. 5,
żeprzedstawia on obraz automatu w chwili K = O; taki komentarz jest wymagany ze
względuna pokazane na rysunku stopnie
przynależnościstanów, które
mającharakter dynamiczny. Warto
byłoby też powtórzyćprzy okazji tego rysunku
założeniao graficznej reprezentacji automatu,
przyjętena s. 13,
dotycząceinterpretacji faktu braku
krawędzi
w
wierzchołkugrafu dla danego symbolu
wejściowego.Dodatkowo, ta interpretacja powinna
byćszerzej przedyskutowana w rozprawie. Brak
teżkomentarza
dotyczącegokonsekwentnego sumowania
sięstopni
przynależnoścido
wartościl w tab. 3, przy jednoczesnym
całkowitymbraku takiego sumowania
sięw tab. 4.
W rozdziale 6 omawia
sięzastosowanie algorytmu FCM do granulacji danych
ciągłych,które
mają być
przetwarzane przez rozmyty automat
skończony.Dotyczy to w
szczególnościsymboli
wejściowychi
wyjściowych.Centroidy
skupieńuzyskanych z
użyciemalgorytmu FCM
utożsamia sięz symbolami
wejściowymi/wyjściowymi.Dokonuje
siędodatkowo dyskretyzacji (granulacji) przestrzeni
każdejze
współrzędnychprototypu i uzyskuje
sięich w
pełni symboliczną reprezentację. Rozważa się również przekształcenieodwrotne,
pozwalające zamienić wyjście
automatu na
liczbę rzeczywistą.Omawia
się szczegółowosposób prowadzenia granulacji na
użytek różnych zadań,do których
może zostaćzastosowany rozmyty automat
skończony,w
szczególnoścido prognozowania i klasyfikacji.
Tytuł rozdziału
jest nieco
niezręcznyz powodu
przyjęciakalki w
tłumaczeniuangielskiego
słowa
"concept" na
"koncepcję",co w tym
kontekścienie sprawdza
się.Zbyt kategoryczne jest stwierdzenie,
przewijające sięprzez
całą rozprawę, że"dane
światarzeczywistego"
są wyrażone wyłączniew postaci liczb rzeczywistych (i podobne stwierdzenie na s. 49,
że"W
świecierzeczywistym nie
posługujemy sięjednak symbolami ... "). Poza tym, rys. 8 nie do
końca
stanowi
przekonującą ilustrację rozważanegotu
przekształceniadanych - przynajmniej
jeśli
nie opatrzy
sięgo stosownym komentarzem.
W rozdziale 7
szczegółowoi formalnie przedstawia
sięzadanie konstrukcji rozmytego automatu
skończonegona podstawie sekwencji par symboli
wejścia/wyjścia.Wprowadza
się wskaźnik jakości,który pozwala
ocenićna ile zgodnie z zadanymi sekwencjami skonstruowany automat odwzorowuje
wejściana
wyjścia. Następniedoktorant proponuje
dwuskładnikowy
schemat konstruowania rozmytego automatu
skończonegoz
użyciemtechnik metaheurystycznych. Pierwszy
składnikdotyczy optymalizacj i liczby stanów automatu,
zaśdrugi obejmuje
optymalizacjęarchitektury automatu przy zadanej liczbie stanów. W rozprawie badane
sąkonkretne warianty zaproponowanego schematu konstruowania automatu rozmytego.
Różnią sięone technikami metaheurystycznymi zastosowanymi w ramach poszczególnych
składnikówschematu. Doktorant stosuje kombinacje algorytmów symulowanego
wyżarzania(SA) i rojowego (pSa). Kombinacje te badane
sąeksperymentalnie. Dla automatu o znanej architekturze generuje
sięsekwencje
uczące wejść
i
wyjść, stanowiącezbiór danych
uczącychdla porównywanych algorytmów.
Przyjmuje
sięprzy tym pewne
założenia upraszczające analizęi
weryfikacjęwyników.
Wyniki eksperymentów
zostałyprzeanalizowane i na ich podstawie
podjęto próbęopracowania algorytmu doboru danych
uczących,które
zapewniłybyjeszcze lepsze wyniki.
Zaproponowano dwa takie
podejścia, nawiązującedo koncepcji uczenia aktywnego i uczenia
na
bieżąco,które
doprowadziłydo uzyskania lepszych wyników w powtórzonych eksperymentach obliczeniowych.
Nieco brakuje
pogłębionejanalizy
złożonościobliczeniowej zadania konstruowania automatu. Pewne jej elementy podano na s. 57.
Pożądane byłoby równieżbardziej
szczegółowe
przedstawienie sposobu zastosowania metaheurystyk przy konstruowaniu automatu (na
przykładbardziej
szczegółoweomówienie reprezentacji problemu w ramach poszczególnych stosowanych technik). Brak komentarza na temat
ciągłościdanych prezentowanych na rys. 20 wobec
wszędziew tym rozdziale przyjmowanej symbolicznej postaci danych
wejściowych/wyjściowychautomatu. Brak
równieżkomentarza co do
szczegółowej
postaci algorytmu losowego i interpretacji uzyskanych z jego
użyciemwyników, które
są znaczącogorsze od
pozostałychporównywanych algorytmów, ale
bezwzględnie wydają się być
lepsze
niż można byłoby oczekiwać.Wskazane
byłobyprzeprowadzenie bardziej systematycznej, statystycznej analizy wyników eksperymentów obliczeniowych.
Interesujące byłoby równieżbardziej
szczegółoweporównanie architektury skonstruowanego automatu z oryginalnym automatem, z
użyciemktórego wygenerowano dane
uczące.Taka analiza przeprowadzona jest tylko w odniesieniu do
licznościzbioru stanów.
Jednocześnieprzy ilustracji wyników eksperymentów obliczeniowych (por. np.
rys. 41)
możewarto
znaleźćtakie etykietowanie
wierzchołkówgrafu, które najlepiej odpowiada grafowi
reprezentującemuoryginalny automat.
Oszczędnośćuzyskana przez zmniejszenie zbioru
uczącegosekwencji
wejścia/wyjścia(por. zdanie "W drugim przypadku otrzymamy ... " na s. 75) wymaga dalszego uzasadnienia ze
względuna
koniecznośćwielokrotnego powtarzania procesu uczenia, który prowadzi do tej redukcji zbioru
uczącego.Rozdział
8 dotyczy drugiego
głównegopodzadania postawionego w rozprawie, to jest testowania automatów. Najpierw omawia
sięznane w literaturze techniki testowania automatu
skończonego.W
szczególności rozważa sięzagadnienie testowania
zgodnościzadanego automatu, traktowanego jako "czarna skrzynka", z
podaną specyfikacjąautomatu
skończonego. Główną uwagę przykłada się
do metod opartych na tzw. unikalnych sekwencjach
wejścia-wyjścia(Ula). Sekwencja taka zdefiniowana jest dla danego stanu i jej zastosowanie pozwala
stwierdzićczy automat aktualnie znajduje
sięw tym stanie, czyli
rozwiązuje
ona zadanie weryfikacji aktualnego stanu automatu. Taka weryfikacja stanowi
niezbędny
element wielu procedur testowania
zgodnościautomatu ze
specyfikacją.W dalszej
części rozdziału
omawia
sięznane z literatury zastosowania metaheurystyk do generowania Ula i proponuje
się własną metodę.Polega ona na zastosowaniu algorytmu psa z
dwukryterialną funkcjąprzystosowania, która bierze pod
uwagęzarówno
unikalnośćsekwencji, jak i jej
długość.Proponuje
sięodpowiednie kodowanie sekwencji, wymagane dla zastosowania pSa. Doktorant
przeprowadziłeksperymenty obliczeniowe
potwierdzające skutecznośćzaproponowanej metody,
chociażich zakres nie pozwala na
wyciągnięciedaleko
idących
wniosków. Wreszcie, wp. 8.5 proponuje
się metodę hybrydową,która daje najlepsze wyniki w kolejnych eksperymentach obliczeniowych. Polega ona na
połączeniualgorytmu
zachłannego
i genetycznego. Pierwszy z algorytmów odgrywa
główną rolęi generuje
rozwiązania
na podstawie tzw. ziarna, które z kolei dobierane jest z
użyciemalgorytmu
genetycznego. Dla przyspieszenia
obliczeńwprowadza
się uproszczoną postaćfunkcji
przystosowania.
Szczegółowoprzedstawia
się zasadęfunkcjonowania zaproponowanego
algorytmu hybrydowego. Równie
szczegółowoomawia
sięwyniki eksperymentów
obliczeniowych,
analizując skutecznośćmetody w
zależnościod liczby stanów
przedmiotowego automatu
skończonegoi
gęstościjego grafu, jak
równieżod
licznościjego alfabetu symboli wyj
ściowych.Pożądany byłby bliższy
opis algorytmu losowego, stosowanego do
porównańw eksperymentach obliczeniowych. Notacja
przyjętaw (39) jest niejasna.
W rozdziale 9
rozważa sięzagadnienie testowania rozmytego automatu
skończonego.Proponuje
sięzastosowanie w tym celu kilku metod. Najprostsza to losowe generowanie testowych sekwencji
wejścia/wyjścia. Używa sięprzy tym
różnych wskaźnikówoceny
zgodności
faktycznego
wyjściaautomatu z
wyjściem wynikającymze specyfikacji. Stosuje
się
tu
międzyinnymi te same
wskaźniki,które
zostałyzaproponowane dla celów konstruowania rozmytego automatu
skończonegow rozdziale 7. Kolejne metody testowania
nawiązują
do metod stosowanych dla klasycznych automatów
skończonych.Jedna z nich polega na uproszczeniu automatu rozmytego do postaci automatu klasycznego i zastosowaniu jednej ze standardowych metod testowania.
Metody przedstawione w tym rozdziale
zostałyopisane nieco zbyt skrótowo. Notacja q(S;) zastosowana we wzorze (45) powinna
zostaćodpowiednio skomentowana -
wcześniejstosowane
sąoznaczenia postaci q;(t+
l).Rozdział
10 stanowi
umiejętnepodsumowanie
treścirozprawy i uzyskanych w niej wyników.
Praca jest dobrze napisana, zarówno pod
względemredakcyjnym, jak i
językowym.Doktorant nie
ustrzegł siępewnej liczby
niezręczności językowych, wśródktórych
wymienićmożna następujące:
- "przedstawiono [... J
definicjęautomatów rozmytych
posiadającąrozmyte stany, ... " na s.
7- "techniki heurystyczne
konstruowały"na s.
7- "wyliczania nowej
przynależności"na s.
7-
"zostałwykorzystany do problemu detekcji" na s. 16 - ,jest to
przeciwieństwemautomatu
skończonego"na s. 17 . - "aby
spełnione były powyższerównania" na s. 25
- "Interpretacja ziaren informacji jest ograniczona... " -
całeto zdanie na s. 48 nie jest jasne.
- "do postaci rozumianej przez
światrzeczywisty" na s. 49
- "Oprócz konstrukcji automatu ... " -
całeto zdanie na s. 66 nie jest jasne
- "wynik wzorcowy" czy "wynik idealny" ? (por. np. s. 76); zdecydowanie
należy dążyćdo
używania
jednolitej terminologii
W rozprawie
występujepewna niewielka liczba
błędówliterowych:
- "zaproponowano
konstrukcj~automatu rozmytego" na s. 14 - "Dla
przykładu,jeżeli[... J. Automat wygeneruje ... " na s. 33
- por.
kolejnośćindeksów stosowanych w przypadku
ryh(na s. 34 i dalej) z opisem relacji R na s. 33
- w Def. 3 brakuje wymienienia symbolu E - "z poza" na s. 57
- "sekwencji treningowych" czy "sekwencji testowych" ? (por. podpis pod rys. 37) - wp. 7.8
użycie słowa"modelu" jest
zbędne(por. "modelu automatu")
- "w na
wyjściu"na s. 86
- ,,1 + 1" na s. 88 powinno
byćpoprzedzone: "strategia ewolucyjna"
- "karamy" na s. 89 i na s. 96 (por.
również"kara" na s. 101)
-
"żeautomat
osiągną"w podpisie rys. 56 - "Zgeneralizowana" na s. 117
- "Uruchomiamy" na s. 122 - "zbiorku testowego" na s. 122 - "unikalna sekwencje" na s. 126
Podsumowując,
pomimo pewnych
wcześniejwymienionych uwag krytycznych, moja ocena rozprawy jest pozytywna. Rozprawa dotyczy nowoczesnej i perspektywicznej tematyki rozmytych automatów
skończonych.Kompleksowo
rozważa sięproblem ich modelowania, konstruowania oraz testowania. Stosuje
sięprzy tym w
umiejętnysposób znane techniki metaheurystyczne, które
sątwórczo
łączone,co prowadzi do uzyskania efektywnych algorytmów. Przeprowadzone
zostałyliczne eksperymenty obliczeniowe
służąceporównaniu
różnych
wariantów proponowanych
rozwiązań.Postawione w rozprawie zadanie
zostało więc rozwiązanez
użyciemnowych metod zaproponowanych przez doktoranta.
Można więc stwierdzić, że
przedstawiona do recenzji rozprawa stanowi oryginalne
rozwiązanie
problemu naukowego i wykazuje
erudycjęAutora oraz jego
zdolnośćdo samodzielnego prowadzenia pracy naukowej. W
związkuz
powyższymstwierdzam,
żew mojej opinii praca
spełniawymagania stawiane rozprawom doktorskim przez stosowne przepisy i
wnoszęo jej
przyjęciei dopuszczenie do publicznej obrony.
\/!fl. ... Il/ )
r-'.'
'~
...
'...,-,,/'~~