• Nie Znaleziono Wyników

Recenzja rozprawy doktorskiej mgra inż. Daniela Kostrzewy pt. Przeszukiwanie przestrzeni rozwiązań w optymalizacji planów zapytań do baz danych z wykorzystaniem heurystycznego algorytmu IWO

N/A
N/A
Protected

Academic year: 2021

Share "Recenzja rozprawy doktorskiej mgra inż. Daniela Kostrzewy pt. Przeszukiwanie przestrzeni rozwiązań w optymalizacji planów zapytań do baz danych z wykorzystaniem heurystycznego algorytmu IWO"

Copied!
4
0
0

Pełen tekst

(1)

Toruń i października 2015 dr hab. Piotr Wiśniewski

Wydział Matematyki i Informatyki

Uniwersytet Mikołaja Kopernika w Toruniu Chopina 12/18, 87-100 Toruń

Recenzja rozprawy doktorskiej Daniela Kostrzewy

Przeszukiwanie przestrzeni rozwiązań w optymalizacji planów

zapytań do baz danych z wykorzystaniem heurystycznego

algorytmu IWO

Recenzowana rozpraw a doktorska wpisuje się w bardzo w ażny nurt badań nad optym alizacją przetwarzania zapytań w bazach danych. N urt ten jest niezwykle istotny, gdyż rozm iar i złożoność przetwarzanych danych rośnie znacznie szybciej niż w ydajność komputerów.

W recenzowanej pracy doktorant zajął się dobraniem optymalnej kolejności złączeń tabel, dla uzyskania minimalnego czasu realizacji zapytania. Cel ten jest realizow any poprzez modyfikację algorytmu Invasive Weed Optim ization nazyw anym dalej w skrócie IW O.

Omówienie wyników rozprawy

Praca składa się z siedm iu rozdziałów oraz dwóch dodatków. Rozdział pierwszy jest krótkim w stępem naświetlającym ważność prowadzonych badań oraz będącym przew odnikiem po pracy.

Rozdział drugi jest pierwszym właściwym rozdziałem w pracy. W prowadza on czytelnika w zagadnienia optym alizacji zapytań. Przypomina istotne dla badań pojęcia planu dobrego, planu akceptowalnego oraz planu nie do zaakceptowania. Dalej om awia schemat działania optymalizatora.

Rozdział trzeci om awia problem y optym alizacyjne. Autor wprowadza czytelnika najpierw w główne zagadnienie dla pracy, tj. optym alizację kolejności złączeń tabel. N astępnie om awia krótko, ale wystarczająco problem minimum funkcji w ielowym iarowej oraz problem kom iwojażera. Problemy te zostaną dalej w ykorzystane do testów jakości proponowanych rozszerzeń algorytmu IWO.

(2)

Rozdział czwarty zatytułow any jest Przegląd algorytmów optym alizacyjnych. Tytuł ten okazuje się jednak trochę górnolotny. Rozdział ten przedstawia najpierw algorytm ewolucyjny - jako pierwszy algorytm inspirowany biologią, następnie przedstawia kluczowy dla pracy algorytm IWO. Zostaje on bardzo solidnie om ów iony wraz z przykładowym i zastosowaniami. Ostatnie półtorej strony stanowi pobieżna prezentacja kilku algorytm ów mająca zapewne uzasadnić tytuł rozdziału. Pewnym brakiem jest pominięcie w nim algorytm ów, z którym i rozwiązanie w rozdziale szóstym porównywane jest autorskie.

Kluczowe rozważania pracy zawiera rozdział piąty. Zaprezentowana w nim jest autorska m odyfikacja algorytm u IWO, która ja k wykazują późniejsze testy, potrafi dać lepsze wyniki w optym alizacji złączeń niż oryginalny algorytm. M odyfikacja dotyczy czterech aspektów:

• Inicjalizacja populacji początkowej - autor decyduje się na wstępną selekcję zam iast losowania. W efekcie skraca czas pracy algorytmu. Podejście to czyni w opini recenzenta im plem entację bardziej złożoną jednocześnie w prow adzając ciężkie obliczenia na starcie. Okazuje się jednak, że pozwala to na istotne skrócenie realizacji całego algorytmu. • Rozproszenie ziaren w okół chwastu - na tym etapie autor upatruje

najwięcej m ożliwości poszukiwań badawczych. Etap ten jest kluczowy dla poszukiwania najlepszych rozwiązań. Dla każdego ziarna losowana jest m etoda, czy zostaje ono rozwiane, rozsiane, czy stoczone. Autor dokładnie opisuje każdą z tych dróg. Pewną słabością tego fragm entu jest słabe uwypuklenie różnic, pom iędzy oryginalnym podejściem algorytm u IWO, a m odyfikacjam i proponowanym i przez autora.

• Selekcja najlepszych chwastów - autor prezentuje m etody selekcji, niestety również słabo uwypuklone są m odyfikacje wobec algorytmu oryginalnego.

• W arunek zatrzym ania algorytm u - autor proponuje dodać ograniczenie czasowe dla algorytm u. Oryginalnie algorytm zatrzymuje się po wykonaniu z góry założonej liczby kroków.

W dalszej części rozdziału autor prezentuje wykorzystanie zmodyfikowanego algorytm u IWO w znajdowaniu m inim um funkcji wielom ianowa nowych oraz w problem ie kom iwojażera.

W kolejnej części rozdziału om ówione zostanie wykorzystanie algorytmu w głównym zastosowaniu pracy, czyli ustaleniu kolejności złączeń w realizacji zapytań w bazach danych. Ziarnem jest kolejność złączeń, oceną jakości jest ilość przetwarzanych danych w realizacji złączenia w danej kolejności.

(3)

Ostatni fragm ent rozdziału dokładnie analizuje złożoność obliczeniową realizacji algorytmu. Analiza ta jest gruntownie i dokładnie dokonana. W proponowanym zastosowaniu jest ona niezwykle ważna, pozwala ocenić, czy przypadkiem koszt dobrania właściwej kolejności nie jest wyższy niż zysk uzyskany w wyniku optymalizacji.

Rozdział szósty om awia w yniki testów.

W pierwszej części autor prezentuje funkcje wielowym iarowe, na których testow any jest om aw iany algorytm. Funkcje te dobrane są tak, aby poziom skom plikowania optym alizacji rósł. Pierwsze z nich służą do wstępnej w eryfikacji, czy zaproponow ane zm iany algorytmu mają w ogóle sens. Jakość optym alizacji jest porów nyw ana z wynikam i otrzym anym i dla oryginalnej wersji IW O oraz dla algorytm u APSO. Zaprezentowane eksperym enty pokazują, że zm odyfikow any algorytm IWO dostarcza lepszej jakości wyniki niż porównywane algorytm y. Nie do końca jasne jest czy doktorant porównuje proponowane rozw iązania z własną im plem entacją algorytm ów referencyjnych, czy też z w ynikam i z cytowanych prac. W etykietach w ykresów porównania z algorytm em APSO pojaw ia się pewna nieścisłość. W pracy proponowana wersja algorytm u jest oznaczana jako exIWO, gdy tym czasem na etykietach wykresów w porównaniu z APSO pojawia się IWO, co w pracy używane jest do oznaczenia oryginalnego algorytm u. Z kontekstu natom iast widać, że autor ma na myśli exIWO.

Druga część porów nuje efektywność zmodyfikowanej wersji algorytm u w zastosowaniu dla problem u kom iwojażera. A utor prezentuje podejścia do problem u kom iw ojażera i porównuje wyniki dla exIW O z wynikam i innych algorytm ów. Podejście to bardzo dobrze prezentuje jakość otrzymanej optym alizacji. Interesująca byłaby własna im plem entacja przynajmniej części algorytm ów prezentow anych do porównania. M ożliwe byłoby wówczas zbadanie kosztu optym alizacji. Im plem entacja taka prawdopodobnie byłaby jednak zbyt czasochłonna i przekraczała rozm iar doktoratu. W tej części nieścisłość dotycząca nazw IW O i exIW O pojawia się dość często.

Trzecia część rozdziału dotyczy w yników eksperym entów dla najważniejszym, w kontekście pracy, zagadnieniu tj. dobieraniu kolejności złączeń. Doktorant w prow adza w dobór danych testowych, następnie prezentuje metodykę testów. Pewną słabością przeprow adzonych testów jest sprzęt na którym testy były realizowane - laptop. W opinii recenzenta przeprowadzenie testów na architekturze bardziej serwerowej (np. na kom puterze, na którym realizowane b yły testy problem u kom iw ojażera) m ogłyby dać trochę inne wyniki. Jednakże nie pow inny one raczej wpłynąć istotnie na końcow y obraz. Algorytm exIWO okazuje się czasem być efektywniejszym , czasem mniej efektywnym. N ajciekaw szym w ynikiem wyłaniającym się z testów jest rozdzielenie jakości

(4)

optym alizacji dokonanej przez algorytm y zależnie od kształtu grafu budowanego przez złączenia. Fakt ten powinien zostać bardziej uwypuklony w treści pracy. Rozdział siódmy rozpraw y podsum owuje uzyskane wyniki i kończy pracę. Dodatki prezentują szczegółowe wyniki testów i om awiają aplikacje testowe.

Podsumowanie rozprawy

Przedstawiona do recenzji rozprawa porusza istotny problem optymalizacyjny. Opracowane w niej rozszerzenie algorytm u IWO okazuje się być efektywnym narzędziem nie tylko w optym alizacji kolejności złączeń tabel w bazach danych, ale również w innych klasycznych problem ach optymalizacyjnych. Otrzym ane wyniki zostały zaprezentowane w kilkunastu artykułach naukowych o zasięgu m iędzynarodowym . Jeden z artykułów ukazał się w czasopiśm ie o współczynniku IF 1,73. W spom inane w omówieniu wyników rozprawy uwagi są drobiazgam i wobec całości pracy wykonanej przez autora i nie mają istotnego wpływu na pozytywną ocenę wyników.

Konkluzja

Recenzowana rozpraw a spełnia wszystkie form alne i zwyczajowe norm y stawiane w naszym środowisku rozprawom doktorskim. W noszę o dopuszczenie m agistra Daniela Kostrzewy do dalszych etapów przewodu doktorskiego.

Cytaty

Powiązane dokumenty

Niezależność aplikacji i danych - dane mogą być wprowadzane do bazy bez konieczności modyfikacji korzystających z nich programów czy systemów użytkowych, a z drugiej

DataInputStream in5 = new DataInputStream(new BufferedInputStream( new FileInputStream(fileName))); System.out.println(in5.readDouble());

public Movie2 (String title , LocalDate additionDate , float price) {. // Call the constructor from the

Pozostaje jednak pytanie: czy jeżeli chcielibyśmy znaleźć portfel, dla którego współczynnik Sharpe’a przyjmuje wartość największą z możliwych (porównaj też Rysunek

Należy pamiętać, że metoda potęgowa, oprócz ewidentnej zalety (jest metodą iteracyjną, więc można obliczenia przerwać w bardziej dogodnym momencie, a iteracja opiera się na

lumny opisujące zdegenerowane krawędzie neutralne 5-tą i 6-tą. Pokażemy, że zbiór punktów optymalnych jest trójkątem. Opisz wszystkie punkty optymalne zadania:.. Wymiar

W tem tu miejscu nie mogę uniknąć, by własnej swojej hipotezie o początku »nieczystego sumienia« nie dopomóc do pierwszego tymczasowego wyjawu nie łatwo zdobyć dla niej po-

Pragnienie zwycięstwa kazało mu w jakieś euforycznej chwili (między listopadem 1887 a marcem 1888 roku) napisać, w jednym z kilku projektów przedmowy do Woli mocy, że oto