• Nie Znaleziono Wyników

RECENZJA rozprawy doktorskiej mgra inż. Krzysztofa Stachowiaka „Wielokryterialne heurystyczne algorytmy rutingu rozgałęźnego” Promotor: dr hab. inż. Piotr Zwierzykowski

N/A
N/A
Protected

Academic year: 2021

Share "RECENZJA rozprawy doktorskiej mgra inż. Krzysztofa Stachowiaka „Wielokryterialne heurystyczne algorytmy rutingu rozgałęźnego” Promotor: dr hab. inż. Piotr Zwierzykowski"

Copied!
7
0
0

Pełen tekst

(1)

1

Wrocław, 5 września 2018

Prof. dr hab. inż. Krzysztof WALKOWIAK Wydział Elektroniki

Politechnika Wrocławska

RECENZJA

rozprawy doktorskiej mgra inż. Krzysztofa Stachowiaka

„Wielokryterialne heurystyczne algorytmy rutingu rozgałęźnego”

Promotor: dr hab. inż. Piotr Zwierzykowski

1. Cel, zakres i charakter rozprawy

Recenzowana rozprawa dotyczy optymalizacji sieci teleinformatycznych w zakresie algorytmów rutingu rozgałęźnego (ang. multicast). Ruting rozgałęźny umożliwia efektywne przesyłanie danych do wielu odbiorców w tym samym czasie. Zagadnienia związane z tym obszarem zyskują coraz większe znacznie we współczesnych sieciach teleinformatycznych. Jest to głownie związane z rosnącą popularnością transmisji grupowych w sieci Internet. Według najnowszego raportu Visual Networking Index opublikowanego przez firmę Cisco, w 2021 roku aż 82% ruchu konsumenckiego w sieci Internet będą stanowić transmisje wideo, w tym ruch na żywo (ang. live Internet video) będzie stanowić 13%. Inna ważna usługa dominująca obecnie w sieci Internet to sieć dystrybucji treści CDN (ang. Content Delivery Network). Jedną z najefektywniejszych metod przesyłania danych typu wideo oraz danych w sieciach CDN jest transmisja rozgałęźna typu multicast. Prace badawcze w zakresie optymalizacji rutingu rozgałęźnego są realizowane od lat 80-tych XX wieku. Jednak powstałe rozwiązania mają szereg wad i ograniczeń, co stanowi motywację do poszukiwania nowych rozwiązań w tym zakresie. Jednym z najważniejszych elementów niezbędnych do stosowania rutingu rozgałęźnego w sieciach teleinformatycznych jest wyznaczenie w grafie drzewa Steinera służącego do przesyłania danych od nadawcy do grupy odbiorców. Podstawowym kryterium oceny tworzonego drzewa jest niski koszt umożliwiający obniżenie całościowych kosztów realizacji systemu transmisji typu multicast.

W rozprawie rozważany jest problem wyznaczania wielokryterialnych minimalnych drzew Steinera

(ang. Constrained Minimal Steiner Tree – CMST), który stanowi rozszerzenie klasycznego problem

minimalnych drzew Steinera polegające na jednoczesnym uwzględnieniu wielu kryteriów

optymalizacyjnych. Należy zaznaczyć, że rozważany w rozprawie problem optymalizacyjny jest

NP-trudny. Głównym celem rozprawy było opracowanie nowych, wielokryterialnych algorytmów

rutingu rozgałęźnego, zapewniających niższy koszt tworzonych drzew multicast w porównaniu do

innych metod znanych z literatury. Zaproponowane metody optymalizacji rutingu rozgałęźnego

należą do grupy algorytmów heurystycznych, czyli otrzymane wyniki nie mają gwarancji

optymalności. Dla weryfikacji jakości opracowanych algorytmów rutingu rozgałęźnego Doktorant

przeprowadził wiele badań symulacyjnych uwzględniając szeroki zakres parametrów związanych z

(2)

2

topologiami badanych sieci i zapotrzebowaniami rutingu rozgałęźnego. Tematykę rozprawy oceniam jako aktualną i ważną dla sektora ICT.

Rozprawa ma charakter zarówno poznawczy jak i utylitarny. W zakresie rozważań teoretycznych, mgr inż. Krzysztof Stachowiak opracował dwa autorskie wielokryterialne algorytmy rutingu rozgałęźnego stosujące zaawansowane metody optymalizacji wykorzystujące m.in. relaksację Lagrange’a. Natomiast aspekt utylitarny rozprawy jest związany z przeprowadzeniem obszernych badań symulacyjnych pokazujących, że zaproponowane autorskie algorytmy rutingu rozgałęźnego potrafią wyznaczyć rozwiązania o niższym koszcie od metod znanych z literatury.

2. Zawartości rozprawy

Rozprawa składa się z 6 rozdziałów. Pierwszy rozdział zawiera wprowadzenie do tematyki pracy oraz cel i tezę doktoratu. Rozdział 2 obejmuje opis podstawowych pojęć i zagadnień związanych z teorią grafów i modelowaniem rutingu w sieciach teleinformatycznych. W rozdziale 3 Doktorant przedstawił szereg algorytmów rutingu, w tym autorskie wielokryterialne algorytmy rutingu rozgałęźnego.

Rozdział 4 w szczegółowy sposób opisuje założenia dotyczące przeprowadzanych badań symulacyjnych. W rozdziale 5 Doktorant przedstawił uzyskane wyniki wraz z ich analizą. Rozdział 6 zawiera podsumowanie pracy. W mojej ocenie struktura pracy jest prawidłowa.

3. Poprawności i oryginalności postawionej tezy

Teza pracy jest sformułowana w następujący sposób:

Możliwe jest zaproponowanie nowych, heurystycznych algorytmów dla realizacji połączeń rozgałęźnych w sieciach pakietowych z uwzględnieniem parametrów jakości usług. Możliwe jest także opracowanie uniwersalnej procedury badawczej dla algorytmów tego typu

W mojej opinii teza pracy jest sformułowana generalnie w poprawny sposób. Mgr inż. Krzysztof Stachowiak na podstawie przeglądu literaturowego i własnej wiedzy prawidłowo określił zakres swojej pracy, koncentrując się na zadaniu opracowania nowych, wielokryterialnych algorytmów rutingu rozgałęźnego. Przy zakresie rozprawy podobnym do recenzowanej praca, tj. zaproponowanie i zbadanie nowych algorytmów dla zadań optymalizacji sieci, w wielu przypadkach spotkałem się z podobnym sformułowaniem tezy rozprawy doktorskiej. Jednak w niektórych przypadkach jest możliwe bardziej ambitne podejście do sformułowania tezy rozprawy poprzez nie tylko wykazanie istnienia algorytmów (jak to jest sformułowane w recenzowanej rozprawie), ale także ujęciu w tezie oceny jakości działania algorytmów/podejść w porównaniu do innych metod/podejść i/lub wskazanie obszaru zastosowań, dla których proponowane algorytmy/podejścia sprawdzają się najlepiej.

Moim zdaniem mgr inż. Krzysztof Stachowiak rozwiązał postawiony problem naukowy stosując prawidłowe metody badawcze. Postawione cele zostały w pracy osiągnięte. Dla wykazania tezy pracy Doktorant posłużył się m.in. zaawansowanymi technikami optymalizacyjnymi wykorzystującymi relaksację Lagrange’a oraz przeprowadził obszerne eksperymenty symulacyjne, w których zaimplementował zaproponowane algorytmy oraz inne referencyjne metody z literatury i następnie dla poprawnie stworzonych scenariuszy badawczych przeprowadził szereg badań symulacyjnych.

Wyniki zawarte w pracy są opatrzone analizą i dyskusją.

(3)

3

4. Analiza źródeł (w tym literatury światowej i stanu techniki) świadczącej o dostatecznej wiedzy autora w danej dyscyplinie naukowej

Rozprawa doktorska mgra inż. Krzysztofa Stachowiaka dotyczy aktualnych obecnie zagadnień związanych z realizacja transmisji rozgałęźnych w sieciach teleinformatycznych. Doktorant przeprowadził dokładny przegląd bibliograficzny, lista literatury umieszczona w rozprawie zawiera 138 pozycji. Wśród nich znajdują się najważniejsze prace związane z:

 zastosowaniem transmisji typu multicast w sieciach teleinformatycznych,

 zagadnieniami teorii grafów i optymalizacji sieci teleinformatycznych,

 algorytmami optymalizacji przepływów typu multicast.

Mogę jednoznacznie stwierdzić, że Doktorant posiada dostateczną wiedzę i znajomość współczesnej literatury z zakresu różnorakich aspektów związanych sieciami teleinformatycznymi ze szczególnym uwzględnieniem rutingu rozgałęźnego.

5. Pozycja rozprawy w stosunku do stanu wiedzy i stanu techniki reprezentowanych przez literaturę światową

Tematyka rozprawy jest związana z aktualnie rozwijanymi kierunkami badań w zakresie sieci teleinformatycznych. Doktorant kontynuuje prace badawcze prowadzone od wielu lat w Katedrze Sieci Telekomunikacyjnych i Komputerowych Politechniki Poznańskiej. Zagadnienia dotyczące ruting rozgałęźnego są istotnym obszarem badawczym w sektorze ICT uwzględniając z jednej strony wzrost ruchu w sieciach teleinformatycznych, a z drugiej strony nieustanną potrzebę usprawniania pracy działania tych sieci z jednoczesnym obniżaniem kosztu ich działania. Na szczególne wyróżnienie zasługuje fakt, że Doktorant bardzo dokładnie przeprowadził badania symulacyjne uwzględniając i dokładnie wyjaśniając zastosowane scenariusze symulacyjne.

6. Znaczenie uzyskanych wyników dla danej dyscypliny naukowej

Jako najważniejsze oryginalne osiągnięcia rozprawy doktorskiej mgra inż. Krzysztofa Stachowiaka należy wymienić:

 Opracowanie dwóch autorskich wielokryterialnych algorytmów rutingu rozgałęźnego dla problemu wielokryterialnych minimalnych drzew Steinera CMST (ang. Constrained Minimal Steiner Tree):

o Multicast Aggregated MLARAC (ang. Multi criterion LAgrange Relaxation based Aggregated Cost), który jest rozszerzeniem algorytmu LARAC uwzględniającym optymalizację wielokryterialną.

o Algorytm multicast RDP (ang. RenDez vouz Point), metody opartej na współbieżnej realizacji zmodyfikowanego algorytmu Dijkstry.

 Propozycję autorskiej techniki porównywania algorytmów grafowych obejmującej:

o Technika tzw. drenażu grafu polegająca na alokacji w sieci kolejnych zapotrzebowań

typu multicast i odpowiedniej modyfikacji kosztu krawędzi w grafie

odzwierciedlającej zmniejszające się zasoby w krawędziach sieci.

(4)

4

o Aproksymacji wartości stosowanych ograniczeń polegającej na adaptacyjnym dobrze parametrów badanych instancji w celu znalezienia zakresów wartości umożliwiających osiągnięcie dopuszczalnych wyników.

Należy podkreślić, że zaproponowane techniki porównywania algorytmów grafowych mogą być stosowana także dla innych problemów optymalizacyjnych w sieciach teleinformatycznych.

 Przeprowadzenie badań symulacyjnych w zakresie:

o Wstępnej selekcji parametrów dla przeprowadzanie głównej części symulacji.

o Porównania wyników osiąganych przez dwa autorskie algorytmy oraz metody HMCMC (ang. Heuristic Multi-Constrained MultiCast) zaczerpniętej z literatury w zakresie różnych parametrów charakteryzujących przeprowadzone symulacje, w tym rodzaj i wielkość badanej topologii, liczba odbiorców transmisji multicast.

 Analiza i dyskusja uzyskanych rezultatów badań symulacyjnych potwierdzających, że zaproponowane autorskie algorytmy umożliwiają uzyskanie wyników lepszych od metody referencyjnej z literatury.

Należy podkreślić, że opracowane koncepcje oraz uzyskane wyniki mają duże znaczenia praktyczne.

Doktorant zdefiniował i następnie rozwiązał realny i aktualny problem badawczy związany z optymalizacją sieci teleinformatycznych na potrzeby transmisji typu multicast.

7. Główne wady rozprawy, słabe stron wraz z krytycznymi uwagami szczegółowymi

Uwagi natury ogólnej:

 Rozważany problem minimalnych drzew Steinera CMST można sformułować jako problem całkowitoliczbowy. Dlaczego w pracy nie przedstawiono wyników optymalnych uzyskanych za pomocą rozwiązania problemu całkowitoliczbowego z wykorzystaniem metod dokładnych typu podziału i oszacowań (ang. branch and bound) stosując oprogramowania CPLEX lub GuRoBi?

 W pracy nie ma spisu stosowanych oznaczeń matematycznych, co utrudnia lekturę pracy, gdyż wiele ze stosowanych oznaczeń nie jest jasno zdefiniowanych w tekście. Ponadto, czasami w tekście pracy do opisania tego samego pojęcia stosowane są różne (dość podobne) symbole (oznaczenia) co dodatkowo wprowadza zamieszanie. W końcu, w niektórych przypadkach ten sam symbol jest stosowany dla oznaczenia różnych pojęć (więcej informacji w tym zakresie znajduje się w uwagach szczegółowych).

 Dla opisanych w pracy algorytmów podana jest złożoność obliczeniowa w notacji dużego O.

Jednak w pracy nie umieszczono konkretnych czasów działania poszczególnych algorytmów uzyskanych dla badanych sieci. W rozdziale 5.2 napisano, że wykonanie podanych w pracy algorytmów dla dużych sieci jest bardzo czasochłonne („It must be noted that performing complex algorithms in graphs of large sizes is very time consuming”), jednak dla poparcia tego stwierdzenia nie podano konkretnych czasów działania algorytmów, np. w funkcji wielkości badanej sieci i/lub liczby odbiorców w sesji multicast. Podanie czasów działania algorytmów umożliwiłoby dokładniejszą analizę skalowalności zaproponowanych metod.

 W rozprawie dużo miejsca poświęcono na opis sposobu generowania danych wejściowych do

symulacji (topologie, odbiorcy), jest to opisane w rozdziałach 4 i 5. Jednak nie znalazłem w

pracy opisu innych ważnych parametrów niezbędnych do ewentualnego powtórnego

(5)

5

wykonania badań w celu weryfikacji wyników otrzymanych przez Doktoranta, w szczególności nie znalazłem informacji jak generowane są wartości metryk przypisanych do poszczególnych krawędzi (ang. edge metric).

 W pracy brakuje dokładniejszej analizy porównawczej badanych algorytmów w oparciu o uzyskane wyniki. Praca zawiera wiele wyników symulacji, jednak dyskusja uzyskanych wyników, w szczególności porównanie badanych algorytmów (autorskie algorytmy Doktoranta vs. algorytm z literatury) jest skromne. Na koniec rozdziału 5 jest zdanie

„Therefore, the algorithms proposed by the author in the thesis (Aggregated MLARAC and RDP) have, in a number of case, an advantage over the state-of-the-art algorithm known from the literature (HMCMC).” Jednak brakuje w podsumowaniu omówienia w jakich przypadkach (np. dla jakich rodzajów sieci, wielkości sieci, wielkości grup multicast itd.) poszczególne algorytmy dają najlepsze wyniki i z czego to wynika.

Uwagi polemiczne:

 Model matematyczny przedstawiony w rozdziale 2.1 nie podaje jednoznacznej informacji o tym czy rozważany w pracy model sieci to graf skierowany. Z kontekstu (specyfiki transmisji rozgałęźnych) można się domyślać, że stosowany jest graf skierowany.

 Zastosowane w symulacjach liczby obiorców transmisji multicast to 4, 8, 12,… 24, 28. Są to stosunkowo małe liczby w porównaniu do rozmiaru badanych sieci (liczby węzłów w sieci).

Dlaczego nie zrealizowano badań dla większej liczby odbiorców? Czy wyniki uzyskane dla większej liczby odbiorców byłyby podobne do tych zaprezentowanych w pracy?

 Na niektórych wykresach pokazano zbyt wiele serii danych, co utrudnia analizę uzyskanych wyników. Moim zdaniem czytelniej byłoby pokazywać na danym wykresie wyniki uzyskane dla 3 badanych algorytmów dla jednego rodzaju sieci (Waxman lub Barabasi), gdyż najważniejszym elementem pracy jest porównanie wyników dla poszczególnych algorytmów, a nie porównanie wyników otrzymanych dla poszczególnych rodzajów sieci.

Uwagi szczegółowe:

W pracy pojawiają się na str. 77 pojęcia „cost metric” oraz „hop metric”, które nie są formalnie zdefiniowane.

 W pracy nie jest jasno przedstawione jak w dalszych badaniach zostały użyte wartości podane w Tabeli 5.1, w tym co oznacza pierwsza kolumna, czyli ‘Constraint set’.

 Niektóre ze stosowanych symboli (oznaczeń) są używane wielokrotnie w różnych znaczeniach i kontekstach, co utrudnia lekturę prac, gdyż nie jest do końca jasne jakie jest znaczenie stosowanych oznaczeń. Na przykład:

o Symbol M:

 str. 14, jako liczbę rozważanych metryk;

 str. 21, M jest używane jako wektor metryk.

o Symbol d:

 str. 21, to węzeł docelowy (ang. destination);

 str. 31, we wzorze (3.6) oznaczenie d występuje w innym kontekście, który nie jest zdefiniowany;

 str. 61, d(p) to długość ścieżki p (ang. measure of distance of a path p);

(6)

6

 str. 62, d(u,v) to dystans euklidesowy miedzy węzłami u i v (ang. Euclidean distances);

 str. 63 we wzorze (4.8) występuję nie zdefiniowane oznaczenie d

v

;

 str. 65 d

m

to z kolei parametr używany dla generowania odbiorców transmisji multicast według metody bazującej na centroidach.

o Symbol c:

 str. 24, c

p

(  ) to funkcja kosztu Lagrange’a;

 str. 31, we wzorze (3.5) występuje oznaczenie c

pne

(L), które nie jest wprost zdefiniowane w pracy, nie jest jasno czy to jest to samo znaczenie co na str.

24.;

 str. 31, we wzorze (3.6) występuje oznaczenie c(p

ex

), które nie jest wprost zdefiniowane w pracy;

 str. 33, w algorytmie 3.1 występuje jeszcze oznaczenie c

(r) oraz c

(p

ex

), nie jest jasne czy ma to samo znaczenie co definicja c

p

(  ) podana na str. 24 (ale zamieniona kolejność oznaczeń p i  ).

o Symbol C:

 str. 21, we wzorze (2.5) C to wektor wartości ograniczeń dla kolejnych metryk;

 str. 67, we wzorze (4.11) to chyba skalar dla metryki i; podobnie we wzorze (4.12) i (4.13).

 Jak napisano powyżej, w pracy nie ma spisu oznaczeń matematycznych. Dodatkowo część stosowanych oznaczeń nie jest zdefiniowana i znaczenia tych oznaczeń trzeba się domyślać z kontekstu ich użycia, co znacznie utrudnia lekturę pracy w niektórych miejscach. Na przykład:

o W algorytmie 3.1 występują oznaczenia c

(r) oraz c

(p

ex

), nie jest jasne czy ma to samo znaczenie co definicja c

p

(  ) ze str. 24.

o Wzór (3.11), oznaczenia m

iuM

występujące we wzorze nie pokrywa się z opisem pod wzorem, czyli m

inj

.

o Oznaczenie D

v

stosowane we wzorach (4.3) oraz (4.4) nie jest zdefiniowane.

 Czy we wzorze (4.11) symbol  nie powinien mieć indeksu i, tak jak w definicji tuż nad wzorze, (4.11)?

 Czy we wzorach (4.4) i (4.5) w liczniku po prawej stronie nie powinno być 

v

(tak jak w definicji (4.3)) zamiast 

v

.

Nie jest jasne co oznacza p

c

we wzorze (4.13), czy zamiast p

c

nie powinno być inny symbol (p

0

)?

 Na str. 74 napisano, że badania przeprowadzono dla liczby obiorców transmisji multicast: 4, 8, 12,…, 24. Jednak zaprezentowane dalej wykresy pokazują również wyniki dla 28 odbiorców.

 Dlaczego rozdział 5 nosi tytuł „Exemplary Results”, a nie po prostu „Results”?

(7)

7 8. Konkluzja

Recenzowana rozprawa stanowi oryginalne rozwiązanie jednoznacznie sformułowanego zagadnienia

naukowego. Mgr inż. Krzysztof Stachowiak wykazał w tej rozprawie umiejętność samodzielnego

prowadzenia badań naukowych, a także ich prawidłowej i wnikliwej interpretacji. Wymienione

powyżej uwagi krytyczne nie mają znaczącego wpływu na ogólną pozytywną ocenę pracy. W związku

z powyższym uważam, iż przedstawiona mi do recenzji rozprawa doktorska mgra inż. Krzysztofa

Stachowiaka spełnia wymogi zawarte w Ustawie o stopniach naukowych i tytule naukowym z dnia 14

marca 2003 roku (Dz. U. z 2003 r., nr 65, poz. 595 z późniejszymi zmianami) i wnoszę o dopuszczenie

jej do publicznej obrony.

Cytaty

Powiązane dokumenty

Piotr Boryło opracował nowe algorytmy przydziału zasobów sieciowych pod kątem redukcji ilości dwutlenku węgla emitowanego przez centra danych tworzące chmurę obliczeniową

Studia literaturowe oraz doświadczenia Autorki skłoniły Ją do zaprezentowania głównego celu rozprawy, który przyjmuje brzmienie: ,,analiza funkcjonowania krajowego

VEOF znak EOF VEOL znak EOL VERASE znak ERASE VINTR znak INTR VKILL znak KILL VQUIT znak QUIT VSUSP znak SUSP VSTART znak SUSP VSTOP znak SUSP. Indeksy dla

Metoda typu B obliczania niepewności standardowej jest metodą, w której niepewność jest obliczana innym sposobem niż analiza statystyczna serii obserwacji. W takim przypadku

Procedura określenia powtarzalności i odtwarzalności: Na podstawie powyższych wyników oraz uwzględniając warunek stanowiący, że wartość 5,15  m nie powinna

Zaproponowana przez Doktoranta formuła wyznaczania ceny węgla energetycznego pozwala na wyznaczenie przedziałów opłacalności wzbogacania węgla z uwzględnieniem

Conducted examinations and analyses showed that the developed price system let the profitability o f enrichment appoint ranges as energy coal both for theoretical deliberations

Suma gazów palnych w zależności od czasu trwania wyładowania zupełnego dla oleju mineralnego (OM),estru naturalnego (EN) oraz estru syntetycznego