Dynamizm problemu - Testy algorytmu ContDVRP

8.4 Testy algorytmu ContDVRP

8.4.4 Dynamizm problemu

Dynamizm problemu DVRP jest zaprezentowany w oparciu o obserwowane zmiany rozwią-zań wskazywanych jako optymalne dla pośrednich stanów problemu oraz wartości funkcji jakości dla tych estymacji położenia optimum. Autor rozprawy zaimplementował rów-nież serwis optymalizacyjny realizujący algorytm GA dla DVRP [47], aby mógł stanowić dodatkowy punkt odniesienia dla wyników uzyskiwanych przez ContDVRP.

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

350400450500550600

PrzebiegDprocesuDoptymalizacjiDdlaDContDVRP

Czas

DługośćDtras

minwyrocznia

Rysunek 8.4: Przykładowy przebieg procesu optymalizacji dla instancji c50 z limitem 10⁷ ewaluacji funkcji jakości. min to wynik wybranego przez algorytm optimum, wyrocznia to długość tras z rozwiązania finalnego wskazanego przez algorytm, bez zamówień jeszcze nieznanych w danym przedziale czasowym.

W celu przeprowadzenia analizy dynamizmu DVRP został zarejestrowany przebieg procesu optymalizacji z wykorzystaniem ContDVRP oraz GA, uruchomionych w

środo-wisku równoległych procesu optymalizacyjnych. Zapisane zostały rozwiązania w postaci kodowania przypisania zamówień do pojazdów wskazywane jako optymalne na koniec każ-dego z przedziałów czasowych oraz wartości optimum w kolejnych iteracjach w każdym z serwisów optymalizacyjnych. W dalszej części podrozdziału, poziom dynamizmu pro-blemu jest zaprezentowany w oparciu o zmienność liczby zamówień oczekujących, liczbę wykorzystywanych pojazdów oraz różnice pomiędzy rozwiązaniami dla poszczególnych stanów DVRP z kolejnych kroków czasowych. Odległość pomiędzy tymi estymacjami po-łożenia optimum dla pośrednich stanów problemu została obliczona przy użyciu miary zaprezentowanej we wzorze 5.1.

Dynamizm problemu a liczba ewaluacji funkcji jakości

Porównując wyniki ContDVRP z Tabeli 8.3 (limit 10⁶ ewaluacji funkcji jakości) z wy-nikami z Tabeli 8.4 (limit 10⁷ ewaluacji funkcji jakości) można zauważyć, że zwiększenie liczby ewaluacji poprawia jakość finalnego wyniku (szczegółowe porównanie znajduje się w Dodatku A.6). Z drugiej strony, z przykładowego przebiegu działania algorytmu dla więk-szego budżetu ewaluacji funkcji jakości (Rysunek 8.4), można zaobserwować, że pośrednie rozwiązania są nadmiernie dopasowane do aktualnego stanu problemu (silnie odbiegając od wartości jaką miałoby rozwiązanie pośrednie, gdyby było częścią rozwiązania final-nego). Zestawienie tych dwóch faktów prowadzi do wniosku (sprzecznego z intuicją), że dokładniejsza optymalizacja lokalnych stanów prowadzi do lepszej jakości finalnego roz-wiązania pomimo nadmiernego dopasowania pośrednich rozwiązań do stanów problemu, w których nie są znane wszystkie zamówienia (przykład takiego pośredniego rozwiązania zaprezentowany jest na Rysunku 7.3).

Częściowe wyjaśnienie tej obserwacji można dostrzec na prezentowanym w początko-wej części pracy harmonogramie floty pojazdów (Rysunek 3.3). Przedstawiony tam har-monogram rozwiązania o dobrej finalnej jakości zawiera duże przerwy w pracy pojazdów, co sugeruje możliwość przeprowadzenia kilku tur procesu optymalizacji przed ostatecz-nym zatwierdzeniem przypisania zamówienia do danego pojazdu. Dalsze wyjaśnienie tego zjawiska prezentuje Rysunek 8.5c, przedstawiający uśrednioną względną wielkość zada-nia obserwowaną w procesie optymalizacji. Na wykresie można zaobserwować, że istnieje przedział czasowy (tuż przed T_CO), w którym algorytm optymalizacyjny może zmieniać przypisanie 70-80% zamówień (w zależności od przyjętej konfiguracji serwisu optymaliza-cyjnego), które są już znane, ale jeszcze nie zatwierdzone. Wykres ten tłumaczy też istot-ność przekazywania rozwiązań z poprzedniego kroku czasowego. Proces optymalizacyjny mając możliwość modyfikacji przypisania do pojazdu i kolejności obsługi przynajmniej 50% zamówień przez prawie 75% dnia roboczego, może efektywnie wykorzystać informa-cję z poprzedniego kroku czasowego. Te obserwacje potwierdzają słuszność zdefiniowania empirycznego stopnia dynamizmu problemu em.dod (Definicja 26), gdyż jego średnia

war-84

Tabela 8.6: Porównanie wyników ContDVRP z dodaną funkcją kary i bez niej z wynikami MAPSO i MEMSO oparte na całkowitym budżecie 10⁶ ewaluacji funkcji jakości. Liczby w nawiasach oznaczają odpowiednio: liczbę przedziałów czasowych, liczbę serwisów opty-malizacyjnych oraz liczbę ewaluacji funkcji jakości w pojedynczym kroku czasowym w jednym serwisie optymalizacyjnym.

M AP SO M EM SO ContDV RP_{P SO}^k=2 ContDV RP_{P SO}^k=2 + P (25 ∗ 8 ∗ (0.5 ∗ 10⁴)) (25 ∗ 8 ∗ (0.5 ∗ 10⁴)) (40 ∗ 8 ∗ (0.31 ∗ 10⁴)) (40 ∗ 8 ∗ (0.31 ∗ 10⁴))

Min Śr. Min Śr. Min Śr. Min Śr.

c50 571.34 610.67 577.60 592.95 544.11 578.31 551.34 580.56 c75 931.59 965.53 928.53 962.54 884.43 903.72 886.42 901.05 c100b 866.42 882.39 864.19 878.81 819.56 845.80 819.56 844.56 c100 953.79 973.01 949.83 968.92 902.00 933.46 873.77 920.69 c120 1223.49 1295.79 1164.63 1284.62 1053.18 1071.38 1056.70 1116.08 c150 1300.43 1357.71 1274.33 1327.24 1098.03 1134.20 1097.27 1127.04 c199 1595.97 1646.37 1600.57 1649.17 1362.65 1408.70 1374.47 1418.71 f71 287.51 296.76 283.43 294.85 274.16 298.50 270.20 275.27 f134 15150.50 16193.00 14814.10 16083.82 11746.40 11892.00 11713.20 11810.04 tai75a 1794.38 1849.37 1785.11 1837.00 1685.23 1805.03 1691.95 1782.79 tai75b 1396.42 1426.67 1398.68 1425.80 1365.36 1422.60 1356.50 1401.38 tai75c 1483.10 1518.65 1490.32 1532.45 1439.02 1510.00 1424.91 1486.78 tai75d 1391.99 1413.83 1342.26 1448.19 1408.79 1433.25 1403.85 1428.91 tai100a 2178.86 2214.61 2170.54 2213.75 2137.30 2216.23 2147.07 2226.48 tai100b 2140.57 2218.58 2093.54 2190.01 2060.65 2136.80 2041.96 2125.19 tai100c 1490.40 1550.63 1491.13 1553.55 1458.81 1494.72 1446.98 1485.47 tai100d 1838.75 1928.69 1732.38 1895.42 1663.87 1727.95 1658.48 1718.18 tai150a 3273.24 3389.97 3253.77 3369.48 3338.71 3530.82 3396.49 3526.10 tai150b 2861.91 2956.84 2865.17 2959.15 2910.06 3026.89 2931.16 3034.65 tai150c 2512.01 2671.35 2510.13 2644.69 2497.65 2603.53 2523.53 2642.82 tai150d 2861.46 2989.24 2872.80 3006.88 2869.79 3009.01 2929.91 3023.48

tość (w zakresie 0.2-0.3) jest istotnie mniejsza od średniej wartości stopnia dynamizmu dod (Definicja 23), wynoszącej 0.5 dla zbioru instancji testowych.

Dynamizm problemu a zastosowanie funkcji kary

W celu weryfikacji wpływu dodania funkcji kary (wzór (7.6)) do funkcji jakości, na uzy-skiwane wyniki oraz poziom ich zmienności w czasie, zostały przeprowadzone obliczenia metodą ContDVRP w konfiguracji z algorytmem PSO, z limitem 10⁶ ewaluacji funkcji ja-kości oraz dodaną funkcją kary. W Tabeli 8.6, porównującej wyniki tego eksperymentu z eksperymentem bazowym oraz MAPSO i MEMSO, można zaobserwować, że został osią-gnięty nieznaczny wzrost poprawy średnich rezultatów (o około 0.5%, względem Cont-DVRP bez funkcji kary). Bardziej istotnych obserwacji można dokonać na Rysunku 8.5e, prezentującym rozkłady względnych wyników. Dla eksperymentu z funkcją kary (ozn.

ContDVRP+P 10⁶) rozkład ten ma krótszy ogon od rozkładu względnych wyników dla bazowej konfiguracji ContDVRP (ozn. ContDVRP 10⁶). Na Rysunku 8.5a można dodat-kowo zaobserwować, że algorytm z funkcją kary zwraca bardziej stabilne rozwiązania dla pośrednich stanów problemu niż algorytm bazowy.

0 10 20 30 40

(a) Różnica względem finalnego rozwią-zania

ContDVRP 10^6 ContDVRP + P 10^6 GA 10^6 ContDVRP 10^5

1.001.051.101.151.201.251.30

Podsumowanie dla różnych typów kodowania i funkcji jakości

Konfiguracja algorytmu

Rysunek 8.5: Prezentacja dynamiki problemu dla uśrednionych wyników cząstkowych w każdym z kroków czasowych dla podstawowej wersji algorytmu, wersji z dodaną estymacją finalnie potrzebnej liczby pojazdów, wersji ze zmniejszonym budżetem na obliczenia oraz wersji wykorzystującej kodowanie CIZ i operatory genetyczne z pracy [47].

Ostatnia obserwacja dotyczy skuteczności estymacji liczby pojazdów potrzebnych do obsłużenia finalnego zbioru zamówień (Rysunek 8.5d). Przy zastosowaniu funkcji kary liczba pojazdów wykorzystywanych w rozwiązaniu od początku oscyluje w pobliżu 85-90% finalnego zapotrzebowania. Z operacyjnego punktu widzenia jest to niezwykle istotne, gdyż potencjalnie pozwala na zmniejszenie liczby pojazdów i kierowców utrzymywanych w rezerwie danego dnia, co powinno przełożyć się na znaczny spadek kosztów.

Dynamizm problemu a wybór przestrzeni przeszukiwań

W celu weryfikacji wpływu wyboru przestrzeni przeszukiwań na dynamizm problemu, zo-stał zaimplementowany serwis optymalizacyjny realizujący algorytm GA dla DVRP [47].

Na Rysunku 8.5a można zaobserwować różnicę między rozwiązaniem znalezionym przez algorytm w danym przedziale czasowym a finalnym rozwiązaniem optymalnym, nato-miast na Rysunku 8.5b różnice między rozwiązaniami wskazywanymi w kolejnych prze-działach czasowych. W obu tych porównaniach zastosowanie algorytmu ContDVRP skut-kuje większą stabilnością rozwiązań pośrednich, niż stabilność uzyskana przez algorytm GA wykorzystujący dyskretną przestrzeń przeszukiwań. Zestawiając wyniki konfiguracji ContDVRP 10⁶, ContDVRP 10⁵ oraz GA 10⁶, można zaobserwować, że stabilność po-średnich wyników jest silniej powiązana z wyborem przestrzeni przeszukiwań, niż jakością finalnego wyniku.

W dokumencie POLITECHNIKA WARSZAWSKA (Stron 103-107)