• Nie Znaleziono Wyników

Wyniki obliczeń

W dokumencie Index of /rozprawy2/10161 (Stron 134-138)

ROZDZIAŁ 4 ADAPTACYJNA DETEKCJA ZDARZEŃ Z WYKORZYSTANIEM

4.7 Badania efektywności proponowanego algorytmu detekcji zdarzeń

4.7.4 Badanie efektywności detekcji zdarzeń dla danych empirycznych

4.7.4.4 Wyniki obliczeń

100 ef = +A zw LR S S S Ws (4.34)

gdzie SLR jest sumą zmian wykrytych wcześniej (szybciej) w stosunku do chwili detekcji istotnych zmian z wykorzystaniem algorytmu segmentacji LR; Szw – sumą wykrytych zmian zwiastujących zmianę trendu z wyprzedzeniem do 22. próbek (tj. wykrytych wcześniej w stosunku do momentów zmian segmentów sygnalizowanych podczas działania segmentacji LR); SA – sumą wszystkich wykrytych (potwierdzonych) zmian B1K1 z wykorzystaniem proponowanego algorytmu detekcji zdarzeń.

4.7.4.4 Wyniki obliczeń

Dla wszystkich szeregów bazowych przeprowadzono analizy detekcji i potwierdzania zmian typu B1K1. Dla każdej liczby generowanych komórek (nK) obliczono wskaźniki efektywności WDz (wzór 4.30) i WSef (wzór 4.34). Wyniki obliczeń umieszczono

w załączniku 4, w tabelach ZT4.17-ZT4.22 (dla nK = 10), ZT4.23-ZT4.28 (nK = 20) oraz

ZT4.29-ZT4.34 (nK = 30). Ponadto, na podstawie zestawień szczegółowych (załącznik 4) obliczono zbiorcze wskaźniki efektywności WSef (uśredniono wyniki dla szeregów bazowych poddanych analizie), które przedstawiono w tabelach 4.5-4.7.

Przesunięcie 0 5 10 15 20 ρD 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.3 56.00% 59.15% 55.03% 57.21% 55.89% 57.52% 57.01% 56.31% 57.59% 57.02% 0.4 56.63% 59.08% 57.93% 58.01% 55.62% 58.51% 52.56% 58.25% 53.16% 57.32% ρm 0.5 53.33% 58.92% 59.82% 59.08% 56.45% 59.12% 50.85% 55.52% 51.67% 57.39%

Tab. 4.5 Zbiorcze wyniki pomiaru efektywności algorytmu detekcji zdarzeń (WSef, wzór 4.34) dla

liczby generowanych komórek ustawionej na nK = 10. Zestawienie sporządzono na postawie tabel

ZT4.17-ZT4.22 umieszczonych w załączniku 4. Przesunięcie 0 5 10 15 20 ρD 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.3 56.04% 56.31% 58.17% 56.36% 56.54% 57.25% 56.90% 57.56% 58.74% 57.43% 0.4 57.89% 56.28% 60.68% 56.44% 57.19% 57.01% 57.36% 58.23% 54.92% 56.11% ρm 0.5 54.69% 58.88% 58.73% 58.59% 65.00% 57.30% 63.41% 57.55% 47.22% 56.51%

Tab. 4.6 Zbiorcze wyniki pomiaru efektywności algorytmu detekcji zdarzeń (WSef, wzór 4.34) dla

liczby generowanych komórek ustawionej na nK = 20. Zestawienie sporządzono na postawie tabel

Przesunięcie 0 5 10 15 20 ρD 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.3 55.16% 57.12% 56.36% 56.91% 55.40% 58.50% 55.43% 57.01% 56.17% 56.69% 0.4 61.19% 56.31% 54.82% 55.86% 59.48% 57.35% 55.51% 58.11% 56.96% 55.36% ρm 0.5 62.50% 60.68% 60.87% 57.89% 72.00% 56.98% 54.84% 59.68% 56.67% 56.80%

Tab. 4.7 Zbiorcze wyniki pomiaru efektywności algorytmu detekcji zdarzeń (WSef, wzór 4.34) dla

liczby generowanych komórek ustawionej na nK = 30. Zestawienie sporządzono na postawie tabel

ZT4.29-ZT4.34 umieszczonych w załączniku 4.

Badania testowe przeprowadzono z wykorzystaniem wielu losowo zmieniających się parametrów (tematyka badań nie obejmowała ich optymalizacji), nie stosowano także arbitralnego doboru metod wyznaczania miary podobieństwa, dostrojonych do konkretnych szeregów, bądź ich charakterystyki statystycznej. Proponowany algorytm nie uwzględnia wszystkich inspiracji immunologicznych, m.in. mechanizmu konstrukcji pamięci immunologicznej. Z uwagi na powyższe, uzyskane rezultaty należy traktować jako punkt wyjścia do dalszych badań, dający możliwości istotnego zwiększenia precyzji wykrywania zmian.

Jak pokazano w tabelach 4.5-4.7, uzyskano zadowalającą skuteczność detekcji, uzyskiwaną dla losowego doboru typu sygnału pierwotnego, co uznać można za potwierdzenie zasadności stosowania proponowanej w pracy koncepcji. Taki losowy dobór typu sygnałów pierwotnych stwarza duże możliwości wychwytywania zdarzeń o zróżnicowanych wzorcach.

Dla niemal wszystkich wariantów progów akceptacji podobieństwa (

ρ

D) oraz dopasowania (

ρ

m) wskaźnik efektywności WSef liczony dla wszystkich analizowanych szeregów (wzór 4.34) przyjmuje wartości powyżej 50%, co oznacza, że w każdym przypadku ponad połowa wykrytych zmian typu B1K1 jest trafnym zwiastunem zmian trendu, przyspieszającym decyzję algorytmu segmentacji LR.

Jak widać w tabeli 4.5 (nK = 10) oraz w zestawieniach szczegółowych (tab. ZT4.17-ZT4.22), dla pojedynczych spółek (TPSA, IBSYSTEM, PEKAO) – szeregów lokalnych – oraz dla większości szeregów cen surowców (Brent, USCoal, LMECash, Silver, Zinc) uzyskano szczególnie dobre wyniki (pomiary efektywności

WSef), dochodzące do 100%. Takie wartości wskazują, że dla danego szeregu bazowego niemal wszystkie zmiany typu B1K1 stanowiły trafny sygnał zwiastujący lub cechowały się stosunkowo krótkim opóźnieniem detekcji.

Dla szeregów zagregowanych (przede wszystkim indeksów globalnych i światowych: SP500, DAX, FTSE, DJI) oraz walut (USD, GBP) uzyskano niską skuteczność, średnio rzędu około 30%, co wskazuje na ich nieprzydatność do prognozowania

średnioterminowego z wykorzystaniem proponowanych mechanizmów. Można przyjąć,

że niezadowalające wyniki dla szeregów kursów walut mają związek zarówno z ich słabą prognozowalnością, jak i zastosowaniem do badania krótkoterminowego podobieństwa. Niska skuteczność dla indeksów światowych i globalnych wynika ze sposobu konstruowania takich wskaźników, które stanowią uśrednioną (zagregowaną) informację o otoczeniu. Niemniej, mają one istotne znaczenie dla analizy środowiska szeregu bazowego z uwagi na fakt, że wyznaczają cykle w gospodarce oraz ich przebiegi mają bardziej wygładzony kształt w odniesieniu do innych szeregów (indeksy są mniej wrażliwe na krótkotrwałe, lokalne zmiany).

Dla podwojonej liczby generowanych komórek otoczenia (nK = 20, tabele ZT4.23-ZT4.28; patrz podrozdział 4.2) najlepsze wyniki uzyskano także dla pojedynczych spółek oraz większości cen surowców. Dla pozostałych szeregów wskaźnik efektywności detekcji WSef (wzór 4.34) przyjmuje wartości większe, w porównaniu do rezultatów badań prowadzonych dla 10. generowanych komórek (nK = 10). Można zatem stwierdzić, że zwiększenie liczby komórek ma wpływ na zwiększenie efektywności detekcji, co obrazuje zbiorcza tabela 4.6 (trzykrotnie uzyskano efektywność przekraczającą 60%).

W przypadku liczby komórek otoczenia nK = 30 (tab. ZT4.29-ZT4.34) obserwujemy podobne zróżnicowanie efektywności detekcji dla poszczególnych szeregów bazowych, jak dla parametrów nK = 10 oraz nK = 20. Obserwowany jest dalszy wzrost skuteczności detekcji, sięgającej ponad 70% dla niektórych konfiguracji wartości parametrów (patrz tabela 4.7, dla opóźnienia 10 próbek,

ρ

D = 0.1,

ρ

m = 0.5, a także tabele ZT4.29-ZT4.34). Związane jest to jednak ze znacznie większą czasochłonnością obliczeń.

Dla wszystkich wariantów doboru liczby generowanych komórek otoczenia (parametry

nK = 10, nK = 20, nK = 30) widoczna jest wyraźna (prawie binarna) zależność skuteczności detekcji (WSef) od wartości parametrów algorytmu detekcji (wartości WSef

są bądź zerowe, bądź bliskie 100% w zależności od arbitralnych ustawień parametrów algorytmu). W szczególności, dla progów

ρ

D = 0.1,

ρ

m = 0.5 (załącznik, tab. ZT4.19, ZT4.25, ZT4.31) oraz opóźnienia pomiędzy szeregami ustawionego na 5 lub 10 próbek, osiągana jest skuteczność na poziomie 100% (dla zdecydowanej większości szeregów)

lub jest ona zerowa (WSef = 0.00%). Należy zaznaczyć, że dla takich ustawień progów widoczna jest niewielka liczba wykrytych zmian typu B1K1, co wskazuje na trafność przyjętych koncepcji detekcji (szybkie i pewne sygnalizowanie o pojawieniu się zdarzenia w szeregu).

Wyniki obliczeń wskazują na istotność doboru opóźnienia (przesunięcia) analizowanych fragmentów szeregów wchodzących w skład komórek BK. Jak widać w tabelach 4.5-4.7, najlepsze rezultaty uzyskano dla przesunięcia wynoszącego co najmniej 5 próbek.

Zwiększenie liczebności komórek otoczenia istotnie wpływa na czas prowadzonych obliczeń (tabela 4.8). Warto zauważyć, że znaczny przyrost czasu nie przekłada się na analogiczny (procentowy) przyrost skuteczności detekcji (tabele 4.5, 4.6, 4.7).

Przesunięcie 0 5 10 15 20

ρD 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5

nK = 10 74.69 94.90 95.95 95.14 96.50 95.05 97.80 95.65 103.54 95.59

nK = 20 128.42 127.36 126.62 127.00 127.76 126.12 127.05 125.96 127.20 132.72

nK = 30 184.81 183.80 184.56 175.90 183.72 182.67 184.14 182.14 185.10 182.79

Tab. 4.8 Uśrednione czasy (w sekundach) działania algorytmu detekcji zdarzeń dla różnych wartości

przesunięć (0, 5, 10, 15, 20) oraz dwóch progów podobieństwa ρD (0.1 i 0.5).

Na rysunkach ZT4.17-ZT4.34 widoczna jest zależność pomiędzy zmianą wskaźnika

WSef, a zmianą progu dopasowania

ρ

m, obserwowana dla wybranych arbitralnych ustawień parametrów algorytmu. W szczególności, dla (a) opóźnień pomiędzy szeregami komórki wynoszących 5, 10 próbek i liczby komórek nK = {10, 20, 30}, (b) dla niektórych wartości mierzonej efektywności WSef przy opóźnieniu 15 próbek i nK = 20,

ρ

D = 0.1 i nK = 30,

ρ

D = 0.5, a także dla (c) opóźnienia zerowego i nK = 20,

ρ

D = 0.5, nK = 30,

ρ

D = 0.1, obserwowany jest wzrost skuteczności detekcji zdarzeń wprost proporcjonalny do wzrostu progu dopasowania

ρ

m. W przypadku pozostałych wartości opóźnień zależność ta jest odwrotnie proporcjonalna dla wszystkich progów badania podobieństwa bądź jej zmiany nie mają istotnego charakteru.

Przyrost skuteczności detekcji wynosi około 1% wraz ze zwiększeniem progu dopasowania

ρ

m o 0.1, przy czym w przypadku zmiany

ρ

m z wartości 0.3 na 0.4 przyrost ten jest większy w relacji do zmiany progu z wartości 0.4 na 0.5. Można zatem przyjąć,

że próg

ρ

m = 0.5 (zaistnienie zdarzenia co najmniej w połowie badanych komórek otoczenia) jest najbardziej odpowiedni.

W dokumencie Index of /rozprawy2/10161 (Stron 134-138)

Powiązane dokumenty