• Nie Znaleziono Wyników

Adrian Horzyk

N/A
N/A
Protected

Academic year: 2021

Share "Adrian Horzyk"

Copied!
24
0
0

Pełen tekst

(1)

Sztuczne Systemy Skojarzeniowe SSS Asocjacyjne grafowe struktury danych

AGDS

Associative Graph Data Structure

AGH Akademia Górniczo-Hutnicza

Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Katedra Automatyki i Inżynierii Biomedycznej Laboratorium Biocybernetyki

30-059 Kraków, al. Mickiewicza 30, paw. C3/205

Adrian Horzyk

horzyk@agh.edu.pl

(2)

Struktura reprezentacji danych odgrywa bardzo istotne znaczenie w informatyce i decyduje o:

 Dostępie do danych

 Szybkości operacji na danych

 Utrwaleniu relacji pomiędzy danymi

 Bogactwie reprezentacji relacji pomiędzy danymi STRUKTURY REPREZENTACJI DANYCH

STRUKTURA REPREZENTACJI DANYCH

PASYWNA AKTYWNA

(3)

PASYWNE STRUKTURY DANYCH Umożliwiają przechowywanie

danych w ich nienaruszonej postaci i formie.

AKTYWNE STRUKTURY DANYCH Dopuszczają możliwość

wzajemnego oddziaływania

danych na siebie.

(4)

 Proszę opisać widoczne relacje pomiędzy tymi danymi?

 Czy to są wszystkie relacje?

 Czy istnieją jakieś ukryte relacje, których nie widać?

 Czy wszystkie relacje pomiędzy danymi są utrwalone lub

zapamiętane bezpośrednio?

 Czy warto byłoby utrwalić jeszcze jakieś relacja, które z punktu

widzenia obliczeń byłyby przydatne lub wartościowe?

 Jak reprezentacja danych wpływa na szybkość ich przetwarzania lub dostępu do nich?

 Co zrobić, żeby zwiększyć

efektywność pracy na danych?

 Czy struktura ma znaczenie?

Klasyczne pasywne tabelaryczne struktury danych

(5)

AGDS

to pasywna asocjacyjna grafowa struktura danych

(6)

AGDS

asocjacyjna grafowa struktura danych

(associative graph data structure)

(7)

AGDS - asocjacyjna grafowa struktura danych

(8)

 Co zyskujemy stosując AGDS w porównaniu

do klasycznej tabelarycznej struktury danych?

 Jakie są wady i zalety tych struktur?

 Jak wpływa struktura na efektywność operacji

na danych w tych strukturach?

 Którą strukturę

wybrać i dlaczego?

Porównanie klasycznej struktury z AGDS

TRANSFORMACJA

?

(9)

Dostęp do elementów grafu uzyskuje za pośrednictwem wyróżnionego węzła głównego param, który posiada połączenia z wszystkimi parametrami (atrybutami, cechami), a one z wartościami, a te etykietami wzorców.

Tworzenie grafowej struktury AGDS opartej na drzewie

swi 5,8 2,6

sle 5,0 2,3 5,4 3,0 6,3 3,3 R2

R1 R3 R4

WZORCE IRIS

6,7 3,0 6,0 2,7

6,0 2,2 4,9 2,5 R6

R5

R8 R9

5,9 3,2 R7

pwi 4,0 1,2 ple 3,3 1,0 4,5 1,5 4,7 1,6 5,0 1,7 5,1 1,6

5,0 1,5 4,5 1,7 4,8 1,8

klasa VERSI VERSI

VERSI VERSI VERSI VERSI

VIRGIN VIRGIN VERSI

6,0 3,0 5,7 2,5 6,5 3,2 R10

R12 R13

5,8 2,7 R11

4,8 1,8 5,0 2,0 5,1 2,0 5,1 1,9

VIRGIN

VIRGIN VIRGIN VIRGIN param

swi

5,8 2,6 sle

5,0 2,3 5,4 3,0 6,3 3,3 R2

R1 R3 R4

WZORCE IRIS

6,7 3,0 6,0 2,7

6,0 2,2 4,9 2,5 R6

R5

R8 R9

5,9 3,2 R7

pwi

4,0 1,2 ple

3,3 1,0 4,5 1,5 4,7 1,6 5,0 1,7 5,1 1,6

5,0 1,5 4,5 1,7 4,8 1,8

klasa

VERSI VERSI

VERSI VERSI VERSI VERSI

VIRGIN VIRGIN VERSI

6,0 3,0 5,7 2,5 6,5 3,2 R10

R12 R13

5,8 2,7 R11

4,8 1,8 5,0 2,0 5,1 2,0 5,1 1,9

VIRGIN

VIRGIN VIRGIN VIRGIN param

swi

5,8 2,6 sle

5,0 2,3 5,4 3,0 6,3 3,3

R2

R1 R3 R4

WZORCE IRIS

6,7 3,0 6,0 2,7

6,0 2,2 4,9 2,5

R6

R5 R8 R9

5,9 3,2

R7 pwi

4,0 1,2 ple

3,3 1,0 4,5 1,5 4,7 1,6 5,0 1,7 5,1 1,6

5,0 1,5 4,5 1,7 4,8 1,8

klasa

VERSI VERSI

VERSI VERSI VERSI VERSI

VIRGIN VIRGIN VERSI

6,0 3,0 5,7 2,5 6,5 3,2

R10 R12 R13 5,8 2,7

R11 4,8 1,8

5,0 2,0 5,1 2,0 5,1 1,9

VIRGIN

VIRGIN VIRGIN VIRGIN param

swi

5,8 2,6

sle

5,0 5,4 6,3 2,3 3,0 3,3

R2

R1 R3 R4

WZORCE IRIS w grafowej strukturze opartej na drzewie

6,7

6,0 2,2 2,7

4,9 2,5

R6

R5 R8 R9

5,9 3,2

R7

pwi

4,0 1,2

ple

3,3 4,5 4,7 4,8 5,0 5,1 1,0 1,5 1,6 1,7 1,8 klasa

VERSI

5,7 6,5

R10 R11 R12 R13

2,0 VIRGIN 1,9

param

AGDS

Asocjacyjna transformacja

(10)

Struktura grafowa oparta na drzewie pozwala uzyskać bardzo szybki dostęp do dowolnych danych oraz reprezentowanych relacji pomiędzy tymi danymi.

Jeśli kolejność rekordów ma znaczenie można dodać połączenia pomiędzy nimi, celem odwzorowania tej kolejności.

Grafowa struktura AGDS i dostęp do danych

swi

5,8 2,6

sle

5,0 5,4 6,3 2,3 3,0 3,3

R2

R1 R3 R4

6,7

6,0 2,2 2,7

4,9 2,5

R6

R5 R8 R9

5,9 3,2

R7

pwi

4,0 1,2

ple

3,3 4,5 4,7 4,8 5,0 5,1 1,0 1,5 1,6 1,7 1,8 klasa

VERSI

5,7 6,5

R10 R11 R12 R13

2,0 VIRGIN 1,9

param

AGDS

(11)

Dla dowolnego zbioru danych i zadania klasyfikacji

można poszukać podobieństw umożliwiających określenie dyskryminujących je grup

(12)

Struktura AGDS dla zbioru Irys z ML Repository

(13)

Struktura AGDS i klasyczna struktura tabelaryczna dla zbioru Irys

USUNIĘCIE

NADMIAROWOŚCI

(14)

Struktura AGDS i klasyczna struktura tabelaryczna dla zbioru Irys

AGREGACJA

I ELIMINACJA

DUPLIKATÓW

(15)

Struktura AGDS i klasyczna struktura tabelaryczna dla zbioru Irys

ZAGREGOWANA REPREZENTACJA ZDUPLIKOWANYCH

OBIEKTÓW

(16)

Struktura AGDS i klasyczna struktura tabelaryczna dla zbioru Irys

BRAK REDUDANCJI

I DUPLIKATÓW

(17)

Korelacje pomiędzy klasą Virginica a Setosa i Versicolor

SZYBKIE ZNAJDYWANIE KORELACJI

(18)

OBCE KORELACJE UTRUDNIAJĄCE DYSKRYMINACJĘ

?

(19)

ZNAJDYWANIE ZALEŻNOŚCI POMIĘDZY DANYMI I ICH GRUPAMI

WYKRYWANIE

ZALEŻNOŚCI

(20)

 To struktury pasywne

 Przechowywanie posortowanych danych

względem wszystkich atrybutów równocześnie

 Usunięcie wszelkiej nadmiarowości, duplikatów

 Bezstratną kompresję danych poprzez eliminację duplikatów

 Powiązanie danych poprzez dodatkowe relacje (nie występujące w tabelarycznych strukturach)

 Szybszy dostęp do danych i ich przetwarzanie

 Osiągnięcie podstawowych asocjacyjnych właściwości ASOCJACYJNE GRAFOWE STRUKTURY DANYCH

AGDS

pasywne

AANG

aktywne

Czy można od struktur danych oczekiwać jeszcze więcej?

TAK

(21)

AGDS dzięki swoistej asocjacji i agregacji danych w strukturze grafowej są

w stanie zastąpić nie tylko mało efektywne struktury tabelaryczne, lecz również zastąpić część operacji na danych związanych z przeszukiwaniem tabel, tj.:

 wyszukiwanie danych lub obiektów podobnych, różnych, skorelowanych, odwrotnych, sąsiednich, duplikatów

 filtrowanie i wyszukiwanie grup, klas względem wybranych wartości cech lub ich zakresów

 porządkowanie obiektów według wybranych grup atrybutów

ASOCJACYJNE GRAFOWE STRUKTURY DANYCH

Mówimy, że struktura danych zastępuje operacje wykonywane na innej strukturze danych wtedy, gdy złożoność obliczeniowa uzyskania danych

wynikowych zmniejsza się i osiąga stałą złożoność obliczeniową O(1).

Mówiąc potocznie, jeśli po wyniki przetwarzania danych na innej strukturze (np. tabeli) możemy sięgnąć w czasie stałym (np. w AGDS), nie musząc je przeszukiwać w celu zgromadzenia wyników (np. grupowania, określenia

sąsiadów, duplikatów), wtedy struktura zastępuje operacje na danych.

Ze względu na to, iż w informatyce najwięcej czasu tracimy na różne operacje przeszukiwania danych, struktury AGDS mogą przyspieszyć działanie programów

kilkadziesiąt, kilkaset lub kilka tysięcy razy w zależności od rozmiaru danych!

(22)

 Aktywne asocjacyjne struktury grafowe znajdujemy np. w ludzkim mózgu, dlatego właśnie proces przetwarzania danych przez ludzki umysł jest taki szybki i skuteczny mimo pozornie wolno działających neuronów!

 Dzięki takim strukturom w ludzkim mózgu nie muszą zachodzić procesy

przeszukiwania, porównywania i eksploracji danych w pętlach obliczeniowych ani nie istnieją tabele danych.

 Biologiczne procesy formowania wiedzy, przechowywania danych, informacji i wnioskowania oparte są na asocjacjach, które sięgają po odpowiednie dane, jeśli takowe zostały w nich utrwalone na skutek uczenia się, doświadczenia, introspekcji, wnioskowania i innych procesów myślowych.

 Ponadto ludzki umysł ma zdolność zestawiania ze sobą różnych wywołanych z pamięci zdarzeń niezależnie od rzeczywistego miejsca i czasu ich zaistnienia.

Ta zdolność pozwala na tworzenie nowych kontekstów skojarzeniowych

dla procesów myślowych, jak również zapewnia kreatywność oraz możliwość uogólniania na wysokim poziomie mentalnym, logicznym i abstrakcyjnym.

ASOCJACYJNE GRAFOWE STRUKTURY DANYCH a LUDZKI UMYSŁ

We współczesnej informatyce na razie za dużo czasu i pieniędzy tracimy na mało efektywne przeszukiwanie ogromnych ilości danych… A można inaczej!

(23)

 Wykorzystamy neurony i ich aktywny i dynamiczny charakter do aktywnej reprezentacji struktur danych.

AKTYWNA REPREZENTACJA DANYCH AGDS?

AGDS

pasywne

AANG

aktywne

(24)

BIBLIOGRAFIA

1. Horzyk, A., How Does Generalization and Creativity Come into Being in Neural Associative Systems and How Does It Form Human-Like Knowledge?,

Neurocomputing, 2014, IF = 1,634.

2. Horzyk, A., Human-Like Knowledge Engineering, Generalization and Creativity in Artificial Neural Associative Systems, Springer, AISC 11156, 2014.

3. Horzyk, A., Human-Like Knowledge Engineering, Generalization and Creativity in Artificial Neural Associative Systems, Springer Verlag, AISC 11156, ISSN 2194-5357, 2015.

4. Horzyk, A., Innovative Types and Abilities of Neural Networks Based on Associative Mechanisms and a New Associative Model of Neurons - referat na zaproszenie na międzynarodowej konferencji ICAISC 2015, Springer Verlag, LNAI, 2015.

5. Horzyk, A., Sztuczne systemy skojarzeniowe i asocjacyjna sztuczna inteligencja, EXIT, Warszawa, 2013.

6. Tadeusiewicz, R., Horzyk, A., Man-Machine Interaction Improvement by Means of Automatic Human Personality Identification, Gerhard Goos, Juris Hartmanis, and Jan van Leeuwen (Eds.), Springer, LNCS 8104, 2013.

7. Horzyk, A., Gadamer, M., Associative Text Representation and Correction, Springer Verlag Berlin Heidelberg,

LNAI 7894, 2013, pp. 76-87.

8. Horzyk, A., Information Freedom and Associative Artificial Intelligence, Springer Verlag Berlin Heidelberg, LNAI 7267, 2012, pp. 81-89.

9. Horzyk, A., Self-Optimizing Neural Network 3, L. Franco, D. Elizondo, J.M. Jerez (eds.), Constructive Neural Networks, Springer, Series: Studies in Computational Intelligence, Vol. 258, 2009, pp. 83-101.

10. Dudek-Dyduch, E., Tadeusiewicz, R., Horzyk, A., Neural Network Adaptation Process Effectiveness Dependent of Constant Training Data Availability, Neurocomputing 72, 2009, pp. 3138-3149, IF = 1,440.

horzyk@agh.edu.pl

Cytaty

Powiązane dokumenty

Podstawowe zasady analizy algorytmów: poprawność, złożoność obliczeniowa (klasy złożoności czasowej i pamięciowej), koszt zamortyzowany. Polskie Ramy

Startujemy od mało efektywnego (naiwnego) algorytmu i konstruujemy algorytm efektywniejszy.. Transformacyjna

Idea algorytmu Kruskala: z posortowanej niemalejąco wg wag listy krawędzi – dołączane są kolejne, jeśli nie tworzą cyklu (algorytm zachłanny).. Algorytmy grafowe: minimalne

są równoważne w tym sensie, że jeśli dany problem jest rozwiązywany przez jeden model w czasie ograniczonym od góry przez wielomian zależny od rozmiarów problemu, to przy

Zatem, jeśli istniałby algorytm wielomianowy do rozwiązywa- nia jakiegokolwiek problemu NP-zupełnego, to każdy problem z klasy NP (w tym również problemy NP-zupełne)

Nie można mówić, że dla problemu NP-zupełnego najprawdopodobniej nie zostanie znaleziony wielomianowy algorytm rozwiązujący.. Następny slajd

Sposób kodowania danych wejściowych ma wpływ na rozmiar problemu (długość danych wejściowych). Czy każdy z następujących sposobów

Problem