• Nie Znaleziono Wyników

Adrian Horzyk

N/A
N/A
Protected

Academic year: 2021

Share "Adrian Horzyk"

Copied!
15
0
0

Pełen tekst

(1)

Sztuczne Systemy Skojarzeniowe SSS Relacje Bazodanowe czy Asocjacje AGDS?

DB Relations v AGDS Associations?

AGH Akademia Górniczo-Hutnicza

Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Katedra Automatyki i Inżynierii Biomedycznej Laboratorium Biocybernetyki

30-059 Kraków, al. Mickiewicza 30, paw. C3/205

Adrian Horzyk

horzyk@agh.edu.pl

(2)

Wiedza i inteligencja pozwalają nam wnioskować oraz podejmować decyzje dzięki odpowiedniemu powiązaniu/skojarzeniu danych i możliwości

wykorzystania tych powiązań/skojarzeń w przyszłości:

 Relacyjne bazy danych – umożliwiają horyzontalne powiązanie atrybutów danych poprzez relacje.

 Systemy asocjacyjne – umożliwiają horyzontalne i wertykalne powiązanie danych.

CO REPREZENTOWAĆ, ŻEBY WNIOSKOWAĆ?

POWIĄZANIA I WNIOSKOWANIE

ASOCJACYJNE

RELACYJNE

(3)

 Problem BIG DATA kładzie współczesną informatykę na łopatki, lecz to problem relacyjnych baz danych oraz struktur liniowych!

 BIG DATA is caused by BIG NUMBER of unrepresented relations between data that are hardly to find and mine.

 Dlaczego ludzki umysł radzi sobie z napływem BIG DATA codziennie i bez większego wysiłku? Dlatego że struktury asocjacyjne,

takie jak w ludzkim mózgu i całym układzie nerwowym, reprezentują też relacje wertykalne, które nie trzeba czasochłonnie i żmudnie

wyszukiwać, szczególnie, że ich przybywa wraz z rozmiarem danych!

 Chcąc więc poradzić sobie z problemem BIG DATA skutecznie musimy zmienić podejście do przetwarzania danych oraz ich reprezentacji

w systemach informatycznych tak, żeby odwzorowywać od razu

w strukturze te relacje, a nie tracić czas i pieniądze na ich wyszukiwanie.

 Jeśliby nasz umysł miał przeszukiwać wszystkie zapamiętane obiekty w trakcie podejmowania decyzji, wtedy byśmy zamarli na bardzo długo zanim bylibyśmy w stanie wykonać jakikolwiek sensowny ruch.

Problem BIG DATA

(4)

 Problem reprezentacji wiedzy we współczesnych systemach informatycznych również bierze się z braku reprezentacji relacji

wertykalnych pomiędzy danymi, odpowiedniej asocjacyjnej agregacji danych, obiektów i konsolidacji ich sekwencji i grafów!

 Wiedza oraz możliwość wnioskowania biorą się właśnie z możliwości wykorzystania równocześnie relacji horyzontalnych i wertykalnych

pomiędzy danymi, gdyż one kryją bogactwo skojarzeń naszego umysłu.

 Jeśli więc wykorzystywana struktura danych reprezentuje tylko ubogi zbiór relacji pomiędzy danymi obiektami, wtedy większość problemów związanych z wnioskowaniem staje się obliczeniowo trudna O(n!).

 Jeśli zaś wykorzystamy odpowiednie struktury asocjacyjne,

które reprezentują odpowiednie bogactwo relacji pomiędzy danymi, wtedy nie musimy wyszukiwać relacji, badać różnych kombinacji, wariacji, permutacji, warunków… i wtedy też wiele zadań staje się

obliczeniowo łatwymi, zwykle o złożoności stałej O(1) lub liniowej O(n).

 Winowajcą jest tutaj mało efektywny liniowy model obliczeniowy z roku 1936, na którym nadal jeszcze bazują współczesne komputery – maszyna Turinga.

Problem Reprezentacji Wiedzy

(5)

 Problem stworzenia sztucznej inteligencji jest oczywiście również związany z tymi zagadnieniami, gdyż inteligencja potrzebuje dobrego modelu wiedzy, aby mogła efektywnie, poprawnie i automatycznie wnioskować!

 Alan Turing był nie wątpliwie bardzo mądrym człowiekiem i stworzył wiele przydatnych rozwiązań oraz zawdzięczamy mu współczesne komputery

i sprzęt elektroniczny, z którego chętnie korzystamy i dzięki któremu rozwinęła się nasza cywilizacja.

 Jednak model maszyny Turinga nie rozwiąże nam problemu BIG DATA, problemu formowania i reprezentacji wiedzy, ani nie doprowadzi do powstania sztucznej inteligencji.

 Czy rzeczywiście wierzymy, że tasiemka z głowicą może mieć (od)ruchy inteligentne?

 Możliwość operowania na liczbach i symbolach to za mało do stworzenia maszyn dysponujących wiedzą i inteligencją…

Problem Sztucznej Inteligencji

?

(6)

 Relacyjne bazy danych (obecnie najczęściej stosowane na świecie) służą do przechowywania danych, ich rekordów oraz relacji pomiędzy ich atrybutami. UWAGA: nie danymi lecz ich atrybutami!

Przez to zmuszeni jesteśmy do czasochłonnego przeszukiwania danych w celu odnalezienia wertykalnych relacji pomiędzy danymi, np.:

poszukiwanie minimów, maksimów, średnich, median, sum, odchyleń, podobieństw, różnic, danych odstających, duplikatów, grup/klas itp.

– to wszystko przykłady operacji wynikających z relacji wertykalnych.

 Transformacja relacyjnych tabel bazodanowych do struktur asocjacyjnych automatycznie wydobywa (automatic mining) z danych relacje

wertykalne pomiędzy nimi, upraszczając i przyspieszając eksplorację danych, wnioskowanie, grupowanie, klasyfikację oraz przeszukiwanie.

 Struktury AGDS pozwalają również na asocjacyjną reprezentację wielu tabel powiązanych relacjami (przy pomocy kluczy głównych i obcych).

 W wyniku asocjacyjnej agregacji wielu danych z wielu tabel powstaje jeden spójny graf AGDS (lub struktura neuronowa) reprezentujący/a asocjacyjne związki (relacje) z wszystkich tabel łącznie i równocześnie.

Transformacja powiązanych tabel do AGDS

(7)

To proces po części przypominający normalizację, gdyż

w trakcie tego procesu dochodzi do agregacji duplikatów danych dla poszczególnych atrybutów, jak również do

agregacji duplikatów całych obiektów lub ich składowych.

Celem tego procesu jest otrzymanie grafowej struktury AGDS lub aktywnych asocjacyjnych grafów neuronowych AANG albo sztucznych systemów skojarzeniowych AAS, które na tej strukturze bazują i ją wzbogacają.

Struktury skojarzeniowe AGDS reprezentują wiele relacji wertykalnych, których nie znajdziemy w relacyjnych BD, ale nie oznacza to, iż poprzez taką transformację

uzyskamy automatycznie wszystkie przydatne relacje pomiędzy obiektami. To już zadanie dla systemów AAS…

ASOCJACYJNA TRANSFORMACJA

RELACYJNYCH BAZ DANYCH DO AGDS

(8)

Mamy relacyjną bazę danych i schemat relacji pomiędzy atrybutami danych:

Mamy też tabele wypełnione danymi, a tabele są powiązane relacjami:

Relacyjne BD      Asocjacyjne AGDS

Dokonując asocjacyjnej transformacji tej bazy z automatycznym wydobyciem pozostałych relacji pomiędzy danymi:

 Zamieniamy wszystkie unikalne wartości danych na wierzchołki (receptory) połączone z węzłem reprezentującym atrybut

(pole sensoryczne), czyli: Imię, Nazwisko,

Stypendium, Rok studiów, Miasto, Ulica, Numer i Nazwa kierunku. W przypadku istnienia

porządku na danych wiążemy je dodatkowo połączeniami odwzorowującymi ich kolejność (nadajemy wagi połączeniom).

 Wszystkie klucze główne przekształcamy w węzły (neurony), które łączymy

z odpowiednimi węzłami (receptorami)

atrybutów reprezentującymi wartości danych oraz z odpowiednimi węzłami (neuronami) reprezentującymi rekordy w innych tabelach.

Przekształcenie robimy od tabel

reprezentujących relacje po stronie „jeden”

(Adres i Kierunek) do tabel reprezentujących relacje po stronie „wielu” (Studenci).

 Jeśli wszystkie tabele są powiązane relacjami, wtedy powstanie spójny pasywny graf AGDS lub aktywną sieć neuronowa AANG

asocjacyjnie reprezentujące bazę danych.

(9)

Relacyjne BD      Asocjacyjne AGDS

Dokonujemy transformacji

Beata Jan Katarzyna Sebastian Anna

A5: Imię

Kowalski Małecka Nowicka Rybicki Konieczny

A6: Nazwisko

Wesołowska

Sodej Wybicka

700

A7: Stypendium R=500

800 900 1000 1200 2

A8: Rok studiów R=2

3 4

Automatyka i Robotyka

A4: Kierunek

Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków

A1: Miasto

A2: Ulica

A3: Numer R=43

18 23 45

2 4

Bronowicka Piastowska Reymonta

A1

A3 A4

A5

A2

S1

S3

S4

S2

S5

S7

S8 S6

S9

(10)

Asocjacyjną transformację rozpoczynamy od tabel reprezentujących wartości atrybutów, następnie te, które z nich korzystają itd.

Automatyka i Robotyka

A4: Kierunek

Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków

A1: Miasto

A2: Ulica

A3: Numer R=43

18 23 45

2 4

Bronowicka Piastowska Reymonta

A1

A3 A4

A5

A2

(11)

Podaj wszystkich studentów, którzy: studiują AiR, mieszkają na Reymonta, mają stypendium 1000zł, są na 4 roku studiów, mieszkają razem, mają imieniny w tym samym dniu… Odpowiedzi na pytania można udzielić szybko!

Beata Jan Katarzyna Sebastian Anna

A5: Imię

Kowalski Małecka Nowicka Rybicki Konieczny

A6: Nazwisko

Wesołowska

Sodej Wybicka

700

A7: Stypendium R=500

800 900 1000 1200 2

A8: Rok studiów R=2

3 4

Automatyka i Robotyka

A4: Kierunek

Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków

A1: Miasto

A2: Ulica

A3: Numer R=43

18 23 45

2 4

Bronowicka Piastowska Reymonta

A1

A3 A4

A5

A2

S1

S3

S4

S2

S5

S7

S8 S6

S9

(12)

Możemy odpowiadać równie łatwo na bardziej skomplikowane pytania:

Którzy studenci mieszkający na Reymonta są na 3. roku studiów i biorą stypendium 800zł? Porównaj złożoność takich operacji z bazami danych.

Beata Jan Katarzyna Sebastian Anna

A5: Imię

Kowalski Małecka Nowicka Rybicki Konieczny

A6: Nazwisko

Wesołowska

Sodej Wybicka

700

A7: Stypendium R=500

800 900 1000 1200 2

A8: Rok studiów R=2

3 4

Automatyka i Robotyka

A4: Kierunek

Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków

A1: Miasto

A2: Ulica

A3: Numer R=43

18 23 45

2 4

Bronowicka Piastowska Reymonta

A1

A3 A4

A5

A2

S1

S3

S4

S2

S5

S7

S8 S6

S9

(13)

Relacyjna BD  Asocjacyjne AGDSAktywne AANG Które relacje wertykalne pojawiły nam się w grafie?

Beata Jan Katarzyna Sebastian Anna

SA5

Ann SA5

Jan SA5

Kat SA5

SA5 Se Be

A5: Imię

Kowalski Małecka Nowicka Rybicki Konieczny

SA6

Kon SA6

Mał SA6

No SA6

SA6 Ry Ko

A6: Nazwisko

Wesołowska

Sodej Wybicka

700

A7: Stypendium R=500 800 900 1000 1200

MIN MAX

SA7

min SA7 700 SA7

800 SA7 900 SA7

1000 SA7

1200 SA7

max

2

A8: Rok studiów R=2

3 4

MIN MAX

SA8

min SA8 2 SA8

3 SA8 4 SA8

max

Automatyka i Robotyka

A4: Kierunek

Informatyka Inżynieria Biomedyczna Elektrotechnika SA4

AiR SA4

Inf SA4

IB SA4

Ele Kraków

SA1

Krak

A1: Miasto

A2: Ulica

A3: Numer R=43

18 23 45

2 4

MIN MAX

SA3 2 SA3

4 SA3 18 SA3

23 SA3 SA3 45

min SA3

max

Bronowicka Piastowska Reymonta SA2

Bro SA2

Pia SA2

4.8

SA6

So SA6

We SA6

Wy

A1

A3 A4

A5

A2

S1

S3

S4

S2

S5

S7

S8 S6

S9

(14)

 Asocjacje mogą reprezentować dowolne relacje pomiędzy obiektami oraz umożliwić szybkie wnioskowanie.

 Powiązania asocjacyjne umożliwiają nam przechodzenie od danych definiujących obiekty do obiektów i vice versa oraz pomiędzy podobnymi danymi, obiektami.

 Wszystkie powiązania asocjacyjne dostępne są od razu, tzn. bez szukania, bez sprawdzania kombinacji, bez pętli…

Trzeba przejść tylko po odpowiednich połączeniach.

 Dzięki temu drastycznie maleje czas potrzebny na

wykonanie takich operacji, co jest związane ze znaczącym się zmniejszeniem złożoności obliczeniowej, zwykle do poziomu złożoności stałej lub maksymalnie liniowej.

ASOCJACJE SĄ TAK BOGATE JAK CHCEMY

ASOCJACYJNE WNIOSKOWANIE

(15)

BIBLIOGRAFIA

1. Horzyk, A., How Does Generalization and Creativity Come into Being in Neural Associative Systems and How Does It Form Human-Like Knowledge?,

Neurocomputing, 2014, IF = 1,634.

2. Horzyk, A., Human-Like Knowledge Engineering, Generalization and Creativity in Artificial Neural Associative Systems, Springer Verlag, AISC 11156, ISSN 2194-5357, DOI 10.1007/978-3-319-19090-7, Springer, Switzerland, 2016, pp. 39-51.

3. Horzyk, A., Innovative Types and Abilities of Neural Networks Based on Associative Mechanisms and a New Associative Model of Neurons - referat na zaproszenie na międzynarodowej konferencji ICAISC 2015, Springer Verlag, LNAI, 2015.

4. Horzyk, A., Sztuczne systemy skojarzeniowe i asocjacyjna sztuczna inteligencja, EXIT, Warszawa, 2013.

5. Tadeusiewicz, R., Horzyk, A., Man-Machine Interaction Improvement by Means of Automatic Human Personality Identification, Gerhard Goos, Juris Hartmanis, and Jan van Leeuwen (Eds.), Springer, LNCS 8104, 2013.

6. Horzyk, A., Gadamer, M., Associative Text Representation and Correction, Springer Verlag Berlin Heidelberg,

LNAI 7894, 2013, pp. 76-87.

7. Horzyk, A., Information Freedom and Associative Artificial Intelligence, Springer Verlag Berlin Heidelberg, LNAI 7267, 2012, pp. 81-89.

8. Horzyk, A., Self-Optimizing Neural Network 3, L. Franco, D. Elizondo, J.M. Jerez (eds.), Constructive Neural Networks, Springer, Series: Studies in Computational Intelligence, Vol. 258, 2009, pp. 83-101.

9. Dudek-Dyduch, E., Tadeusiewicz, R., Horzyk, A., Neural Network Adaptation Process Effectiveness Dependent of Constant Training Data Availability, Neurocomputing 72, 2009, pp. 3138-3149, IF = 1,440.

horzyk@agh.edu.pl

Cytaty

Powiązane dokumenty

Kasabov, Time-Space, Spiking Neural Networks and Brain-Inspired Artificial Intelligence, In Springer Series on Bio- and Neurosystems, Vol 7., Springer, 2019.. Holk Cruse,

• It allows developing and training various machine learning and deep learning models with scikit-learn, TensorFlow, Keras, Theano etc.. • It supplies us with data analysis

AGH University of Science and Technology.

Mini-batch mode and regularization mechanisms, such as Dropout and L1/L2 weight regularization, are turned off at the testing time, so the model does not change as during

Kasabov, Time-Space, Spiking Neural Networks and Brain-Inspired Artificial Intelligence, In Springer Series on Bio- and Neurosystems, Vol 7., Springer, 2019.. Holk Cruse,

Mini-batch mode and regularization mechanisms, such as Dropout and L1/L2 weight regularization, are turned off at the testing time, so the model does not change as during training

The exploration of patterns generated and purified based on the Apriori rule is called the Generalized Sequential Pattern (GSP) algorithm for Mining and Pruning... EXPLORATION OF

• It allows developing and training various machine learning and deep learning models with scikit-learn, TensorFlow, Keras, Theano etc.. • It supplies us with data analysis