Sztuczne Systemy Skojarzeniowe SSS Relacje Bazodanowe czy Asocjacje AGDS?
DB Relations v AGDS Associations?
AGH Akademia Górniczo-Hutnicza
Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Katedra Automatyki i Inżynierii Biomedycznej Laboratorium Biocybernetyki
30-059 Kraków, al. Mickiewicza 30, paw. C3/205
Adrian Horzyk
horzyk@agh.edu.pl
Wiedza i inteligencja pozwalają nam wnioskować oraz podejmować decyzje dzięki odpowiedniemu powiązaniu/skojarzeniu danych i możliwości
wykorzystania tych powiązań/skojarzeń w przyszłości:
Relacyjne bazy danych – umożliwiają horyzontalne powiązanie atrybutów danych poprzez relacje.
Systemy asocjacyjne – umożliwiają horyzontalne i wertykalne powiązanie danych.
CO REPREZENTOWAĆ, ŻEBY WNIOSKOWAĆ?
POWIĄZANIA I WNIOSKOWANIE
ASOCJACYJNE
RELACYJNE
Problem BIG DATA kładzie współczesną informatykę na łopatki, lecz to problem relacyjnych baz danych oraz struktur liniowych!
BIG DATA is caused by BIG NUMBER of unrepresented relations between data that are hardly to find and mine.
Dlaczego ludzki umysł radzi sobie z napływem BIG DATA codziennie i bez większego wysiłku? Dlatego że struktury asocjacyjne,
takie jak w ludzkim mózgu i całym układzie nerwowym, reprezentują też relacje wertykalne, które nie trzeba czasochłonnie i żmudnie
wyszukiwać, szczególnie, że ich przybywa wraz z rozmiarem danych!
Chcąc więc poradzić sobie z problemem BIG DATA skutecznie musimy zmienić podejście do przetwarzania danych oraz ich reprezentacji
w systemach informatycznych tak, żeby odwzorowywać od razu
w strukturze te relacje, a nie tracić czas i pieniądze na ich wyszukiwanie.
Jeśliby nasz umysł miał przeszukiwać wszystkie zapamiętane obiekty w trakcie podejmowania decyzji, wtedy byśmy zamarli na bardzo długo zanim bylibyśmy w stanie wykonać jakikolwiek sensowny ruch.
Problem BIG DATA
Problem reprezentacji wiedzy we współczesnych systemach informatycznych również bierze się z braku reprezentacji relacji
wertykalnych pomiędzy danymi, odpowiedniej asocjacyjnej agregacji danych, obiektów i konsolidacji ich sekwencji i grafów!
Wiedza oraz możliwość wnioskowania biorą się właśnie z możliwości wykorzystania równocześnie relacji horyzontalnych i wertykalnych
pomiędzy danymi, gdyż one kryją bogactwo skojarzeń naszego umysłu.
Jeśli więc wykorzystywana struktura danych reprezentuje tylko ubogi zbiór relacji pomiędzy danymi obiektami, wtedy większość problemów związanych z wnioskowaniem staje się obliczeniowo trudna O(n!).
Jeśli zaś wykorzystamy odpowiednie struktury asocjacyjne,
które reprezentują odpowiednie bogactwo relacji pomiędzy danymi, wtedy nie musimy wyszukiwać relacji, badać różnych kombinacji, wariacji, permutacji, warunków… i wtedy też wiele zadań staje się
obliczeniowo łatwymi, zwykle o złożoności stałej O(1) lub liniowej O(n).
Winowajcą jest tutaj mało efektywny liniowy model obliczeniowy z roku 1936, na którym nadal jeszcze bazują współczesne komputery – maszyna Turinga.
Problem Reprezentacji Wiedzy
Problem stworzenia sztucznej inteligencji jest oczywiście również związany z tymi zagadnieniami, gdyż inteligencja potrzebuje dobrego modelu wiedzy, aby mogła efektywnie, poprawnie i automatycznie wnioskować!
Alan Turing był nie wątpliwie bardzo mądrym człowiekiem i stworzył wiele przydatnych rozwiązań oraz zawdzięczamy mu współczesne komputery
i sprzęt elektroniczny, z którego chętnie korzystamy i dzięki któremu rozwinęła się nasza cywilizacja.
Jednak model maszyny Turinga nie rozwiąże nam problemu BIG DATA, problemu formowania i reprezentacji wiedzy, ani nie doprowadzi do powstania sztucznej inteligencji.
Czy rzeczywiście wierzymy, że tasiemka z głowicą może mieć (od)ruchy inteligentne?
Możliwość operowania na liczbach i symbolach to za mało do stworzenia maszyn dysponujących wiedzą i inteligencją…
Problem Sztucznej Inteligencji
?
Relacyjne bazy danych (obecnie najczęściej stosowane na świecie) służą do przechowywania danych, ich rekordów oraz relacji pomiędzy ich atrybutami. UWAGA: nie danymi lecz ich atrybutami!
Przez to zmuszeni jesteśmy do czasochłonnego przeszukiwania danych w celu odnalezienia wertykalnych relacji pomiędzy danymi, np.:
poszukiwanie minimów, maksimów, średnich, median, sum, odchyleń, podobieństw, różnic, danych odstających, duplikatów, grup/klas itp.
– to wszystko przykłady operacji wynikających z relacji wertykalnych.
Transformacja relacyjnych tabel bazodanowych do struktur asocjacyjnych automatycznie wydobywa (automatic mining) z danych relacje
wertykalne pomiędzy nimi, upraszczając i przyspieszając eksplorację danych, wnioskowanie, grupowanie, klasyfikację oraz przeszukiwanie.
Struktury AGDS pozwalają również na asocjacyjną reprezentację wielu tabel powiązanych relacjami (przy pomocy kluczy głównych i obcych).
W wyniku asocjacyjnej agregacji wielu danych z wielu tabel powstaje jeden spójny graf AGDS (lub struktura neuronowa) reprezentujący/a asocjacyjne związki (relacje) z wszystkich tabel łącznie i równocześnie.
Transformacja powiązanych tabel do AGDS
To proces po części przypominający normalizację, gdyż
w trakcie tego procesu dochodzi do agregacji duplikatów danych dla poszczególnych atrybutów, jak również do
agregacji duplikatów całych obiektów lub ich składowych.
Celem tego procesu jest otrzymanie grafowej struktury AGDS lub aktywnych asocjacyjnych grafów neuronowych AANG albo sztucznych systemów skojarzeniowych AAS, które na tej strukturze bazują i ją wzbogacają.
Struktury skojarzeniowe AGDS reprezentują wiele relacji wertykalnych, których nie znajdziemy w relacyjnych BD, ale nie oznacza to, iż poprzez taką transformację
uzyskamy automatycznie wszystkie przydatne relacje pomiędzy obiektami. To już zadanie dla systemów AAS…
ASOCJACYJNA TRANSFORMACJA
RELACYJNYCH BAZ DANYCH DO AGDS
Mamy relacyjną bazę danych i schemat relacji pomiędzy atrybutami danych:
Mamy też tabele wypełnione danymi, a tabele są powiązane relacjami:
Relacyjne BD Asocjacyjne AGDS
Dokonując asocjacyjnej transformacji tej bazy z automatycznym wydobyciem pozostałych relacji pomiędzy danymi:
Zamieniamy wszystkie unikalne wartości danych na wierzchołki (receptory) połączone z węzłem reprezentującym atrybut
(pole sensoryczne), czyli: Imię, Nazwisko,
Stypendium, Rok studiów, Miasto, Ulica, Numer i Nazwa kierunku. W przypadku istnienia
porządku na danych wiążemy je dodatkowo połączeniami odwzorowującymi ich kolejność (nadajemy wagi połączeniom).
Wszystkie klucze główne przekształcamy w węzły (neurony), które łączymy
z odpowiednimi węzłami (receptorami)
atrybutów reprezentującymi wartości danych oraz z odpowiednimi węzłami (neuronami) reprezentującymi rekordy w innych tabelach.
Przekształcenie robimy od tabel
reprezentujących relacje po stronie „jeden”
(Adres i Kierunek) do tabel reprezentujących relacje po stronie „wielu” (Studenci).
Jeśli wszystkie tabele są powiązane relacjami, wtedy powstanie spójny pasywny graf AGDS lub aktywną sieć neuronowa AANG
asocjacyjnie reprezentujące bazę danych.
Relacyjne BD Asocjacyjne AGDS
Dokonujemy transformacji
Beata Jan Katarzyna Sebastian Anna
A5: Imię
Kowalski Małecka Nowicka Rybicki Konieczny
A6: Nazwisko
Wesołowska
Sodej Wybicka
700
A7: Stypendium R=500
800 900 1000 1200 2
A8: Rok studiów R=2
3 4
Automatyka i Robotyka
A4: Kierunek
Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków
A1: Miasto
A2: Ulica
A3: Numer R=43
18 23 45
2 4
Bronowicka Piastowska Reymonta
A1
A3 A4
A5
A2
S1
S3
S4
S2
S5
S7
S8 S6
S9
Asocjacyjną transformację rozpoczynamy od tabel reprezentujących wartości atrybutów, następnie te, które z nich korzystają itd.
Automatyka i Robotyka
A4: Kierunek
Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków
A1: Miasto
A2: Ulica
A3: Numer R=43
18 23 45
2 4
Bronowicka Piastowska Reymonta
A1
A3 A4
A5
A2
Podaj wszystkich studentów, którzy: studiują AiR, mieszkają na Reymonta, mają stypendium 1000zł, są na 4 roku studiów, mieszkają razem, mają imieniny w tym samym dniu… Odpowiedzi na pytania można udzielić szybko!
Beata Jan Katarzyna Sebastian Anna
A5: Imię
Kowalski Małecka Nowicka Rybicki Konieczny
A6: Nazwisko
Wesołowska
Sodej Wybicka
700
A7: Stypendium R=500
800 900 1000 1200 2
A8: Rok studiów R=2
3 4
Automatyka i Robotyka
A4: Kierunek
Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków
A1: Miasto
A2: Ulica
A3: Numer R=43
18 23 45
2 4
Bronowicka Piastowska Reymonta
A1
A3 A4
A5
A2
S1
S3
S4
S2
S5
S7
S8 S6
S9
Możemy odpowiadać równie łatwo na bardziej skomplikowane pytania:
Którzy studenci mieszkający na Reymonta są na 3. roku studiów i biorą stypendium 800zł? Porównaj złożoność takich operacji z bazami danych.
Beata Jan Katarzyna Sebastian Anna
A5: Imię
Kowalski Małecka Nowicka Rybicki Konieczny
A6: Nazwisko
Wesołowska
Sodej Wybicka
700
A7: Stypendium R=500
800 900 1000 1200 2
A8: Rok studiów R=2
3 4
Automatyka i Robotyka
A4: Kierunek
Informatyka Inżynieria Biomedyczna Elektrotechnika Kraków
A1: Miasto
A2: Ulica
A3: Numer R=43
18 23 45
2 4
Bronowicka Piastowska Reymonta
A1
A3 A4
A5
A2
S1
S3
S4
S2
S5
S7
S8 S6
S9
Relacyjna BD Asocjacyjne AGDS Aktywne AANG Które relacje wertykalne pojawiły nam się w grafie?
Beata Jan Katarzyna Sebastian Anna
SA5
Ann SA5
Jan SA5
Kat SA5
SA5 Se Be
A5: Imię
Kowalski Małecka Nowicka Rybicki Konieczny
SA6
Kon SA6
Mał SA6
No SA6
SA6 Ry Ko
A6: Nazwisko
Wesołowska
Sodej Wybicka
700
A7: Stypendium R=500 800 900 1000 1200
MIN MAX
SA7
min SA7 700 SA7
800 SA7 900 SA7
1000 SA7
1200 SA7
max
2
A8: Rok studiów R=2
3 4
MIN MAX
SA8
min SA8 2 SA8
3 SA8 4 SA8
max
Automatyka i Robotyka
A4: Kierunek
Informatyka Inżynieria Biomedyczna Elektrotechnika SA4
AiR SA4
Inf SA4
IB SA4
Ele Kraków
SA1
Krak
A1: Miasto
A2: Ulica
A3: Numer R=43
18 23 45
2 4
MIN MAX
SA3 2 SA3
4 SA3 18 SA3
23 SA3 SA3 45
min SA3
max
Bronowicka Piastowska Reymonta SA2
Bro SA2
Pia SA2
4.8
SA6
So SA6
We SA6
Wy
A1
A3 A4
A5
A2
S1
S3
S4
S2
S5
S7
S8 S6
S9
Asocjacje mogą reprezentować dowolne relacje pomiędzy obiektami oraz umożliwić szybkie wnioskowanie.
Powiązania asocjacyjne umożliwiają nam przechodzenie od danych definiujących obiekty do obiektów i vice versa oraz pomiędzy podobnymi danymi, obiektami.
Wszystkie powiązania asocjacyjne dostępne są od razu, tzn. bez szukania, bez sprawdzania kombinacji, bez pętli…
Trzeba przejść tylko po odpowiednich połączeniach.
Dzięki temu drastycznie maleje czas potrzebny na
wykonanie takich operacji, co jest związane ze znaczącym się zmniejszeniem złożoności obliczeniowej, zwykle do poziomu złożoności stałej lub maksymalnie liniowej.
ASOCJACJE SĄ TAK BOGATE JAK CHCEMY
ASOCJACYJNE WNIOSKOWANIE
BIBLIOGRAFIA
1. Horzyk, A., How Does Generalization and Creativity Come into Being in Neural Associative Systems and How Does It Form Human-Like Knowledge?,
Neurocomputing, 2014, IF = 1,634.
2. Horzyk, A., Human-Like Knowledge Engineering, Generalization and Creativity in Artificial Neural Associative Systems, Springer Verlag, AISC 11156, ISSN 2194-5357, DOI 10.1007/978-3-319-19090-7, Springer, Switzerland, 2016, pp. 39-51.
3. Horzyk, A., Innovative Types and Abilities of Neural Networks Based on Associative Mechanisms and a New Associative Model of Neurons - referat na zaproszenie na międzynarodowej konferencji ICAISC 2015, Springer Verlag, LNAI, 2015.
4. Horzyk, A., Sztuczne systemy skojarzeniowe i asocjacyjna sztuczna inteligencja, EXIT, Warszawa, 2013.
5. Tadeusiewicz, R., Horzyk, A., Man-Machine Interaction Improvement by Means of Automatic Human Personality Identification, Gerhard Goos, Juris Hartmanis, and Jan van Leeuwen (Eds.), Springer, LNCS 8104, 2013.
6. Horzyk, A., Gadamer, M., Associative Text Representation and Correction, Springer Verlag Berlin Heidelberg,
LNAI 7894, 2013, pp. 76-87.
7. Horzyk, A., Information Freedom and Associative Artificial Intelligence, Springer Verlag Berlin Heidelberg, LNAI 7267, 2012, pp. 81-89.
8. Horzyk, A., Self-Optimizing Neural Network 3, L. Franco, D. Elizondo, J.M. Jerez (eds.), Constructive Neural Networks, Springer, Series: Studies in Computational Intelligence, Vol. 258, 2009, pp. 83-101.
9. Dudek-Dyduch, E., Tadeusiewicz, R., Horzyk, A., Neural Network Adaptation Process Effectiveness Dependent of Constant Training Data Availability, Neurocomputing 72, 2009, pp. 3138-3149, IF = 1,440.