• Nie Znaleziono Wyników

Modele wieloparametrowe

N/A
N/A
Protected

Academic year: 2021

Share "Modele wieloparametrowe"

Copied!
11
0
0

Pełen tekst

(1)

Modele wieloparametrowe

Marcin Orchel

AGH University of Science and Technology in Poland

1 / 11

(2)

Agenda

Agenda 2 / 11

(3)

1

Koncepcja sieci neuronowych

Agenda 3 / 11

(4)

Koncepcja sieci neuronowych

Koncepcja sieci neuronowych 4 / 11

(5)

Koncepcja sieci neuronowych

Istotnym elementem modelu sieci neuronowych jest sumowanie sygnałów wejściowych z odpowiednią wagą i poddanie otrzymanej sumy działaniu nieliniowej funkcji aktywacji.

inspiracja mózgiem człowieka, 85 miliardów neuronów, każdy neuron ma kilka tysięcy połączeń, w sumie około 100 trylionów

neuron ma wiele wejść informacyjnych (dendryty), i oraz pojedynczy nośnik informacji wyjściowej (akson), który jest powielany i rozsyłany do różnych neuronów odbiorczych przez rozgałęzioną strukturę wyjściową (telodendron)

Koncepcja sieci neuronowych 5 / 11

(6)

Model neuronu

p - liczba wejść w neuronie

wektor wejściowy x = [x

1

, . . . , x

p

]

T

wagi neuronu w = [w

0

, . . . , w

p

]

T

. Zauważmy, że rozmiar wektora wagowego jest identyczny jak rozmiar wektora wejściowego (w

0

odpowiada wartości x

0

= 1)

y - wartość wyjściowa neuronu, w

0

- wartość progowa neuronu, f - funkcja aktywacji. Mamy

y = f (s) (1)

gdzie

s =

n

X

i =0

x

i

w

i

= ~ x

T

· ~ w + w

0

(2) gdzie s to sygnał wyjściowy. Zakładamy, że wartość sygnału x

0

jest równa 1. Jest to przydatne do tego aby otrzymać wyraz wolny b.

Waga w

0

, czyli wyraz wolny nazywamy progiem.

Koncepcja sieci neuronowych 6 / 11

(7)

Model neuronu

W perceptronie funkcja f ma szczególną postać

f (s) = 1 (3)

gdy s > 0 oraz

f (s) = −1 (4)

gdy s ≤ 0.

Zadanie polega na znalezieniu wektora wagowego, tak aby rozwiązać wybrany problem uczenia maszynowego

Dla problemu klasyfikacji definiujemy funkcję aktywacji jak wyżej.

A więc kluczowymi elementami neuronu są: występowanie iloczynu skalarnego oraz nieliniowej funkcji aktywacji

Koncepcja sieci neuronowych 7 / 11

(8)

Model neuronu

sieci neuronowe to połączenie wielu neuronów uporządkowanych w warstwy

sieci neuronowe można przedstawić w postaci funkcji z wagami wraz z funkcją celu

jednym z zagadnień w sieciach neuronowych jest wydajne znalezienie wartości wag, tak aby optymalizować wybraną funkcję celu, jest to zagadnienie z zakresu metod optymalizacji funkcji

kolejnym zagadnieniem jest postać granicy decyzyjnej

Koncepcja sieci neuronowych 8 / 11

(9)

SVM

maszyn wektorów wspierających (SVM) mogą być zamodelowane jako sieci neuronowe

do warstwy wejściowej podawane są punkty treningowe

Liczba neuronów w warstwie ukrytej to liczba punktów treningowych n. Każdy neuron w warstwie ukrytej posiada wektor wagowy będący współrzędnymi odpowiadającemu mu punktowi treningowemu.

Parametry α

i

to wagi ostatniego neuronu, który zwraca wartość funkcji decyzyjnej

funkcja aktywacji to funkcja jądrowa

dla funkcji jądrowej RBF jest również brany pod uwagę iloczyn skalarny z dokładnością do stałej.

Koncepcja sieci neuronowych 9 / 11

(10)

SVM

Twierdzenie

Niech D ⊂ R

n

będzie zbiorem otwartym o skończonej mierze, f : R

n

→ R będzie funkcją ciągłą, taką, że |f (x )| < ∞ na zbiorze D. Dodatkowo niech ˆ

y (x ) = P

i

g (w

iT

x ), gdzie g jest ograniczoną i monotoniczną funkcją ciągłą. Wówczas dla każdego ε > 0 istnieje taki zbiór wektorów wag {w

i

}, że dla każdego x ∈ D zachodzi

y (x ) − f (x )| < ε (5)

Koncepcja sieci neuronowych 10 / 11

(11)

SVM

Twierdzenie (Kołmogorowa)

Niech f będzie funkcją ciągłą na [0, 1]

d

. Wtedy f może zostać zapisana w następującej postaci: niech δ > 0 będzie stałą i wybierzmy wymierne 0 < ε < δ. Wtedy

f =

2d +1

X

k=1

g (z

k

) (6)

gdzie g : R → R jest funkcją ciągłą (zależy od f oraz ε), a każde z

k

ma postać

z

k

=

d

X

j=1

λ

k

ϕ (x

j

+ εk) + k (7)

gdzie λ ∈ R, a ϕ jest funkcją rosnącą monotoniczną. Dodatkowo λ oraz ϕ nie zależą od f i ϕ jest funkcją lipschitzowską: |ϕ(x ) − ϕ(y )| ≤ c|x − y | dla pewnego c > 0.

Koncepcja sieci neuronowych 11 / 11

Cytaty

Powiązane dokumenty

Zadanie 4: Podczas uczenia sieci podanej na rysunku na wejście sieci podano wzorzec uczący X = [1, -1], oczekując na wyjściu wektora [1, 0]. b) Wyzna cz błąd pomalowanego

Proszę udowodnić zasadę szufladkową Dirichleta: jeśli n elementów rozmieszczamy w m pudełkach to pewne pudełko zawiera co najwyżej bn/mc przedmiotów (i pewne pudełko zawiera

10.2.3.2 Rezystancja materiału izolacyjnego przy normalnym cieple     Wymagania odnośnie normy produktowej zostały spełnione.. 10.2.3.3 Rezystancja materiału izolacyjnego

Bior¹c pod uwagê fakt, ¿e wiêkszoœæ syste- mów z jakimi spotykamy siê na co dzieñ jest nieliniowych, mo¿e bu- dziæ zdziwienie, ¿e literatura identyfikacji systemów

Żeby w informatyce wykorzystać potencjał funkcjonalny neuronu oraz całej ich sieci (grafu), zwanych często sieciami neuronowymi, trzeba opracować uproszczony model działania

Istnieją także publiczne instytucje rynku pracy, z pomocy których można korzystać: urzędy pracy, Ochotnicze Hufce Pracy oraz niepubliczne, np.: agencje zatrudnienia,

Dane drzewo T , należy obliczyć czas potrzebny na przesłanie komunikatów do wszystkich

ANN, sztuczne sieci neuronowe – liczne zastosowania techniczne, modele funkcji mózgu, neurony impulsujące lub progowe3. PDP, Parallel Data Processing, czyli