Metody jądrowe

(1)

Metody jądrowe

Marcin Orchel

1 Wstęp

Iloczyn skalarny między dwoma wektorami ~x_i· ~x_j zastępujemy

ϕ ( ~x_i) · ϕ ( ~x_j) (1)

gdzie ϕ jest przekształceniem nieliniowym z R^m do R^p. Możemy zdefiniować funkcję K taką, że

K ( ~x_i, ~x_j) = ϕ ( ~x_i) · ϕ ( ~x_j) (2) Pytanie, jak mamy daną jakąś funkcję K, czy możemy ją wyrazić w postaci jak wyżej?

Mówi o tym warunek Mercera.

Twierdzenie 1.1. Na to, by symetryczna funkcja K(~x, ~y) ∈ L₂, ~x, ~y ∈ R^m miała roz- winięcie

K (~x, ~y) =

∞

X

k=1

a_kϕ (~x) ϕ (~y) (3)

gdzie a_k > 0, potrzeba i wystarcza, aby dla dowolnej funkcji 0 6≡ f ∈ L₂ był spełniony warunek

Z Z

K (~x, ~y) f (~x) f (~y) d~xd~y > 0 (4) Przykład: Mamy funkcję

K (~x, ~y) = (1 + ~x · ~y)² (5) Dla dwóch wymiarów otrzymujemy

1 + 2x₁y₁+ 2x₂u₂+ x²₁y²₁+ x²₂y²₂+ 2x₁x₂y₁y₂= ϕ (~x) · ϕ (~y) (6) gdzie

ϕ (x) =1,

√ 2x₁,

√ 2x₂,

√

2x₁x2, x²₁, x²₂ (7) A więc pomijając 1 mamy transformację do przestrzeni 5 wymiarowej. Ogólnie dla jądra wielomianowego stopnia q

K (~x, ~y) = (1 + ~x · ~y)^q (8) przestrzeń po transformacji ma wymiarów

m + q p

!

− 1 (9)

1

(2)

1.1 Jądrowa analiza składowych głównych

Estymowaną macierz kowariancji dla wartości oczekiwanych zero możemy zapisać jako

Σ = 1

n − 1X^TX = 1 n − 1

n

X

i=1

~

xix~iT (10)

Zastępujemy wektory funkcjami mapowania 1

n − 1

n

X

i=1

ϕ ( ~x_i) ϕ ( ~x_i)^T (11)

Możemy to podstawić do równania na wektory własne 1

n − 1

n

X

i=1

ϕ ( ~x_i) ϕ ( ~x_i)^Te~_k= λ_ke~_k (12)

gdzie k przebiega od 1 do wymiarowości nowej przestrzeni. Możemy podzielić obie strony przez λ_k i zapisać prawą stronę jako

~ ek=

n

X

i=1

akiϕ ( ~xi) (13)

Po podstawieniu otrzymujemy 1

n − 1

n

X

i=1

ϕ ( ~xi) ϕ ( ~xi)^T

n

X

m=1

akmϕ ( ~xm) = λ_k

n

X

i=1

akiϕ ( ~xi) (14)

Mnożymy obie strony lewostronnie przez ϕ( ~x_l)^T

ϕ( ~xl)^T 1 n − 1

n

X

i=1

ϕ ( ~xi) ϕ ( ~xi)^T

n

X

m=1

akmϕ ( ~xm) = ϕ( ~xl)^Tλk n

X

i=1

akiϕ ( ~xi) (15)

Iloczyny skalarne zastępujemy funkcją jądrową K 1

n − 1

n

X

i=1

K ( ~xl, ~xi)

n

X

m=1

akmK ( ~xi, ~xm) = λ_k

n

X

i=1

akiK ( ~xl, ~xi) (16)

Możemy wziąść n równań dla l = 1, 2, . . . , n. A więc macierzowo możemy zapisać K²a~k= λ_k(n − 1) K ~ak (17)

K ~a_k= λ_k(n − 1) ~a_k (18)

gdzie K to macierz wartości funkcji jądrowych. Jest to zagadnienie własne macierzy K.

W inny sposób

n

X

i=1

K ( ~xl, ~xi)

n

X

m=1

akmK ( ~xi, ~xm) − (n − 1) λ_kaki

!

= 0 (19)

2

(3)

Wyrażenie pod nawiasem musi być równe 0 dla każdego i.

Dalej możemy nowe współrzędne uzyskać jako

ϕ (~x)^T e~k=

n

X

i=1

akiK (~x, ~xi) . (20)

W metodzie PCA mieliśmy macierz kowariancji, a w powyższym problemie mamy macierz K.

Pytania

1. Jaką mają wymiarowość wektory własne i ile ich jest? Mamy dwa rodzaje wektorów własnych ~e_k oraz ~a_k. Wektory ~e_k zgodnie ze wzorem (13) mają taką wymiarowość jak wektory ϕ( ~xi), a więc może nieskończoną. Liczba tych wektorów jest taka sama, a więc może być również nieskończona. Dla PCA mieliśmy wymiarowość wektorów własnych równą ilości współrzędnych wektorów wyjściowych, i było ich również tyle samo. Natomiast liczba wektorów własnych ~akjest tak sama jak liczba wektorów ~e_k, a więc może być nieskończona. Natomiast wymiarowość ~a_kjest równa n. Bierzemy pod uwagę tylko te wektory ~e_k, które mają niezerowe wartości własne.

2. Czy jest możliwe uzyskanie wartości wyjściowych punktów po przekształceniu do nowej przestrzeni i wyzerowaniu pozostałych wartości? Mamy m równań nielinio- wych, gdzie musimy znaleźć wartości wyjściowe punktu.

2 Zadania

2.1 Zadania na 3.0 Napisać skrypt w R, w którym:

• dla wygenerowanych danych dwuwymiarowych dla dwóch okręgów z dodanym błę- dem normalnym wyświetlić na wykresie dane treningowe oraz na osobnym wykresie nowe współrzędne. Pokazać jak redukcja wymiarowości może pomóc w klasteryza- cji.

• wyświetlić dla wybranej grupy zdjęć twarzy znalezione eigenfaces po redukcji wy- miarów

• wyświetlić początkowe wartości Y_i dla wybranych twarzy Wskazówki do R

• https://cran.r-project.org/web/packages/kernlab/kernlab.pdf

• http://artax.karlin.mff.cuni.cz/r-help/library/kernlab/html/kpca.html

• http://ugrad.stat.ubc.ca/R/library/mlbench/html/mlbench.circle.html

3