• Nie Znaleziono Wyników

3. Analiza empirycznego klasyfikatora Bayesa - asymptotyczna zgodno´s´c

N/A
N/A
Protected

Academic year: 2021

Share "3. Analiza empirycznego klasyfikatora Bayesa - asymptotyczna zgodno´s´c"

Copied!
14
0
0

Pełen tekst

(1)

Algorytmy rozpoznawania obrazów

3. Analiza empirycznego klasyfikatora Bayesa - asymptotyczna zgodno´s´c

dr in˙z. Urszula Libal Politechnika Wrocławska

2015

(2)

1. Teoretyczny i empiryczny klasyfikator bayesowski

klasyfikator teoretyczny klasa 1 klasa 2 · · · klasa M

p1 p2 · · · pM

f1(x) f2(x) · · · fM(x)

klasyfikator empiryczny

klasa 1 klasa 2 · · · klasa M ˆ

p1 pˆ2 · · · pˆM

fˆ1(x) fˆ2(x) · · · fˆM(x)

N1 N2 · · · NM

n X(1)j oN1

j=1

n Xj(2)oN2

j=1 · · · n

X(M)j oNM j=1

(3)

Optymalny klasyfikator bayesowski w przypadku dwóch klas to reguła postaci

Ψ(x) =

1, gdy p1f1(x) > p2f2(x), 2, w przeciwnym wypadku.

(1)

Empiryczny klasyfikator bayesowski w przypadku dwóch klas ma posta´c

Ψ(x) =

1, gdy ˆp1fˆ1(x) > ˆp2fˆ2(x), 2, w przeciwnym wypadku.

(2)

(4)

2. Histogram jako nieparametryczny estymator funkcji g˛esto´sci

Jednym z prostszych nieparametrycznych estymatorów funkcji g˛esto´sci prawdopodobie´n- stwa jest odpowiednio przeskalowany histogram

fˆ(x) = fˆ(x; ∆, N) (3)

= 1

N∆

N

j=1

1x < Xj≤ x + ∆

(4)

= 1

N∆#x < Xj≤ x + ∆ , (5)

którego kształt zale˙zy od liczno´sci N zbioru ucz ˛acego (próby)Xj N

j=1 oraz szeroko´sci przedziałów ∆.

(5)

3. Typy zbie˙zno´sci probabilistycznych

Definicja 1. Ci ˛ag (θN)N∈Njest zbie˙zny z prawdopodobie´nstwem 1 (mocno) do θ , je´sli

P



N→∞limθN= θ



= 1. (6)

Definicja 2. Ci ˛ag (θN)N∈Njest zbie˙zny według prawdopodobie´nstwa (słabo) do θ , je´sli

ε >0 lim

N→∞P {|θN− θ | < ε} = 1. (7)

Definicja 3. Ci ˛ag (θN)N∈Njest zbie˙zny według rozkładu do θ , je´sli

N→∞limFN(x) = F(x). (8)

(6)

Definicja 4. Ci ˛ag (θN)N∈Njest zbie˙zny według ´sredniej z pot˛eg ˛a r do θ , je´sli

N→∞limE|θN− θ |r= 0. (9)

W szczególno´sci, ci ˛ag (θN)N∈Njest zbie˙zny ´sredniokwadratowo do θ , je´sli

N→∞limEN− θ )2= 0. (10)

(7)

4. Zale˙zno´sci mi˛edzy typami zbie˙zno´sci probabilistycznych

θN

→ θ ⇒ θP1 N

→ θ ,P (11)

θN Lr

→ θ ⇒ θN

→ θ ,P (12)

θN→ θ ⇒ θP N

→ θ .D (13)

(8)

5. Zgodno´s´c estymatora

Definicja. Estymator θN parametru θ nazywamy zgodnym, je´sli

ε >0 lim

N→∞P {|θN− θ | < ε} = 1. (14)

Równowa˙znie warunek (14) mo˙zna zapisa´c

ε >0 lim

N→∞P {|θN− θ | > ε} = 0. (15)

Zachodzi równie˙z

ε >0P {|θN− θ | > ε} ≤ 1

ε2EN− θ )2. (16)

(9)

6. Obci ˛a˙zenie i wariancja estymatora

EN− θ )2 = N2− 2θ EθN+ θ2 (17)

= N2− (EθN)2+ (EθN)2− 2θ EθN+ θ2 (18)

= N2− (EθN)2

| {z }

var(θN)

+ (EθN− θ )2

| {z }

bias2N)

(19)

(10)

7. Obci ˛a˙zenie estymatora funkcji g˛esto´sci

E ˆf(x) = E 1 N∆

N

j=1

1x < Xj≤ x + ∆

!

(20)

= 1

N∆

N

j=1

E1x < Xj≤ x + ∆

(21)

= 1

N∆N E1x < Xj≤ x + ∆

(22)

= 1

Px < Xj≤ x + ∆

(23)

= F(x + ∆) − F(x)

(24)

6= f(x) (25)

(11)

8. Wariancja estymatora funkcji g˛esto´sci

var ˆf(x) = var 1 N∆

N

j=1

1x < Xj≤ x + ∆

!

(26)

= 1

N22

N

j=1

var1x < Xj≤ x + ∆

(27)

= 1

N22N var1x < Xj≤ x + ∆

(28)

= 1

N∆2 h

E12x < Xj≤ x + ∆ − E1 x < Xj≤ x + ∆ 2i

(29)

= 1

N∆2

hPx < Xj≤ x + ∆ − P x < Xj≤ x + ∆ 2i

(30)

= 1

N∆2 h

F(x + ∆) − F(x) − (F(x + ∆) − F(x))2i

(31)

= 1

N∆

 F(x + ∆) − F(x)



[1 − (F(x + ∆) − F(x))] (32)

(12)

9. Asymptotyczna redukcja obci ˛a˙zenia i wariancji

Dla ustalonego N, przy ∆ → 0

E ˆf(x) = F(x + ∆) − F(x)

→ f (x), (33)

czyli

bias ˆf(x)→ 0. (34)

Wtedy

var ˆf(x) = 1 N∆

|{z}→∞

 F(x + ∆) − F(x)



| {z }

→ f (x)

[1 − (F(x + ∆) − F(x))]

| {z }

→1

→ ∞. (35)

(13)

Przy jednoczesnym ∆ → 0 oraz N∆ → ∞

bias ˆf(x)→ 0 (36)

oraz

var ˆf(x) = 1 N∆

|{z}

→0

 F(x + ∆) − F(x)



| {z }

→ f (x)

[1 − (F(x + ∆) − F(x))]

| {z }

→1

→ 0. (37)

Wtedy tak˙ze

EN− θ )2→ 0. (38)

(14)

Histogram dany wzorem (4) jest asymptotycznie zgodnym estymatorem funkcji g˛esto´sci prawdopodobie´nstwaprzy N → ∞, je´sli jednocze´snie

∆ → 0 (39)

oraz

N∆ → ∞. (40)

Szeroko´s´c przedziału ∆ mo˙ze by´c funkcj ˛a N, np. ∆N=1

N.

Cytaty

Powiązane dokumenty

Dobierz parametr c tak, aby ˆg 2 byª nieobci¡»ony i wówczas porównaj bª¦dy ±redniokwadratowe obu

Asymptotyczna normalno±¢ i asymptotyczna

Zad. 2.3 Gra polega na tym, że spośród dwóch urn losujemy jedną, następnie wyciągamy z niej kulę. Gdy kula jest biała, wygrywamy. Przed rozpoczęciem gry dano nam 2 białe i

Graniczny rozkład prawdopodobieostwa a posteriori w węzłach Fuel Tank Empty oraz Battery Power przy założeniu, że silnik nie zapala, licznik nie wskazuje małej ilości paliwa, a

Szereg zbie»ny, który nie jest zbie»ny bezwzgl¦dnie nazywamy zbie»nym warunkowo (szereg zbie»ny bezwzgl¦dnie jest

Szereg zbie»ny, który nie jest zbie»ny bezwzgl¦dnie nazywamy zbie»nym warunkowo (szereg zbie»ny bezwzgl¦dnie jest

Prawdopodobie ´nstwa, ˙ze wyprodukowana ˙zarówka b˛edzie ´swieciła dłu ˙zej ni ˙z 5 lat, wynosz ˛ a dla tych fabryk odpowiednio: 0.9, 0.8, 0.7?. Prawdopodobie ´nstwa napotkania

- zwi ˛ azane jest z wykładniczym wzrostem liczby D-wymiarowych kostek, stanowi ˛ acych podział przestrzeni cech podczas nieparametrycznej estymacji funkcji g˛esto´sci,..