• Nie Znaleziono Wyników

Wygadzanie dystrybuanty empirycznej Wsp. Zbigniew Ciesielski IMPAN Sopot SLAJDY XXXVII Konferencja Zastosowa Matematyki KZM 2008 9-16 wrzenia 2008, Zakopane-Kocielisko, Siwarna

N/A
N/A
Protected

Academic year: 2021

Share "Wygadzanie dystrybuanty empirycznej Wsp. Zbigniew Ciesielski IMPAN Sopot SLAJDY XXXVII Konferencja Zastosowa Matematyki KZM 2008 9-16 wrzenia 2008, Zakopane-Kocielisko, Siwarna"

Copied!
15
0
0

Pełen tekst

(1)

Zbigniew Ciesielski, IMPAN Sopot

Ryszard Zieliński, IMPAN Warszawa

WYGŁADZANIE DYSTRYBUANTY EMPIRYCZNEJ

XXXVII Konferencja Zastosowań Matematyki

KZM 2008

9-16 września 2008, Zakopane-Kościelisko, Siwarna

(2)

PROBLEM

F – rodzina ciągłych i ściśle rosnących dystrybuant na [0, 1]

(w tym komunikacie czasami też na R

1

)

n – liczba naturalna

X

1

, X

2

, . . . , X

n

– próba z pewnego (nieznanego) rozkładu F ∈ F

(iid rv ∼ F )

Na podstawie X

1

, X

2

, . . . , X

n

oszacować F

(3)

0.2

0.4

0.6

0.8

1

0.2

0.4

0.6

0.8

1

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

0

F

n

F

n

- dystrybuanta empiryczna

F

n

(x) =

1

n

n

X

j=1

1

(−∞,x]

(X

j

)

3

(4)

0.2

0.4

0.6

0.8

1

0.2

0.4

0.6

0.8

1

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

0

F

n

F

F - dystrybuanta teoretyczna

DVORETZKY-KIEFER-WOLFOWITZ

(∀ε >

0)(∀n)(∀F

∈ F

)

P

F

{

sup

x∈R

1

|F

n

(x)

F

(x)| ≥

ε} ≤

2e

−2nε

2

4

(5)

0.2

0.4

0.6

0.8

1

0.2

0.4

0.6

0.8

1

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... .... .... .... .... .... .... . .. . . ... ... ... .. . ... . . .... . . . .. . . . ... . . .. ... . . ...

0

F

n

F

e

F

e

F — ”typowa” wygładzona dystrybuanta empiryczna

TWIERDZENIE NEGATYWNE

(∃ε >

0)(∃η >

0)(∀N

)(∃n

N

)(∃F

∈ F

)

P

F

{

sup

x∈R

1

| e

F

n

(x)−F

(x)| ≥

ε} ≥

η

5

(6)

PROBLEMY:

1. Jak wygładzać, żeby nierówność DKW zachodziła w całej

klasie F dystrybuant ciągłych i ściśle rosnących?

2. Jeżeli zdecydujemy się na jakieś wygładzanie, to w jakiej

podklasie rodziny rozkładów F nierówność DKW zachodzi?

(7)

1. ESTYMATORY JĄDROWE

b

F

n

(x) =

1

n

n

X

j=1

K

 x − X

j

h

n



.

Twierdzenie negatywne (Zieliński 2007): Jeżeli

– K jest dowolnym jądrem (zcałkowanym) takim, że 0 < K(0) < 1 oraz

K

−1

(t) < 0 dla pewnego t ∈ (0, K(0)

– (h

n

, n = 1, 2, . . .) jest dowolnym ciągiem liczb dodatnich

to

istnieją takie ε > 0 oraz η > 0, że dla każdego n znajdzie się rozkład

F ∈ F taki, że

P

F

{ sup

x∈R

1

| e

F

n

(x)−F (x)| ≥ ε} ≥ η.

KOMENTARZ:

F

n

(x) =

1

n

n

X

j=1

1

(−∞,x]

(X

j

)

7

(8)

1. ESTYMATORY JĄDROWE (c.d.) - twierdzenie pozytywne

(Zieliń-ski 2007)

X

1

, X

2

, . . . , X

n

- próba z rozkładu F ∈ F

X

1:n

≤ X

2:n

≤ . . . ≤ X

n:n

- statystyka pozycyjna z tej próby

H

n

= min{X

j:n

− X

j−1:n

, j = 2, 3, . . . , n}

Estymator jądrowy

e

F

n

(x) =

1

n

n

X

j=1

K

 x − X

j

H

n



gdzie

K(t) =



0, for t ≤ −1/2,

1, for t ≥ 1/2,

K(0) = 1/2, K(t) ciągłe i niemalejące w (−1/2, 1/2).

Nierówność DKW:

P

F

{ sup

x∈R

1

| e

F

n

(x) − F (x)| ≥ ε} ≤ 2e

−2n(ε−1/2n)

2

,

n >

1

,

F ∈ F

8

(9)

2. ESTYMATORY WIELOMIANOWE

Wielomiany podstawowe na [0, 1]:

N

i,m

(x) =



m

i



x

i

(1 − x)

m−i

,

0 ≤ x ≤ 1,

i = 0, 1, . . . , m;

m ≥ 1

Operator (Ciesielski 1988)

T

m

F (x) =

m

X

i=0

Z

1

o

(m + 1)N

i,m

(y)dF (y)

Z

x

0

N

i,m

(z)dz

T

m

przekształca dystrybuanty na [0, 1], ciągłe lub nie, w dystrybuanty

na [0, 1], które są wielomianami stopnia m + 1

TWIERDZENIE NEGATYWNE:

(∃ε >

0)(∃η >

0)(∀N

)(∃n

N

)(∃F

∈ F

)

P

F

{

sup

x∈R

1

|T

m

F

n

(x)−F

(x)| ≥

ε} ≥

η

TWIERDZENIE POZYTYWNE:

(∀ε >

0)(∀n

)(∀F

∈ F

M

)

P

F

{

sup

x∈R

1

|T

m

F

n

(x)

F

(x)| ≥

ε} ≤

2e

−2n

(

ε−m

−1/4

M

)

2

F

M

= {F ∈ F :

Z

1

0

|D

2

F (x)|

2

dx ≤ M }

9

(10)

2. ESTYMATORY WIELOMIANOWE (c.d.)

ϕ

m

(x) = (2m + 1)



2m

m



x

m

(1 − x)

m

,

0 ≤ x ≤ 1,

m = 1, 2, . . .

Φ

m

(x) =

Z

x

0

ϕ(y)dy.

Φ(x; [a, b]) = Φ

m



x − a

b − a



,

−∞ < a < b < +∞

Definiujemy

X

0:n

= max{0, X

1:n

− (X

2:n

− X

1:n

)} = max{0, 2X

1:n

− X

2:n

}

X

n+1:n

= min{X

n:n

+ (X

n:n

− X

n−1:n

), 1} = min{2X

n:n

− X

n−1:n

, 1}

Konstruujemy estymator wielomianowy

Φ

m,n

(x)=

0,

for x < X

0:n

,

1

n

Φ(x; [X

i−1:n

,X

i:n

])+F

n

(X

i−1:n

)−

1

2n

, for X

i−1:n

≤ x < X

i:n

,

i = 1, 2, . . . , n + 1

1,

for x ≥ X

n+1:n

.

(11)

Własności estymatora Φ

m,n

(x):

1. Φ

m,n

(x) jest dystrybuantą na [X

0:n

, X

n+1:n

]

2. Φ

m,n

(X

i:n

) =

i

n

1

2n

= F

n

(X

i:n

) −

1

2n

,

i = 1, 2, . . . , n

3. Φ

m,n

(x) ∈ C

m

(R

1

)

4. D

k

Φ

m,n

(X

i:n

) = 0 for k = 1, 2, . . . , m and i = 1, 2, . . . , n

5. sup

x∈R

1

m,n

(x) − F (x)| ≤ sup

x∈R

1

|F

n

(x) − F (x)| +

1

2n

Nierówność DKW

P

F

{ sup

x∈R

1

m,n

(x) − F (x))| ≥ ε} ≤ 2e

−2n(ε−1/2n)

2

,

n >

1

,

F ∈ F

11

(12)

3. ESTYMATORY SPLAJNOWE

Definiujemy B

(r)

jako

podstawowy symetryczny B-splajn stopnia

r

(podstawowa symetryczna funkcja gięta stopnia r, a symmetric cardinal

B-spline of order r) z węzłami {i + r/2, i ∈ Z},

jeżeli

B

(r)

(x) ≥ 0, x ∈ R ,

supp B

(r)

= [−r/2, r/2],

B

(r)

jest wielomianem stopnia r − 1 na każdym przedziale

[j − r/2, j + 1 − r/2], j = 0, 1, . . . , r − 1,

B

(r)

∈ C

(r−2)

(R) (dla r = 1 jest to lewostronnie ciągła funkcja

schod-kowa)

Definicja probabilistyczna:

B

(r)

jest gęstością rozkładu prawdopodobieństwa sumy r niezależnych

zmiennych losowych o jednakowym rozkładzie U (−1/2, 1/2)

(13)

Dla danych r ≥ 1, h > 0, i ∈ Z oznaczamy

B

h,i

(r)

(x) = B

(r)

 x

h

− i



Dla danych r ≥ 1, 1 ≤ k ≤ r, r − k = 2ν, ν − całkowite, i ∈ Z oraz

h > 0 definiujemy operator (Ciesielski 1988, 1991)

T

h

(k,r)

F (x) =

1

h

X

i∈Z

Z

R

B

h,i+ν

(k)

(y)dF (y)

Z

x

−∞

B

h,i

(r)

(y)dy

Ten operator przeprowadza m.in. dystrybuanty (ciągłe lub skokowe) w

dystrybuanty, które są splajnami stopnia r. Za estymator dystrybuanty,

skonstruowany na podstawie dystrybuanty empirycznej F

n

,

przyjmu-jemy wartość tego operatora dla F

n

.

Klasy dystrybuant, dla których możemy dla tego estymatora podać

nierówność typu DKW, konstruujemy w następujący sposób.

(14)

Definiujemy

ω

1

(F, δ) = sup

|t|<δ

sup

x

|F (x + t) − F (x)|

oraz

ω

2

(F, δ) = sup

|t|<δ

sup

x

|F (x + 2t) − 2F (x + t) + F (x)|.

Niech ω(h), h ∈ R

+

, będzie modułem ciągłości, tzn. funkcją ciągłą,

ograniczoną, niemalejącą, ω(0) = 0. Dla danego modułu ciągłości ω,

zdefiniujmy dwie H¨

olderowskie klasy dystrybuant:

H

ω,1

(k,r)

= {F ∈ F : ω

1

F,

r + k

2

h



≤ ω(h)}

H

ω,2

(k,r)

= {F ∈ F : 2(4 + (r + k)

2



ω

2

(F, h) ≤ ω(h)}

W każdej z tych klas spełniona jest nierówność DKW, tzn. dla każdej

z tych klas, dla każdego ε > 0 oraz η > 0 można wyznaczyć takie h > 0

oraz N , że jeżeli n ≥ N , to dla każdej dystrybuanty F ∈ H

ω,1

(k,r)

, lub

odpowiednio dla każdej dystrybuanty F ∈ H

ω,2

(k,r)

,

P

F

{||T

h

(k,r)

F

n

− F ||

> ε} < η

Wystarczy wyznaczyć h oraz N takie, że

ω(h) <

ε

2

oraz 2 exp



N ε

2

2



< η.

14

(15)

Wyniki tu zaprezentowane pochodzą z pracy

Zbigniew Ciesielski i Ryszard Zieliński

Polynomial and spline estimators of the

distribu-tion funcdistribu-tion with prescribed accuracy

Praca wysłana do publikacji

Cytaty

Powiązane dokumenty

Skupia się ona wokół sejmowej Komisji „Przyjazne pań- stwo”, która przedstawiła nawet projekt ustawy o zmianie ustawy – Prawo budowlane oraz ustawy o

Abstract XLVIII Seminar of Applied Mathematics took place in Boguszów-Gorce on September 9-11, 2018.. Since 1970, Department of Mathematics at the Wroclaw University of

pisze w postaci kierunkowej równanie prostej przechodzącej przez punkt o danych współrzędnych równoległej do danej prostej;.. pisze w postaci kierunkowej równanie prostej

Dla potrzeb konsultacji i innych zajęć z uczniami wyznacza się sale: nr 30- dla uczniów klasy IV, nr 19 – dla uczniów klasy V, nr 17 dla uczniów kl.. W salach podczas konsultacji

Jedenaście par stanęło do walki w kolejnym Turnieju Siatkówki Plażowej o „Puchar Wójta Gminy Istebna”, któ- ry odbył się 15 sierpnia na boiskach przy ośrodkach

Wyznacz wszystkie trójwyrazowe ciągi geometryczne, których pierwszy wyraz i iloraz są liczbami naturalnymi, a suma wszystkich wyrazów ciągu wynosi 91.. W trapezie

Widoczny jest bowiem brak przekonania o potrzebie planowania energetycznego i tworzenia planów energetycznych oraz brak świadomości energetycznej i podstaw teoretycznych,

Ocenę celującą otrzymuje uczeń, który spełnia wymagania kryterialne na ocenę bardzo dobrą oraz stosuje znane wiadomości i umiejętności w sytuacjach trudnych,