• Nie Znaleziono Wyników

Estymacja błędu predykcji i jej zastosowania Jan Mielniczuk

N/A
N/A
Protected

Academic year: 2021

Share "Estymacja błędu predykcji i jej zastosowania Jan Mielniczuk"

Copied!
1
0
0

Pełen tekst

(1)

Estymacja błędu predykcji i jej zastosowania

Jan Mielniczuk

Instytut Podstaw Informatyki PAN i Wydział Matematyki i Nauk Informacyjnych PW

e-mail: miel@ipipan.waw.pl, miel@mini.pw.edu.pl

W przeglądowym wykładzie zostanie omówiony problem estymacji błędu predykcji i jej zastosowań w selekcji modelu i konstrukcji estymatorów post- selekcyjnych. Podstawowym rozpatrywanym obiektem będzie prosta próba lo- sowa U = {(Xi, Yi)}ni=1, gdzie poszczególne obserwacje sa wektorami z Rp+1, a problemem estymacja funkcji regresji f (x) = E(Y |X = x) na jej podstawie.

Dla ustalonego estymatora ˆf (x, U) = ˆf (x) i funkcji straty L(f (y, f (x)) zostaną rozpatrzone: warunkowy błąd predykcji ErrU = E(L(Y0, ˆf (X0))|U), bezwa- runkowy błąd predykcji Err = E(ErrU) i błąd wewnątrzpróbkowy (in-sample error) Errin, gdzie (X0, Y0) jest kopią (X1, Y1) niezależną od U. Errin = n−1Pn

i=1EY0(L(Yi0, ˆf (Xi))|U), gdzie Y0 = (Y10, . . . , Yn0) i Yi0 są niezależnie generowane z rozkładów PY |X=Xi i = 1, . . . , n. Przedstawione będą podstawowe estymatory tych wielkości, w szczególności estymator oparty na powtórnym pod- stawieniu ¯err i estymator kroswalidacyjny. Postać E(Y1,Y2,...,Yn)( ¯err)|X1, X2, . . . , Xn) prowadzi do tzw. poprawki kowariancyjnej i funkcji kryterialnej ze szczególną postacią funkcji kary. Własność ta motywuje podejście do problemu selekcji modelu przy użyciu funkcji kryterialnych oraz konstrukcję estymatorów postse- lekcyjnych. W dalszej części zostaną omówione własności tych estymatorów, w szczególności ich zgodność i konserwatywność oraz własności ryzyka. Podstawo- wym przykładem, dla którego będzie analizowane przedstawione podejście, jest model liniowy z losowymi wartościami atrybutów.

1

Cytaty

Powiązane dokumenty

Stacje meteorologiczne mierzą temperaturę gruntu i na tej podstawie wyzna- czają położenie izotermy zerowej, dlatego w dalszych rozważaniach będzie ona uznawana za głębokość

Ponadto zapre- zentowane zostaną propozycje sposobów adaptacyjnego doboru progu ε n oraz przykłady obliczeniowe porównujące jakość tak uzyskanych postselekcyjnych es-

Co roku ta suma najpierw wzrasta o 5%, ale od tych 5% musimy odprowadzić 19% podatku..

Książka na pewno znajdzie wielu entuzjastów wśród wszystkich starających się zrozumieć i poszerzyć swoją wiedzę na te- mat metod statystycznych stosowanych w praktyce oraz

Obchód normalny (oględziny) toru, przegląd - badanie techniczne toru wraz z pomiarem bezpośrednim toru oraz sprawdzeniem jego stanu technicznej sprawności.

przy rozruchu lub po naciśnięciu przycisku wysprzęglającego przekładnie, siłownik ustawia się w pozycji podstawowej. Siłownik ustawia się w położeniu zgodnym z

W sprawozdaniu proszę odpowie- dzieć na pytanie: dlaczego wykresy nie pokrywają się dla każdego t i?. Czy jakość wygładzania zależy od ilości elementów w

W pliku index.html przy użyciu znaczników nagłówków od <h1> do <h6> należy zapisać swoje Imię7. W pliku index.html przy użyciu znacznika paragrafu <p>