• Nie Znaleziono Wyników

Imputacja brakujących danych binarnych w modelu autologistycznym

N/A
N/A
Protected

Academic year: 2021

Share "Imputacja brakujących danych binarnych w modelu autologistycznym"

Copied!
1
0
0

Pełen tekst

(1)

Imputacja brakujących danych binarnych w modelu autologistycznym

Marta Zalewska

Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Wydział Nauki o Zdrowiu, Warszawski Uniwersytet Medyczny

Żwirki i Wigury 61, 02-091 Warszawa e-mail: zalewska.marta@gmail.com

Wojciech Niemiro

Wydział Matematyki i Informatyki

Uniwersytet Mikołaja Kopernika, Chopina 12/18, 87-100 Toruń oraz Instytut Matematyki Stosowanej i Mechaniki, Uniwersytet Warszawski

Banacha 2, 02-097 Warszawa e-mail: wniemiro@gmail.com

Bolesław Samoliński

Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Wydział Nauki o Zdrowiu, Warszawski Uniwersytet Medyczny

Żwirki i Wigury 61, 02-091 Warszawa e-mail: bsamol@amwaw.edu.pl

Brakujące dane są poważnym problemem w badaniach statystycznych, szcze- gólne w medycynie. Wiele metod analizy statystycznej wymaga aby zbiór da- nych był kompletną, prostokątną macierzą bez pustych miejsc. Imputacja jest techniką wypełniania brakujących danych. Zaprezentujemy algorytm, który re- prezentuje modelowe podejście imputacji i wykorzystuje metody Monte Carlo (MCMC). Zakładamy bayesowski model statystyczny i brakujące dane losujemy z rozkładu predykcyjnego wyznaczonego przez dane obserwowane, przynajmniej w przybliżeniu.

Koncentrujemy się na przypadku zmiennych binarnych i na modelu auto- logistycznym, w którym wektor x ∈ {0, 1}d ma rozkład prawdopodobieństwa p(x|β) ∝ expPd

i,j=1βijxixj .

Nasz algorytm jest pewną wersją próbnika Gibbsa. Wykorzystujemy pewne aproksymacje, uzasadnione heurystycznie. Podajemy wyniki badań symulacyj- nych, które potwierdzają użyteczność algorytmu. Wykorzystujemy rzeczywiste dane medyczne pochodzące z badania ECAP (epidemiologia alergii w Polsce).

W tych danych generujemy sztucznie „braki” a następnie próbujemy je wy- pełniać używając różnych algorytmów i sprawdzamy zgodność z prawdziwymi,

„zasłoniętymi” danymi.

1

Cytaty

Powiązane dokumenty

– z udziałem Marka Woźniaka, marszałka województwa wielkopolskiego – odbyła się uroczystość otwarcia nowego budynku średz- kiego szpitala, zlokalizowanego przy ul..

Zidentyfikowano 27 przeglądów systematycznych badających interwencje fizjoterapeutyczne u pacjentów, których można zaklasyfikować jako cierpiących na ból szyi z

Jest to istotny element procesu inwestycyjno-budowlanego jako całości, ponieważ to przy wydaniu decyzji o pozwoleniu na budowę dochodzi do skonkretyzowania

Satisfaction with life, level of negative emotions, assessment of their own efficiency, performed occupation and place of work had a statistically significant impact on

Kamil Kuszplak, Mariusz Wysokiński, Irena Wrońska, Dorota Kulina, Wiesław Fidecki Katedra Rozwoju Pielęgniarstwa Uniwersytet Medyczny w Lublinie. Satysfakcja z życia

Treści kształcenia: infradźwięki, dźwięki słyszalne, ultradźwięki i ich wykorzystanie w medycynie, działanie fal mechanicznych o różnej częstotliwości na

Klimek L, Bergmann KC, Biedermann T et al.: Visual analogue scales (VAS): measuring instruments for the documentation of symptoms and therapy monitoring in cases of allergic rhinitis

Celem nauczania przedmiotu jest zapoznanie studentów z zasadami opracowywania technologii wytwarzania stałych postaci leku oraz wymaganiami stawianymi tym postaciom. W