• Nie Znaleziono Wyników

WYBÓR I WYZNACZENIE NIEZBĘDNEJ WIELKOŚCI PRÓBY

Badania kliniczne rzadko wykonuje się w populacji generalnej, raczej wśród pew­

nej grupy chorych, którą określamy jako populację docelową. Dostępność badacza do ogółu populacji docelowej jest też ograniczona, dlatego zwykle badania kliniczne wy­

konuje się w tzw. populacji źródłowej (pacjentów jednej kliniki, jednej przychodni lub pacjentów pochodzących z wielu ośrodków).

Rekrutacja badanych ma na celu do­

bór badanych w taki sposób, aby byli oni:

• reprezentacją populacji docelowej;

• odpowiednio liczebną grupą.

Materiał kliniczny może obejmować mniejszą lub większą liczebnie populację i nie ma magicznej lub uniwersalnej wielkości próby (np. 30, 50 lub 100 jednostek). Jeżeli populacja stanowiąca przedmiot badania jest bardzo duża, to wtedy rzeczą rozsądną jest wykonanie badania częściowego, tj. opartego tylko na pewnej części tej populacji.

Doboru próby do badań częściowych dokonać można w sposób arbitralny lub losowy.

W przypadku doboru arbitralnego grupa badanych osób nie stanowi reprezentacji po­

pulacji docelowej, np. wszystkich chorych cierpiących na daną chorobę, i wniosków z takiego badania nie można uogólniać na populację generalną. Jeśli wybrana do bada­

nia grupa chorych jest próbą losową, która reprezentuje dobrze populację chorych, to wtedy wnioski wynikające z badania takiego materiału chorych można uogólnić.

POZIOMY SELEKCJI BADANYCH

Plan badania odnoszący się do określenia materiału, czyli składu badanej próby (wybór pacjentów) powinien zawierać:

Kryteria włączające (zasadnicza charakterystyka populacji docelowej) Kryteria wyłączające (część próby osób, która w zasadzie odpowiada celowi badania, ale z różnych względów może zakłócać wyniki)

Badania oparte na danych pochodzących z próby losowej są coraz częściej stoso­

wane z uwagi na wielorakie korzyści, do których zaliczyć należy oszczędności ekono­

miczne, łatwość organizacji badania na mniejszej liczbie badanych, szybkość uzyska­

nia wyników, możność zdobycia informacji, których nie dałoby się zebrać inaczej, oraz

31 większą dokładność pomiarów indywidualnych. Określenie parametrów populacji ge­

neralnej na podstawie próby może być nawet dokładniejsze niż w wyniku zrealizowa­

nia badania całkowitego, ponieważ źródła błędu mogą być kontrolowane bardziej sku­

tecznie, jeśli bada się mniejszą liczbę osób.

Szacowanie parametrów populacji generalnej na podstawie danych z próby związa­

ne jest jednak zawsze z ryzykiem, że wybrana próba może nie być w pełni reprezenta­

cyjna, ale ryzyko to można zmniejszyć poprzez bardzo staranny dobór próby losowej, zastosowanie właściwych metod estymacji i wybór odpowiedniej liczebności próby.

Jeżeli szacujemy więc jakiś parametr dla populacji generalnej na podstawie próby (np.

średnie ciśnienie tętnicze krwi, poziom cukru, cholesterolu we krwi), to jest rzeczą mało prawdopodobną, że będzie on dokładnie taki sam, jak obliczony z badania cał­

kowitego populacji generalnej. Różnicę pomiędzy parametrem populacji generalnej (średnia arytmetyczna, proporcja, odchylenie standardowe) a jego oszacowaniem (es­

tymacja) na podstawie próby nazywamy błędem próby, przy założeniu, że dane w pierwszym i drugim przypadku uzyskane były przy zastosowaniu identycznych me­

tod pomiaru. W statystyce przez precyzję oszacowania rozumiemy taki estymator, któ­

ry jest najbliższy liczbowo parametrowi populacji generalnej.

Poszczególne ele­

menty planu badania są z sobą ściśle po­

wiązane tak, aby sta­

nowiły pewną logiczną całość.

Wybór próby do badań i wyznaczenie niezbędnej liczebności próby należą do pod­

stawowych obowiązków badającego, które należy wykonać jeszcze w okresie plano­

wania badania. Proponowana próba powinna dobrze reprezentować populację general­

ną (populację docelową) i populację źródłową, z której bezpośrednio pochodzi.

Pomocne w tym względzie jest zdefiniowanie kryteriów włączających i kryteriów wy­

łączających poszczególne jednostki z badania.

Liczebność próby musi być dostatecznie duża, aby badanie pozwoliło na możliwie dokładne oszacowanie poszukiwanych parametrów (średnia arytmetyczna, częstość) w populacji docelowej z dokładnością zapewniającą odpowiednią wiarygodność bada­

nia (czyli jego siłę). Istnieją zasadniczo dwa sposoby określenia wielkości próby.

Pierwszy polega na tym, że badający ustala liczbę badanych arbitralnie na podstawie własnych opinii i sądów. Punktem wyjścia drugiego sposobu jest określona hipoteza statystyczna oraz uwzględnienie błędów 1 i II rodzaju.

Rozważmy bardzo prosty przykład hipotezy statystycznej. Przypuśćmy, że chcemy sprawdzić doświadczalnie skuteczność nowego leku w grupie chorych z zawałem ser­

ca. W takiej sytuacji dzielimy chorych na dwie grupy: „lek +”, „lek Załóżmy, że jako kryterium oceny przyjmiemy wskaźnik śmiertelności w obydwu grupach. Natu­

ralnie, badanie przeprowadzamy w nadziei, że lek będzie skuteczny, ale testowanie tej hipotezy odbywa się jakby „odwrotnie”. Zakładamy, że lek ten nie ma żadnego zna­

czenia leczniczego (hipoteza zerowa), lecz będziemy gotowi hipotezę tę odrzucić, je­

żeli okaże się ona nieprawdziwa. Jeżeli w toku dowodzenia hipoteza zerowa zostanie odrzucona, to „przyjmujemy” hipotezę alternatywną, tzn. że lek ten ma wpływ na przebieg choroby. Trzeba pamiętać, że decyzje te podejmujemy w warunkach niepew­

ności i tak naprawdę nigdy nie jesteśmy całkowicie pewni słuszności naszej decyzji.

W testowaniu każdej hipotezy statystycznej występuje ryzyko popełnienia dwóch rodzajów błędów. Możemy odrzucić hipotezę zerową, tzn. uznać, że lek zmniejsza śmiertelność w sytuacji, kiedy w rzeczywistości nie przynosi on żadnych mierzalnych korzyści chorym. Ten rodzaj błędu nazywamy błędem I rodzaju. Odwrotnie, możemy przyjąć hipotezę zerową, tzn. uznać, że lek nie ma żadnego wpływu, kiedy w rzeczywi­

stości jest on skuteczny i prowadzi do obniżenia śmiertelności u chorych, którzy ten lek otrzymują. Ten typ błędu nazywamy błędem II rodzaju. Każdy z tych błędów po­

ciąga za sobą inne konsekwencje. W niektórych przypadkach błąd I rodzaju, w innych błąd II rodzaju może mieć większe znaczenie dla wnioskowania.

Jeżeli zaakceptujemy hipotezę zerową (Ho), to oczywiście nie będziemy u chorych stosować leku, ale jeśli jest on rzeczywiście skuteczny, popełniamy błąd II rodzaju (patrz tabela 6.1). W tej sytuacji wstrzymujemy się od podania leku chorym, mimo że jest on skuteczny. Konsekwencje mogą być poważne.

Jeżeli odrzucimy Ho na korzyść hipotezy alternatywnej (Hi) i rozpoczniemy stoso­

wanie tego leku, mimo że lek jest nieskuteczny, popełniamy błąd I rodzaju. Chorzy będą otrzymywali lek, ale nie będzie on im przynosił żadnych korzyści. Błąd ten też niesie z sobą poważne konsekwencje dla chorych.

Konsekwencje błędów I i II rodzaju. Względne znaczenie tych błędów wynika z kontekstu badania. Jeżeli poszukuje się np. leku hamującego rozwój nowotworu, po­

pełnienie błędu II rodzaju jest błędem poważniejszym; w badaniu leku przeciw grypie, który byłby dosyć kosztowny, a do tego o niepewnej skuteczności, skłonni bylibyśmy raczej unikać błędu I rodzaju.

Tabela 6.1. Przykład hipotetyczny, hipoteza zerowa (Ho): lek nieskuteczny

(brak różnic współczynników śmiertelności w grupie otrzymujących lek i w grupie kontrolnej) Hipoteza alternatywna (Hi): lek skuteczny (zmniejsza śmiertelność)

Decyzje opierające się

33 Poziom ufności (1-a). Chociaż nie jesteśmy w stanie wyeliminować całkowicie ryzyka popełnienia tych błędów, możemy zmniejszyć istotnie prawdopodobieństwo ich wystąpienia. Prawdopodobieństwo popełnienia błędu I rodzaju jest określane terminem poziomu istotności testu statystycznego. Kiedy czytelnik, przeglądając piśmiennictwo naukowe, znajdzie stwierdzenie, że uzyskane rezultaty badań są istotnie różne przy poziomie istotności a < 0,05, to oznacza, że prawdopodobieństwo popełnienia błędu I rodzaju było mniejsze niż 5/100.

Statystyczna siła badania (1—15). Statystyczna siła badania (1-B), czyli zdolność testu do wykrycia prawdziwej różnicy między grupami poddanymi obserwacji (ekspe­

rymentowi), zależy od liczebności próby. W badaniach klinicznych przyjmuje się za wystarczające, jeśli siła badania wynosi 0,8 lub 80%, a zatem przy błędzie II rodzaju (B) = 0,20. Oznacza to w praktyce, że takie badanie miałoby 80% szansę wykrycia róż­

nicy np. będącej rezultatem nowej terapii (zabiegu).

Autorzy prac zwyczajowo dbają o to, aby prawdopodobieństwo popełnienia błędu 1 rodzaju było możliwie małe, ale zapominają niestety o błędzie II rodzaju. Przyjęcie takiej strategii jest błędne, ponieważ błąd II rodzaju dla wnioskowania ma często po­

ważniejsze konsekwencje niż błąd I rodzaju. Trzeba przyjąć, że zmniejszeniu błędu I rodzaju niejako automatycznie towarzyszy zwiększenie błędu II rodzaju. Dla obniżenia równocześnie błędu I i II rodzaju należy dysponować dostatecznie liczebną próbą.

Problem błędów I i II rodzaju ma również olbrzymie znaczenie w indywidualnych przypadkach np. w diagnostyce klinicznej. Załóżmy, że lekarz uzyskuje z laboratorium wynik pozytywny, wskazujący na obecność raka u danego chorego. Lekarz może na tej

padku przy podejmowaniu decyzji powinniśmy być świadomi zagrożenia tymi dwoma rodzajami błędów, które mają podstawowe znaczenie dla wnioskowania. Przyczynami błędów fałszywie ujemnych lub fałszywie dodatnich są nieodpowiednia metodologia (można poprawić) i zmienność losowa badanej cechy (nie można wyeliminować, ale można ją zmniejszyć) lub obydwa czynniki jednocześnie.

Do ustalenia liczebności próby jest niezbędna hipoteza statystyczna, szczególnie wtedy, gdy celem badania jest porównanie jakiejś charakterystyki (parametrów) po­

między grupami. Jest to nieodzowne zwłaszcza wtedy, jeśli badanie dotyczy zjawisk, gdy jedno jest większe lub mniejsze niż drugie, jedno bardziej lub mniej prawdopo­

dobne lub kiedy zjawiska są powiązane z sobą, lub zachodzi między nimi związek przyczynowy.

Do wyliczenia niezbędnej liczebności próby opracowano liczne wzory i tabele po­

mocnicze, a także programy komputerowe ułatwiające szybkie i dokładne wyliczenie niezbędnej wielkości próby dla różnych rodzajów badań (np. pakiet statystyczny Epi lnfo czy specjalistyczny pakiet nQuery Advisor).

W celu obliczenia liczebności próby niezbędne są następujące dane: