Schemat badawczy w badaniach klinicznych: właściwy schemat na właściwym miejscu

(1)

117 Czego dowiadujemy siê z pragmatycznych badañ leków psychotropowych?

Fleischacker i Goodwin w³¹czaj¹ siê do tocz¹cej siê obecnie dyskusji na temat wzglêdnej wartoci badañ tak zwanej skutecznoci i efektywnoci leków. W porów-naniach badañ lekowych trzeba uwzglêdniæ fakt, ¿e ró¿ne badania zaprojektowano tak, by uzyskaæ odpowied na ró¿ne pytania kliniczne i ¿e decyzje metodologiczne zaw-sze wi¹¿¹ siê z kompromisem [1, 2]. Proponowano ró¿ne sposoby opisu odmiennych priorytetów i planów badaw-czych w badaniach klinicznych: np. badanie wyjaniaj¹ce w odró¿nieniu od pragmatycznego [3], praktyczne w od-ró¿nieniu od du¿ego prostego, w odod-ró¿nieniu od badania skutecznoci [2], oraz du¿e proste w odró¿nieniu od ma-³ego z³o¿onego [4].

Schematy badania wyjaniaj¹cego [skutecznoci] cha-rakteryzuj¹ siê wiêkszym stopniem kontroli nad trafnoci¹ wewnêtrzn¹ [teoretyczn¹] oraz wy¿sz¹ proporcj¹ sygna³u do szumu, lecz dzieje siê to zwykle kosztem mniejszej trafnoci zewnêtrznej [tzn. przystawalnoci do pacjentów w wiecie rzeczywistym] [3, 5]. Celem badañ wyjaniaj¹-cych jest ustalenie, czy okrelona interwencja eksperymen-talna mo¿e dzia³aæ w kontrolowanych, zoptymalizowanych warunkach [6]. Natomiast celem bardziej pragmatycznych badañ [efektywnoci] jest ustalenie, czy dana interwen-cja rzeczywicie dzia³a w realnym wiecie praktyki kli-nicznej, czyli w rodowisku niemal z definicji mniej kon-trolowanym i z wiêkszym poziomem szumu. Wprawdzie w badaniach pragmatycznych uczestnicz¹ mniej wyselek-cjonowani i bardziej reprezentatywni pacjenci i rodowiska kliniczne, oraz stosuje siê mniej standaryzowane, a bardziej rutynowe miary wyników klinicznych, lecz nieuniknione w badaniach efektywnoci kompromisowe schematy ba-dawcze, z regu³y zwiêkszaj¹ zmiennoæ (i wobec tego szum statystyczny), a czêsto tak¿e tendencyjnoæ.

Fleischacker i Goodwin maj¹ zatem racjê zwracaj¹c uwagê na problem, który powstaje wówczas, gdy wydaje siê, ¿e wyniki badañ wyjaniaj¹cych i bardziej pragma-tycznych s¹ rozbie¿ne. Czy badania wyjaniaj¹ce, czy te¿ badania pragmatyczne s¹ z natury rzeczy bardziej rzetelne i jest bardziej prawdopodobne, ¿e dadz¹ cilejsz¹ ocenê rzeczywistego efektu badanego leku? Jest to le po-stawione pytanie. Tak naprawdê zdecydowana wiêkszoæ badañ znajduje siê na kontinuum miêdzy wyidealizowany-mi schematawyidealizowany-mi badañ wyjaniaj¹cych a pragmatycznywyidealizowany-mi planami badawczymi. Zalety ka¿dego badania trzeba kry-tycznie oceniæ pod k¹tem prawdopodobnych róde³ ten-dencyjnoci i szumu.

Fleischacker i Goodwin uwa¿aj¹, ¿e randomizacja wraz z adekwatnym utajnieniem przydzia³u do grup jest wa-runkiem sine qua non uczciwego porównania dwóch (lub wiêcej) sposobów leczenia. Badania empiryczne wskazuj¹ jednak, ¿e inne w³aciwoci schematu badania, takie, jak zalepienie próby mog¹ równie¿ istotnie wp³ywaæ na szan-se, ¿e wyniki badania nie bêd¹ tendencyjne [7]. Rzeczy-wicie, w badaniach, w których wyniki leczenia oceniane s¹ subiektywnie, brak zalepienia wydaje siê równie wa¿n¹ przyczyn¹ tendencyjnoci, jak nieadekwatne utajnienie przydzia³u do grup [8]. Brak zalepienia próby mo¿e pro-wadziæ zarówno do tendencyjnoci postêpowania (wiedza o tym, do jakiej metody leczenia pacjent zosta³ przydzie-lony prowadzi do systematycznej zmiany zachowania siê lekarza i pacjenta), jak i do tendencyjnoci oceny (wiedza o przydzieleniu do okrelonej metody leczenia prowadzi do systematycznie odmiennej oceny wyników leczenia w gru-pie leczonej i kontrolnej). Mo¿na przewidywaæ, ¿e zale-pienie bêdzie szczególnie wa¿ne przy wysokim poziomie zarówno mo¿liwoci, jak prawdopodobieñstwa tego ro-dzaju tendencyjnoci. Bêdzie tak wówczas, gdy zachowa-nie i wyniki leczenia ³atwo ulegaj¹ modyfikacji oraz gdy nie ma naprawdê równego traktowania, za badacz i/lub uczestnicy badania wyranie preferuj¹ któr¹ z porówny-wanych metod leczenia.

Potrzebê uwzglêdniania schematu badawczego poszcze-gólnych badañ mo¿na dobrze zilustrowaæ na przyk³adzie programu, w którym porównywano leki przeciwpsycho-tyczne pierwszej i drugiej generacji [PG i DG]. Kontekst by³ taki, ¿e wi¹zano du¿e nadzieje z lekami DG, spodzie-waj¹c siê, ¿e przynios¹ znaczny postêp w leczeniu schizo-frenii. W konsekwencji, pocz¹tkowo patrzono przez palce na ograniczenia metodologiczne prowadzonych przez fir-my farmaceutyczne badañ lekowych (mieszcz¹cych siê na kontinuum schematów badawczych bli¿ej bieguna wyja-niaj¹cego) [9], przeceniano zalety leków DG [10], oraz szybko przechodzono na leki DG w praktyce klinicznej i stosowano je zamiast leków PG [11]. Wyniki systematycz-nych prac przegl¹dowych i meta-analiz badañ lekowych sponsorowanych przez przemys³ farmaceutyczny w zasa-dzie by³y podobne [1214], chocia¿ autorzy jednego z prze-gl¹dów doszli do znacznie bardziej pozytywnych wniosków dotycz¹cych leków DG ni¿ inni [14, 15].

Opublikowano obecnie doniesienia z szeregu randomi-zowanych, kontrolowanych badañ niesponsorowanych przez firmy farmaceutyczne, porównuj¹cych leki PG i DG [1619].

Schemat badawczy w badaniach klinicznych:

w³aciwy schemat na w³aciwym miejscu

Clinical trial design: horses for courses JOHN R. GEDDES

University Department of Psychiatry, Warneford Hospital, Oxford, OX3 7JX, UK

K O M E N T A R Z E

C O M M E N T A R I E S

(2)

118 FORUM Tak wiele niezale¿nych badañ lekowych jest w psychiatrii

czym niezwyk³ym: wiadczy zarówno o niezwykle istot-nym rozwoju, jak i rzadko spotykanej ci¹g³ej niepewnoci i donios³oci zagadnienia. Owe niezale¿ne badania roz-patrywane jako grupa wydaj¹ siê wskazywaæ, ¿e chocia¿ mog¹ wystêpowaæ niewielkie ró¿nice w skutecznoci po-szczególnych leków, nie da siê wykazaæ, ¿e takie korzyci s¹ op³acalne, a ponadto równowa¿y je wiêksza czêstoæ pewnych niepo¿¹danych skutków. Ten ogólny wniosek nie powinien jednak przes³aniaæ faktu, i¿ w omawianych bada-niach stosowano bardzo ró¿ne schematy badawcze i mia³y one na celu uzyskanie odpowiedzi na ró¿ne, chocia¿ do-pe³niaj¹ce siê pytania. Brak miejsca nie pozwala na pe³n¹ krytyczn¹ ocenê ka¿dego z tych badañ, omówiê zatem tyl-ko wybrane zagadnienia.

Program CATIE, okrelony przez swoich autorów jako badanie pragmatyczne, mia³ pewne cechy pragmatyczne (reprezentatywna grupa pacjentów, zmienne dawkowanie, doæ d³ugi okres katamnestyczne), ale stosowano w nim metodê zalepienia i zadbano o wysok¹ jakoæ oceny wyni-ków leczenia [2]. Rezultaty CATIE nie by³y zaskakuj¹ce, chocia¿ bardzo cenne w tym sensie, ¿e potwierdzi³y obraz wy³aniaj¹cy siê z rozmaitych róde³, m.in. zarówno z meta-analiz, jak i z danych obserwacyjnych dotycz¹cych bezpie-czeñstwa leków [20].

Program CUtLASS mieci³ siê na kontinuum bli¿ej krañ-ca pragmatycznego, by³ bowiem bez zalepienia i umo¿li-wia³ wybór leków zarówno PG, jak i DG [18]. Rozpatruj¹c to badanie bez kontekstu nie da siê rozstrzygn¹æ, w jakim stopniu brak obserwowanych ró¿nic w CUtLASS oznacza, ¿e naprawdê nie by³o ¿adnych ró¿nic, czy ¿e w badaniu tym by³o zbyt du¿o szumów, aby mo¿na by³o wykryæ ró¿-nice. Wyniki CUtLASS dotycz¹ce op³acalnoci s¹ jednak wysoce zbie¿ne z wynikami innych niezale¿nych badañ.

EUFEST by³o ambitnym programem badania pacjentów z pierwszym epizodem, lecz ze wzglêdu na zastosowany schemat badania otwartego okaza³ siê niezwykle podatny na tendencyjnoæ postêpowania (a w konsekwencji tenden-cyjnoæ ocen), co spowodowa³o, ¿e autorzy programu nie byli w stanie sformu³owaæ ¿adnych klarownych wniosków [19], chocia¿ wydaje siê, ¿e Fleischacker i Goodwin s¹ obecnie bardziej na to przygotowani.

Brak miejsca uniemo¿liwia omówienie innych badañ efektywnoci w innych zaburzeniach omawianych przez Fleischackera i Goodwina, lecz podobne uwagi odnosz¹ siê do wszystkich. Niew¹tpliwie ¿adne z badañ ani skutecz-noci, ani efektywnoci nie daje wiêkszego prawdo-podobieñstwa oszacowania prawdy. Wszystkie badania maj¹ ograniczenia, a schemat badawczy jest sztuk¹ kom-promisu. Wszystkie badania nale¿y zatem oceniæ krytycz-nie. Mimo ró¿nych niedoci¹gniêæ metodologicznych badañ lekowych nowej generacji, podjêcie takich badañ oraz chêæ ich finansowania przez bud¿et pañstwowy i organi-zacje charytatywne nast¹pi³o z du¿ym opónieniem. Na-dal brak odpowiedzi na wiele wa¿nych pytañ klinicznych, którymi nie zajmowano siê w badaniach zaprojektowanych wy³¹cznie na w¹sko rozumiane potrzeby przemys³u i nad-zoru farmaceutycznego [1, 21]. Ci, którzy planuj¹ badania o profilu bardziej pragmatycznym, na pewno musz¹ ziden-tyfikowaæ istotne ród³a tendencyjnoci w ka¿dym poszcze-gólnym badaniu. Ogromne znaczenie ma schemat badania

powinien byæ tak solidny, aby wyniki badania by³y za-równo wiarygodne, jak i u¿yteczne. W przeciwnym razie owe z trudem uzyskane wyniki bêd¹ nara¿one na krytykê ze strony osób, którym siê one nie spodobaj¹!

PIMIENNICTWO

1. Geddes JR. Large simple trials in psychiatry: providing reliable answers to important clinical questions. Epidemiol Psichiatr Soc 2005; 14: 1226.

2. Stroup TS, Geddes JR. Randomized controlled trials for schizo-phrenia: study designs targeted to distinct goals. Schizophr Bull (in press).

3. Schwartz D, Lellouch J. Explanatory and pragmatic attitudes in therapeutic trials. J Chronic Dis 1967; 20: 63748.

4. Peto R, Collins R, Gray R. Large-scale randomized evidence: large, simple trials and overviews of trials. J Clin Epidemiol 1995; 48: 2340.

5. Sackett DL. Why randomized controlled trials fail but neednt: 2. Failure to employ physiological statistics, or the only formu-la a clinician-trialist is ever likely to need (or understand!). CMAJ 2001; 165: 122637.

6. Haynes B. Can it work? Does it work? Is it worth it? BMJ 1999; 319: 6523.

7. Schulz KF, Chalmers I, Hayes RJ et al. Empirical evidence of bias. Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA 1995; 273: 40812.

8. Wood L, Egger M, Gluud LL et al. Empirical evidence of bias in treatment effect estimates in controlled trials with different interventions and outcomes: meta-epidemiological study. BMJ 2008; 336: 6015.

9. Bagnall AM, Jones L, Ginnelly L et al. A systematic review of atypical antipsychotic drugs in schizophrenia. Health Technol Assess 2003; 7: 1193.

10. Cipriani A, Geddes JR. Comparison of systematic and narrative reviews: the example of the atypical antipsychotics. Epidemiol Psichiatr Soc 2003; 12: 14654.

11. Geddes J. Generating evidence to inform policy and practice: the example of the second generation atypical antipsychotics. Schizophr Bull 2003; 29: 10514.

12. Geddes J, Freemantle N, Harrison P et al. Atypical antipsycho-tics in the treatment of schizophrenia: systematic overview and meta-regression analysis. BMJ 2000; 321: 13716.

13. Leucht S, Pitschel WG, Abraham D et al. Efficacy and extra-pyramidal side-effects of the new antipsychotics olanzapine, quetiapine, risperidone, and sertindole compared to conven-tional antipsychotics and placebo. A meta-analysis of rando-mized controlled trials. Schizophr Res 1999; 35: 5168. 14. Davis JM, Chen N, Glick ID. A meta-analysis of the efficacy of

second-generation antipsychotics. Arch Gen Psychiatry 2003; 60: 55364.

15. Lieberman JA. Comparative effectiveness of antipsychotic drugs: a commentary on Cost Utility of the Latest Antipsychotic Drugs in Schizophrenia Study (CUtLASS 1) and Clinical Antipsy-chotic Trials of Intervention effectiveness (CATIE). Arch Gen Psychiatry 2006; 63: 106972.

16. Lieberman JA, Stroup TS, McEvoy JP et al. Effectiveness of antipsychotic drugs in patients with chronic schizophrenia. N Engl J Med 2005; 353: 120923.

17. Rosenheck R, Perlick D, Bingham S et al. Effectiveness and cost of olanzapine and haloperidol in the treatment of schizo-phrenia: a randomized controlled trial. JAMA 2003; 290: 2693702.

18. Jones PB, Barnes TRE, Davies L et al. Randomized controlled trial of the effect on quality of life of second- vs. first-generation

Schemat badawczy w badaniach klinicznych: właściwy schemat na właściwym miejscu

Schemat badawczy w badaniach klinicznych:

w³aciwy schemat na w³aciwym miejscu

K O M E N T A R Z E

C O M M E N T A R I E S

w³aciwy schemat na w³aciwym miejscu