»Strona główna » Aktualności dla lekarzy » Jak przeprowadzić „klinicznie istotne” badanie z randomizacją
Polecamy
Patronat medialny
Patronat medialny
Polecamy

Aktualności dla lekarzy

04.02.2010
Jak przeprowadzić „klinicznie istotne” badanie z randomizacją
from theheart.org
Los Angeles, Kalifornia. Należy dołożyć więcej starań przy przeprowadzaniu badań z randomizacją, których wyniki mogą mieć istotne znaczenie i realny wpływ na zdrowie publiczne - taki wniosek wypływa z przeglądu najczęstszych potknięć przy tworzeniu badań z randomizacją, opublikowanego 2 lutego 2010 roku na łamach Journal of the American College of Cardiology. Autorzy, dr Sanjay Kaul i dr George Diamond (Cedars-Sinai Medical Center, Los Angeles, Kalifornia) piszą: „Zła interpretacja wyników badań może wprowadzić w błąd przyszłych badaczy i prowadzić do suboptymalnego postępowania w codziennej praktyce”.
Autorzy podkreślają trzy główne ograniczenia badań z randomizacją, które, według nich, są odpowiedzialne za nieprawidłową interpretację wyników:
  • Siła dowodu przeważnie opiera się na różnicy obserwowanej między grupami w konwencjonalnych testach i wyrażona jest istotnością statystyczną oraz przedziałem ufności (confidence interval, CI), natomiast mniejszą wagę przykłada się do klinicznej istotności i efektów zastosowania wyników w codziennej praktyce lekarskiej.
  • Złożone punkty końcowe są często stosowane w celu zwiększenia liczby obserwowanych zdarzeń, co pozwala na zmniejszenie liczebności badanej grupy, jednak może podważać znaczenie wniosków płynących z badania.
  • Późniejsza, często przeprowadzana analiza podgrup skutkuje raportowaniem o wynikach, które zachęcają do suboptymalnych rozwiązań.
Kaul i Diamond podają wiele przykładów badań, które, ich zdaniem, mają takie ograniczenia. Podsumowują: „Uważna analiza przedstawionych zastrzeżeń jest nie tylko kluczem do krytycznej oceny piśmiennictwa, ale ma również implikacje w sposobie postępowania z pacjentem oraz przy tworzeniu i wdrażaniu rekomendacji i zmian w praktyce klinicznej”.
W załączonym artykule redakcyjnym [2] dr Gregg Stone (Columbia University Medical Center, Nowy Jork) i dr Stuart Pocock (London School of Hygiene and Tropical Medicine, Wielka Brytania) podkreślają, że niektóre z przykładów prezentowanych przez Kaula i Diamonda mogą „stymulować do żywej i zdrowej debaty, cele i wyniki ich pracy są dobrze umotywowane i powinny być obowiązkową lekturą dla przedstawicieli opieki zdrowotnej i innych profesji zaangażowanych w tworzenie i interpretację badań klinicznych”.
 
Znaczenie kliniczne vs. istotność statystyczna
Kaul i Diamond podkreślają, że z silnie ugruntowanymi standardami oceny istotności statystycznej (wartość p) kontrastuje brak rekomendacji, które wskazywałyby, jakie z obserwowanych różnic są istotne klinicznie lub po prostu ważne. Z tego powodu, zdaniem autorów, pojawia się tendencja do utożsamiania istotności statystycznej ze znaczeniem klinicznym. Autorzy zwracają uwagę na fakt, że w niektórych przypadkach istotność statystyczna nie ma przełożenia klinicznego, dlatego powinno się oceniać zarówno istotność statystyczną, jak i kliniczną.
 
Wartość p narzuciła swoją wolę środowisku uczonych.
 
Kaul w komentarzu dla heartwire stwierdził: „Wartość p narzuciła swoją wolę środowisku uczonych. Wielu badaczy interpretuje bardzo niskie wartości p jako bardzo silny dowód. Jeśli natomiast wartość p rzeczywiście sugeruje istnienie realnego efektu, nie niesie ze sobą żadnej informacji o jego znaczeniu. Potrzebujemy pomiarów, które pomogą nam ocenić wartość «znaczenia» obserwowanego efektu”.
Jedną z metod zaproponowanych do oceny klinicznej istotności jest określenie minimalnej istotnej klinicznie różnicy między dwoma sposobami postępowania zastosowanymi w badaniu. Jeśli 95-procentowy przedział ufności przekraczałby wspomniany punkt, to efekt obserwowany w badaniu „mógłby być” klinicznie istotny – tłumaczą autorzy. Gdyby cały przedział ufności przekraczał punkt minimalnej istotności klinicznej, to efekt postępowania byłby istotny klinicznie. Dodają, że informacji o liczbie pacjentów wymaganych do odnotowania poprawy (number needed to treat, NNT) lub szkody (number needed to harm, NNH) można także użyć do oceny istotności klinicznej. Kaul i Diamond zachęcają do stosowania analizy Bayesa w celu oszacowania rozkładu istotności klinicznej stosowanego postępowania.
Autorzy sugerują, że formalna ocena znaczenia klinicznego powinna być włączona w analizę, interpretację i prezentację wyników badań klinicznych. „Sugerujemy, że powinny zostać wypracowane jednolite standardy oceny dowodów, które zachęcałyby do jednoznacznej oceny znaczenia klinicznego pod względem minimalnej istotności klinicznej predefiniowanej przez przedziały minimalnych obserwowanych różnic” – zaznaczają.
Kaul sugeruje w rozmowie z heartwire, że komitety tworzące rekomendacje kliniczne mogłyby być właściwymi organami do zdefiniowania istotnych klinicznie granicznych wartości obserwowanych różnic. „Oczywiście, w przypadku zdarzeń nieskutkujących zgonem musiałyby wystąpić większe różnice niż w przypadku zdarzeń śmiertelnych, ale wszystkie zależności musiałyby zostać ustalone z góry. To trudne zadanie, ale możliwe do realizacji” –podsumowuje.
 
Powinno określić się wagę składowych złożonych punktów końcowych
 
Konieczne są pomiary, które dadzą nam wartość „znaczenia”.
 
Kaul i Diamond zaznaczają, że w typowym sercowo-naczyniowym badaniu klinicznym stosuje się złożone punkty końcowe, które łączą „twarde”, ale rzadkie punkty końcowe, takie jak zgon, zawał serca z załamkiem Q lub udar mózgu powodujący kalectwo, z „miękkimi”, ale częstszymi punktami końcowymi, takimi jak konieczność ponownej interwencji, zawał serca związany z procedurą (zwiększenie podwyższenie stężenia markerów martwicy), nawrotowa dławica piersiowa czy ponowna hospitalizacja. Wskazują, że z uwagi na większą częstość mniej istotnych punktów końcowych, często to one decydują o końcowym efekcie badanej terapii. Kaul komentuje dla heartwire, że zazwyczaj w badaniach sercowo-naczyniowych poważne niepożądane zdarzenia sercowe (major adverse cardiac events, MACE) zastępowane są mniej ważnymi uciążliwymi zdarzeniami sercowymi (minor inconvenient cardiac events, MICE)”.
Autorzy dodają, że zastosowanie złożonego punktu końcowego staje się jeszcze bardziej problematyczne w przypadku włączenia w „analizę efektu klinicznego” punktów końcowych dotyczących bezpieczeństwa, gdzie złożoność może maskować wzrost ryzyka wystąpienia groźnych zdarzeń, szczególnie gdy składowe istotnie różnią się znaczeniem klinicznym.
Autorzy sugerują możliwe rozwiązanie, którym byłoby wprowadzenie oceny wagowej składowych złożonego punktu końcowego. Takie działanie można przeprowadzić po zebraniu danych, wykorzystując je do oszacowania wagi każdej ze składowych. Przykładowo: jeśli dla zgonu przyznana zostanie wartość 1,0, to inne punkty końcowe mogą uzyskać mniejsze wartości, zależnie od ich wpływu na śmiertelność. Ewentualnie waga zdarzeń mogłaby być narzucona i standaryzowana na podstawie wyników badań klinicznych. Kaul komentuje dla heartwire: „Planowanie badania klinicznego to trudne zadanie. Surowość musi być zbalansowana z wykonalnością. Niestety, od dawna mamy do czynienia z sytuacją, w której dbałość o łatwość wykonania dominuje nad surowością”.
 
Ryzyko związane z analizą podgrup
 
Surowość musi być zbalansowana z wykonalnością. Niestety, od dawna mamy do czynienia z sytuacją, w której dbałość o łatwość wykonania dominuje nad surowością.
 
Na temat analizy podgrup Kaul i Diamond mówią, że chociaż mogą one dostarczyć potencjalnie przydatnych informacji, mogą również prowadzić do nieadekwatnych wyników, nieprawidłowych wniosków i suboptymalnego postępowania. Autorzy podkreślają: „Główną wartością analizy podgrup jest ocena siły pierwszorzędowych wniosków poprzez demonstrację zgodności między podgrupami zamiast niezgodności między dwiema przypadkowymi grupami. Wyniki analizy podgrup należy oceniać z rezerwą do czasu, gdy zostaną niezależnie potwierdzone”.
Autorzy proponują następujące rekomendacje dotyczące sposobu przeprowadzania i prezentacji analizy podgrup:
  • Prospektywne definiowanie hipotezy.
  • Ograniczenie analiz do biologicznie wiarygodnych podgrup na podstawie wcześniejszych dowodów.
  • Ograniczenie analiz do statystycznie istotnych efektów leczenia we wcześniejszej analizie całej grupy.
  • Identyfikacja statystycznie istotnych interakcji zastosowanego leczenia z różnicami między podgrupami.
  • Uwzględnienie w analizie wielu czynników.
  • Prezentowanie wyników analizy podgrup jako wymagających niezależnego potwierdzenia.
  • Unikanie nadinterpretacji różnic między podgrupami.
Piśmiennictwo
1. Kaul S and Diamond GA. Trial and error. How to avoid commonly encountered limitations of published clinical trials. J Am Coll Cardiol 2010; 55: 415-27.
2. Stone GW and Pocock SJ. Randomized trials, statistics, and clinical inference. J Am Coll Cardiol 2010; 55: 428-31.
Adaptation in Polish has been done by FaktyMedyczne.pl and has not been reviewed by theheart.org editorial team.
Podpisujemy się pod zasadami HONcode.
Sprawdź tutaj.
Działania Fundacji Instytut Aterotrombozy
wspierane są grantem edukacyjnym
SANOFI
Współpraca:
casusMEDICAL
Technologia: