Úvod
Před přijetím konečného zásahu zkušební, pilotní studie mohou být prováděny. Pilotní zkoušky jsou často malé verze hlavního pokusu, prováděné za účelem testování zkušebních metod a postupů.1,2 celkovým cílem pilotních studií je prokázat, že může být provedena budoucí studie. K řešení tohoto cíle existuje řada cílů pilotní studie, včetně posouzení míry náboru a udržení, získání odhadů parametrů požadovaných pro výpočet velikosti vzorku a poskytnutí předběžných důkazů o potenciálu účinnosti.3-6
ukazují, jak používat pilotních studií uvědomí design budoucích randomizovaných kontrolovaných studií (Rct) tak, že pravděpodobnost odpovědi na výzkumnou otázku je vysoká. Ukážeme, jak pilotní studie mohou řešit každý z dříve uvedených cílů, jak optimálně navrhnout pilotní studii, a jak provést analýzu citlivosti velikosti vzorku. Náš příklad používá průběžný výsledek, ale většinu obsahu lze aplikovat na pilotní studie obecně.
úvahy pro návrh pokusu
při navrhování definitivní studie je třeba vzít v úvahu
- velikost cílového efektu, jako je rozdíl v prostředcích pro průběžné výsledky;
- rozptyl odhadů průběžných výsledků, který se používá k poskytnutí řady odpovědí jednotlivcům ve studii;
- proveditelnost, včetně doporučení, náboru a míry udržení.
výsledky pilotních zkoušek mohou informovat každý z těchto prvků. Faktory, jako je chyba typu I a výkon, jsou nastaveny nezávisle na pilotovi a jsou podrobně diskutovány jinde.7 Zaměřujeme se na externí pilotní studie, kde je pokus spuštěn před hlavním pokusem a výsledky nejsou kombinovány.8
proveditelnost
první úvahou je proveditelnost: budou vědci schopni přijmout požadovaný počet účastníků v časovém rámci studie a udržet je v hlavní studii? Při hodnocení klinické záznamy mohou být použity k dát nějaký náznak potenciální účastník bazén, pilotní studie poskytují odhady počtu účastníků, kteří vlastně zapsat a souhlasu, randomizace, a tyto odhady by měly být zahrnuty v rukopisech, že zpráva pilotní studie výsledky.9 mnoho pokusů se snaží dosáhnout svého cíle velikosti vzorku, což může mít za následek rozšíření pokusů nebo selhání náboru na předem stanovenou velikost vzorku.10 neúspěch při náboru je hlavním problémem ve studiích financovaných z veřejných zdrojů ve Velké Británii, kde 45% nedosáhne cílové velikosti vzorku.10 spolu s přezkoumáním předchozích studií ve stejných centrech v podobných populacích mohou pilotní studie také poskytnout odhady míry retence a míry adherence.11 Chybějící data a výpadky jsou otázky, ve většině RCTs12 a je třeba zvážit v každé fázi výzkumného procesu,13, včetně designu, reporting,9 a progrese do větší definitivní soud.11,14
Cílový efekt velikost a potenciál účinnosti.
Hislop et al15 provedla systematické přezkoumání identifikovat sedm přístupy pro stanovení cílové velikosti účinku pro RCT a je klasifikován jako klinicky významné a/nebo realistické. Konkrétní typ klinicky důležitý rozdíl je nejmenší hodnota, která bude dělat rozdíl pro pacienty, nebo které by mohly změnit péči, množství uvedené jako minimálně významný rozdíl (MID), nebo někdy minimálně klinické důležitý rozdíl. MID může být obtížné určit, zejména proto, že se může měnit s populací pacientů. Vědci v různých oborech však zkoumali střední odhad a poskytli pokyny k odhadu.16,17 při absenci známého MID pro kontinuální výsledky, zejména výsledky hlášené pacientem, byla doporučena standardizovaná velikost účinku15 mezi 0,3 a 0,5.17,18 znalecký posudek se také používá ke specifikaci důležitých rozdílů.15 ačkoli někteří vědci používají velikost pilotního efektu k napájení definitivní studie, je to praxe, které je třeba se obecně vyhnout, protože odhad je kvůli malé velikosti vzorku špatný a pravděpodobně bude zavádějící.19
cílové velikosti účinku, musí být také realistické, a odhad efektu a intervalu spolehlivosti (CI) od pilot může dát nějaké stopy, tj., zda existuje nějaký náznak, že intervence je efektivní a důležité rozdíly mohou být získány v hlavním líčení.5 Malá velikost vzorku pilota činí odhad nejistým, proto je třeba postupovat opatrně.19,20 jedním z způsobů řešení této nejistoty je použití jiných úrovní významnosti než „tradičních“ 5% k poskytnutí předběžných důkazů o účinnosti, s odpovídajícími CIs, jako je 85 a 75% kromě 95% CIs.21 obrázek zobrazující tyto CIs, střední a nulovou hodnotu může být užitečným způsobem zobrazení pilotních výsledků tím, že usnadní hodnocení jak statistické významnosti, tak potenciálu klinické významnosti.31 zatímco někteří autoři argumentují proti provádění testů hypotéz a hodnocení účinnosti od pilotů, dokonce i potenciální účinnosti, většina pilotních studií provádí testy hypotéz.6 důrazně zdůraznit, že předběžné důkazy účinnosti z pilotní studie by neměly být nadhodnoceny, a vědci by se měli vyhnout pokušení vzdát se hlavní líčení.20,22
Odhad směrodatné odchylky (SD)
obyvatelstvo SD je dalším klíčovým prvkem pro odhad velikosti vzorku pro kontinuální výsledky, a jeho odhad je jedním z cílů pro provádění pilotní studie. Nicméně, podobně jako velikost efektu, SD může být nepřesně odhadnuta kvůli malé velikosti vzorku pilota. Ukázalo se, že použití SD pilotní studie k návrhu budoucí velikosti vzorku často vede k nedostatečné studii.23,24 proto by měly být provedeny analýzy citlivosti.
analýza Citlivosti na velikost vzorku
analýzy Citlivosti jsou důležité pro posouzení robustnosti výsledků studie předpoklady v primární analýze.25 Citlivostní analýzy by měly být také provedeny v návrhu stage26 a může mít podobu účetnictví za nejistotu v odhadu na základě výpočtu velikosti vzorku, na základě řady věrohodných SDs a uchovávání/vypuštění sazby. Browne23 navrhl použít horní hranici 80% CI pilotní studie pro SD pro výpočet velikosti vzorku v následující studii. Jeden může také zvážit SDs z literatury.
velikost vzorku pilotní studie
aby měli vědci nejlepší šanci odpovědět na výzkumnou otázku, měli by pečlivě zvážit velikost nejen definitivního pokusu,ale také pilota. Ačkoli tradiční výpočty výkonu jsou pro pilotní studie nevhodné (protože primárním cílem pilotní studie není testovat nadřazenost jednoho ošetření nad druhým), je důležité zdůvodnění velikosti vzorku. Zatímco tam je několik pravidel palce pro velikost pilotní studie, v rozmezí od 12 do 35 jedinců na ruku,5,27 žádný z těchto pokynů účtu za pravděpodobné, velikost budoucího soudu.
Whitehead et al27 ukázali, jak, pokud znáte velikost cílového účinku hlavní studie, můžete odhadnout optimální velikost vzorku pilotní studie a minimalizovat počet pacientů přijatých v obou studiích. Z této práce, navrhli stupňovitá pravidla pro pilotní studie na základě velikosti cílového efektu a velikosti budoucí studie. Tato pravidla jsou shrnuta v tabulce 1. Pokud bude například budoucí studie navržena kolem malého účinku, pak by počet pacientů na rameno pro pilotní studii měl být 25 pro 90% výkon. Použití těchto pravidel zvyšuje pravděpodobnost vhodného výkonu pro budoucí soud. Cocks a Torgerson5 také doporučují založit velikost pilotní studie na velikosti budoucí studie, pokud je SD známa.
Tabulka 1 Vstoupil pravidla pro pilotní studie, velikost vzorku za ruku, jako funkce cílová velikost účinku (standardizovaný rozdíl) a výkon hlavní líčení, Poznámky: . Je také zobrazena odpovídající pravděpodobná velikost hlavního pokusu. int je intervenční rameno a ctl je kontrolní rameno. |
Příklad:
Předpokládejme, že výzkumný tým plánuje pilot v očekávání navrhování definitivní soud. Hlavní líčení bude dva-ruku RCT srovnávající novou podpůrnou péči režim pro pacienty s rakovinou obvyklá péče, se hodnocení na základní, 6 týdnů a 3 měsíců. Jejich primárním výsledku je kvalita života po 3 měsících, měřeno do Funkčního Hodnocení Léčby Rakoviny-Obecné (FACT-G), 27-položky dotazníku zahrnuje aspekty fyzické, sociální, rodina, emocionální a funkční pohody.28
Pilotní studie, velikost vzorku
použití stupňovité pravidla pro pilot velikost vzorku, vědci musí brát v úvahu cíl, vliv velikosti a SD pro hlavní líčení za účelem výpočtu standardizované rozdíl (velikost účinku). Zjistí, že odhadovaný FACT-G MID je mezi třemi a šesti body29 a odhad SD z literatury30 je 14 v podobných populacích. Při použití středního odhadu čtyř bodů a SD 14 je standardizovaná velikost efektu 4/14=0,29. Pro 90% poháněný hlavní pokus by měli použít velikost vzorku 25 na rameno pro pilota (Tabulka 1).
výsledky pilotní studie
Předpokládejme, že nyní vědci provádějí pilotní studii 50 účastníků s náborem po dobu 2 měsíců. Ze 100 potenciálních účastníků bylo 70 účastníků odkázáno svým onkologem, 60 účastníků splnilo kritéria způsobilosti a 50 účastníků souhlasilo s účastí. To naznačuje míru náboru 50% způsobilých pacientů při 25 náborech měsíčně. Z 50 účastníků dokončilo všechna tři hodnocení 40 účastníků; retence je 80%. Tyto sazby pomohou při odhadu trvání hlavní zkoušky.
rozdíl v kvalitě života mezi rameny na 3 měsíce se odhaduje na 3,1 bodů, 95% CI -1.8 na 8.0, a SD =11.2. Obrázek 1 ukazuje několik ci prokazujících, že intervence je slibná, protože každý CI obsahuje střední část 4. Cíl pilotní studie poskytnout předběžné důkazy o účinnosti byl tedy splněn.
Obrázek 1 průměrný rozdíl ve SKUTEČNOSTI-G skóre mezi pilotní studie, intervence a kontroly zbrojení s intervaly spolehlivosti. zkratky: FACT-G, funkční hodnocení léčby rakoviny-rody; Střední, minimální důležitý rozdíl. |
velikost Vzorku výpočty a analýzy citlivosti
Tabulka 2 ukazuje velikost vzorku na základě pilotní studie SD, horní 80% CI omezit (převzato jako odmocnina intervaly spolehlivosti pro rozptyl), a původní odhad z literatury. Vzorek velikosti jsou také uvedeny pro pozorované vypuštění sazby (20%) a na >5 a <5%. Pro 90% výkon se velikost vzorku pohybuje od 392 do 692. Pro výkon 80% se velikosti vzorků pohybují od 296 do 518. Všimněte si, že analýza citlivosti je kvantifikována z hlediska vlivu předpokladů na velikost vzorku. Alternativní přístup je stanovit velikost vzorku (na 392 řekněme) a sledovat, jak moc se liší na základě předpokladů.
Tabulka 2 rozsah velikosti vzorku různou vypuštění, nábor zaměstnanců hodnotit, a odhaduje SD za předpokladu, že vliv velikosti čtyři body, Poznámky: ponížen na 1,5 let náboru. bbzaloženo na míře náboru pilotních studií 25 účastníků za měsíc. zkratka: SD, směrodatná odchylka. |
Proveditelnosti hlavní líčení,
nyní zvážit proveditelnost. Konkrétně, jsou vědci pravděpodobně schopni přijmout požadovaný počet účastníků v časovém rámci studie? Na základě financování a doby sledování 3 měsíce může nábor trvat 1, 5 roku. Pokud je míra pilotního náboru 25 účastníků za měsíc dobrým odhadem, bude studie schopna přijmout a zapsat 450 účastníků. To spadá pod několik odhadů v tabulce 2. Může být zapotřebí dalšího zvážení, jak rozšířit skupinu účastníků.
Závěr
Máme tu znázorněno, jak se pilotní studie mohou pomoci při návrhu budoucích studiích s kontinuálním výsledky tím, že poskytuje odhady populace SD, důkazy o potenciálu pro intervence, účinnosti a vyčíslení proveditelnosti v podobě náboru a retence. Zavedli jsme pokyny pro velikost vzorku pilotní studie a prokázali analýzu citlivosti velikosti vzorku. Příklad ukázal, jak se odhady velikosti hlavního zkušebního vzorku mohou dramaticky lišit věrohodně měnícími se předpoklady.
rozhodnutí o postupu z pilotního pokusu do hlavního pokusu se obecně provádí pomocí odhadů proveditelnosti, stejně jako otázek, jako je nedodržování protokolu. Další informace o postupu, viz Avery et al, 11 a informace o kontextu Interních pilotů, viz Hampson et al.14 ať už se vědci rozhodnou postoupit k definitivnímu pokusu nebo ne, měly by být zveřejněny výsledky pilotních studií. Rozšíření CONSORT pro vykazování výsledků pilotních studií a Studií proveditelnosti poskytuje podrobné pokyny.9
poděkování
tento výzkum neobdržel žádný zvláštní grant od žádné finanční agentury ve veřejném, komerčním nebo neziskovém sektoru. Aktuální adresa ALW je Southampton Clinical Trials Unit, University of Southampton, Southampton, Velká Británie.
zveřejnění
Profesor MLB je podporován University of Arizona Cancer Center, prostřednictvím NCI grant P30CA023074. Profesor SAJ je financován z University of Sheffield. Dr. ALW byl financován University of Sheffield studentship. Autoři nehlásí žádné další střety zájmů v této práci.
Thabane L, Ma J, Chu R, et al. Návod na pilotní studie: co, proč a jak. BMC Med Res Methodol. 2010;10:1. |
|||||
spadl déšť M, Campbell MJ, Cooper CL, Lancaster GA. Co je pilotní studie nebo studie proveditelnosti? Přehled současné praxe a redakční politiky. BMC Med Res Methodol. 2010;10:67. |
|||||
Craig P, Dieppe P, Macintyre S, et al. Vývoj a hodnocení komplexních intervencí: nové pokyny Rady pro lékařský výzkum. BMJ. 2008; 337: a1655. |
|||||
Lancaster G, Campbell M, Eldridge S, et al. Zkoušky v primární péči: statistické otázky při návrhu, provádění a hodnocení komplexních intervencí. Stat Methods Med Res. 2010; 19 (4): 349-377. |
|||||
Cocks K, Torgerson DJ. Výpočty velikosti vzorku pro pilotní randomizované studie: přístup k intervalu spolehlivosti. J. 2013;66(2):197–201. |
|||||
Shanyinde M, Pickering RM, Weatherall M. Otázky a odpověděl pilot a proveditelnosti randomizovaných kontrolovaných studií. BMC Med Res Methodol. 2011;11(1):117. |
|||||
Julious SA. Velikosti vzorků pro klinické studie s normálními údaji. Stat Med. 2004;23(12):1921–1986. |
|||||
Wittes J, Brittain e. úloha Interních pilotních studií při zvyšování účinnosti klinických studií. Stat Med. 1990;9(1–2):65–72. |
|||||
Eldridge SM, Chan CL, Campbell MJ, et al. CONSORT 2010 prohlášení: rozšíření na randomizované pilotní a proveditelné zkoušky. BMJ. 2016; 355: i5239. |
|||||
Avery KNL, Williamson PR, Gamble C, et al. Informování efektivních randomizovaných kontrolovaných studií: zkoumání výzev při vývoji kritérií progrese pro interní pilotní studie. BMJ otevřeno. 2017; 7 (2): e013537. |
|||||
Bell ML, Fiero M, Horton NJ, Hsu CH. Zpracování chybějících dat v RCT; přehled nejlepších lékařských časopisů. BMC Med Res Methodol. 2014;14(1):118. |
|||||
Bell ML, Fairclough dl. Praktické a statistické problémy v chybějících datech pro longitudinální výsledky hlášené pacientem. Stat Methods Med Res. 2014; 23 (5): 440-459. |
|||||
Hampson LV, Williamson PR, Wilby MJ, Jaki T. rámec pro prospektivně definování progrese pravidla pro interní pilotní studie sledování náboru. Stat Methods Med Res. Epub 2017 Leden 01. |
|||||
Hislop J, Adewuyi TE, Vale LD, et al. Metody pro určení cílového rozdílu v randomizované kontrolované studii: systematický přehled vyvolání rozdílů ve studiích (DELTA). PLoS Med. 2014; 11 (5): e1001645. |
|||||
Revicki DA, Cella D, Hays RD, Sloan JA, Lenderking WR, Aaronson NK. Citlivost a minimální důležité rozdíly u pacientů hlášených výsledků. Výsledky Zdravotního Stavu. 2006;4:70. |
|||||
král m. bod minimálního důležitého rozdílu (MID): kritika terminologie a metod. Expert Rev Pharmacoecon Outcomes Res. 2011; 11 (2):171–184. |
|||||
Norman GR, Sloan JA, Wyrwich KW. Skutečně pozoruhodná univerzálnost poloviční směrodatné odchylky: potvrzení jiným pohledem. Expert Rev Pharmacoecon Výsledky Res. 2004; 4 (5): 581-585. |
|||||
Kraemer HC, Mintz J, Noda a, Tinklenberg J, Yesavage JA. Pozor, pokud jde o použití pilotních studií k vedení výpočtů výkonu pro návrhy studií. Arch Gen Psychiatrie. 2006;63(5):484–489. |
|||||
Loscalzo J. pilotní studie v klinickém výzkumu: jakou hodnotu mají? Oběh. 2009;119(13):1694–1696. |
|||||
Lee EC, Whitehead AL, Jacques RM, Julious SA. Statistická interpretace pilotních zkoušek: měly by být prahové hodnoty významnosti přehodnoceny? BMC Med Res Methodol. 2014;14(1):41. |
|||||
Lancaster GA, Dodd S, Williamson PR. Návrh a analýza pilotních studií: doporučení pro správnou praxi. J Eval Clin Pract. 2004;10(2):307–312. |
|||||
Browne RH. O použití pilotního vzorku pro stanovení velikosti vzorku. Stat Med. 1995;14(17):1933–1940. |
Vickers AJ. Poddimenzování v randomizovaných studiích vykazujících výpočet velikosti vzorku. J. 2003;56(8):717–720. |
||||
Thabane L, Mbuagbaw L, Zhang S, et al. Výukový program o analýzách citlivosti v klinických studiích: co, Proč, Kdy a jak. BMC Med Res Methodol. 2013;13(1):92. |
|||||
Lewis JA. Statistické zásady pro klinická hodnocení (ICH E9): úvodní poznámka k mezinárodnímu pokynu. Stat Med. 1999; 18(15):1903–1942. |
|||||
Whitehead A, Julious S, Cooper C, Campbell MJ. Odhad velikosti vzorku pro pilotní randomizovanou studii s cílem minimalizovat celkovou velikost vzorku pro externí pilotní studii a hlavní studii pro kontinuální proměnnou výsledku. Stat Methods Med Res. 2016; 25 (3): 1057-1073. |
|||||
Cella DF, Tulsky DS, Gray G, et al. Funkční hodnocení stupnice léčby rakoviny: vývoj a validace obecného opatření. J Clin Oncol. 1993;11(3):570–579. |
|||||
Webster K, – D, Yost K. funkčního hodnocení léčby chronického onemocnění (FACIT) systém měření: vlastnosti, použití a interpretaci. Výsledky Zdravotního Stavu. 2003;1:79. |
|||||
Bell ML, McKenzie JE. Navrhování psycho-onkologie randomizovaných studiích a clusteru randomizovaných studiích: rozptyl komponenty a intra-cluster korelace běžně používaných psychosociální opatření. Psychoonkologie. 2013;22(8):1738–1747. |
|||||
Bell, ML, Fiero MH, Dhillon HM, Bray VJ a Vardi JL. Statistické spory ve výzkumu rakoviny: použití standardizovaných grafů velikosti efektu ke zvýšení interpretovatelnosti klinických studií souvisejících s rakovinou s výsledky hlášenými pacientem. Ann Oncol. 2017;28(8):1730–1733. |