
取消
清空記錄
歷史記錄
清空記錄
歷史記錄



?本期分享國jia藥品監督管理局藥品審評中心5月13日發布的《藥物臨床試驗適應性設計指導原則(征求意見稿)》 ,讓我們共同解讀一下吧!
? ? ? ? ? ? ? ? ? ? ?

目 錄
一、 引言
二、 適應性設計中需要考慮的因素
(一)合理性
(二)完整性
(三)可行性
三、 常用的適應性設計
(一)成組序貫設計
(二)樣本量重新估計
(三)兩階段無縫適應性設計
(四)適應性富集設計
(五)適應性主方案試驗設計
(六)多重適應性設計
四、 適應性設計的其他考慮
(一)貝葉斯方法的應用
(二)模擬方法的應用
五、 監管的考慮
(一)與監管部門的溝通
(二)對申報資料的要求
(三)其他的考慮
參考文獻
附錄1、詞匯表(本文略)
附錄2、適應性設計案例(本文略)
? ? ? ? ? ? ? ? ? ? 藥物臨床試驗適應性設計指導原則
?一、引言
?本指導原則側重于討論臨床試驗中采用適應性設計的重要概念和原則,主要從監管角度來討論一些常用的適應性設計,提出建議供申辦方在計劃使用適應性設計時予以考慮,同時也提出了一些具體要求,目的是幫助申辦方評估是否采用以及如何進行適應性設計,以支持新藥臨床試驗申請和新藥上市申請。對于申辦方提交的適應性設計方案,監管部門會依據提交的材料及臨床試驗中所涉及的各種因素,在綜合評估后給出具體的咨詢意見。
?適應性設計可能會涉及多種統計方法,因此,在具體設計適應性臨床試驗方案時,申辦方應同時參考其它相關的ICH指導原則和國內指導原則。
?臨床試驗zui為常用的設計是固定樣本量的設計,也常被稱為傳統設計,被廣fan地用于確證性試驗,它是指對試驗的數據僅在試驗終止時做一次有效性分析并在試驗進行中沒有對試驗進行任何的分析和修改。很多確證性試驗是基于前期有限的數據而設計,有可能存在較大的偏差。如何根據試驗期間累積的數據對試驗做出相應的修改從而修正設計的偏差就成為試驗設計時需要考慮的一個重要問題。適應性設計是對固定樣本量的設計進行某些調整的設計,本指導原則中適應性設計被定義為:按照預先設定的計劃,在期中分析時根據試驗期間累積的數據對試驗做出相應修改的臨床試驗設計,這種修改又稱為適應性修改。適應性修改計劃必須在臨床試驗開始前的試驗方案和統計分析計劃中預先設定。
?成組序貫設計是zui早應用于臨床試驗的適應性設計,其后,適應性設計較廣范地用于樣本量的重新估計。在2007年歐盟EMA和 2010年美國FDA發布適應性設計監管指南后,適應性設計的研究逐步推廣和發展到了多種類型的試驗設計,例如從多個劑量中篩選出具有潛在獲益劑量的設計,到目前的多個目標人群、多個假設、多個終點和多重檢驗等更為復雜的設計。隨著更多新的理論方法不斷地推出以及應用經驗不斷地增多,越來越多的適應性設計在臨床試驗中得以應用,幾乎涵蓋了藥物研發的各個階段和所有的疾病領域。
?許多臨床試驗的失敗源于前期信息有限導致的設計偏差,而適應性設計因為在試驗期間可以根據試驗期間累積的數據對方案進行修改,以修正初始設計的偏差,從而顯zhu增加了試驗的成功率。適應性設計還可以提高試驗的效率,如減少試驗所需要的樣本量、縮短不同研究階段之間的時間間隔、選擇更合適的終點、選擇更合適的目標人群、利用相同數量的受試者獲得更多的數據等。此外,復雜的適應性設計還可以在一個試驗中同時處理多個試驗目標、多種試驗藥物和多種疾病。
?盡管適應性設計具有上述諸多優勢,但由于其復雜性,同時也給試驗設計、數據分析和結果解釋,特別是試驗的實施,帶來了諸多挑戰和問題,例如,怎樣控制整體I類錯誤率、怎樣選擇分析模型和怎樣估計療效,以及因試驗實施困難可能導致的操作偏倚等,這些都限制了適應性設計的應用。
?本指導原則主要適用于化學藥、生物制品和中藥的確證性臨床試驗,對于探索性研究也具有參考意義。
?二、適應性設計中需要考慮的因素
?在決定是否采用適應性設計之前,應全面深入地權衡適應性設計和傳統設計之間的優劣,尤其是適應性設計在設計、實施和統計分析方面的復雜性,以及由此而帶來的在試驗實施中可能會引入的、不可避免的操作偏倚以及其他各種挑戰。是否采用適應性設計需綜合考慮諸多因素,特別是合理性(validity)、完整性(integrity)和可行性(feasibility)。
(一)合理性
?適應性設計的合理性是指所采用的統計分析方法不會導致療效的估計產生偏倚。試驗的合理性是關于試驗結果的可信度、可解釋性和說服力的綜合描述。保持試驗的合理性意味著應該有正確的統計推斷方法,例如怎樣計算調整后的p值、怎樣估計效應量及置信區間,以及怎樣衡量不同階段治療效果的一致性。
?由于本指導原則的關注重點是能夠支持注冊的確證性試驗,因此要求試驗的整體I類錯誤率嚴格控制在雙側0.05(或單側0.025)的水平。判斷適應性設計是否合理,zui重要的標準是所使用的統計方法能否控制整體I類錯誤率。對有些適應性設計來說,如采用雙側檢驗,由于不同階段的p值不能反映組間比較的方向,有可能使得zui終的整體p值難以解釋。為避免這種情況,可在試驗方案中選擇單側檢驗。但對另一些適應性設計,例如不對稱的雙邊假設,雙側檢驗會是更合適的選擇。除了某些特殊情形外,適應性修改都需調整試驗的I類錯誤率。
?適應性設計可能同時涉及多個目標人群、多個假設、多個終點或多重檢驗,故對統計分析方法的合理性有著很高的要求。如果對適應性修改沒有相應的合理有效的統計方法,則不宜采用該設計。此外,由于適應性設計的復雜性,在某些情況下沒有適用的統計推斷的理論公式,統計方法的合理性在一定程度上需要基于模擬方法進行驗證,這有可能又增加了額外的不確定性。
?適應性設計的分析需要結合來自多個階段的數據,各個階段療效估計的不一致性不僅會使基于合并數據的統計推斷變得困難,還會導致試驗結果難以解釋。另外許多適應性修改是以達到統計學陽性結果為目的,如果zui終統計檢驗結果雖為陽性但臨床獲益太小,也不足以支持所驗證的藥物療效。
(二)完整性
?適應性設計的完整性是指對試驗操作所引入偏倚的良好控制。保持試驗的完整性意味著按照預先設定的方案進行修改和保持期中分析結果的盲態,以求zui大限度地減少操作偏倚。
?避免引入操作偏倚是所有臨床試驗的zui基本要求。適應性設計由于涉及臨床試驗許多方面的修改,有可能影響后續試驗的執行,對保持試驗的完整性增加了額外的難度。因此,適應性設計的所有期中分析都應該由獨立于申辦方的適應性設計委員會或第三方專家及其獨立統計支持團隊完成,并保證期中分析的結果不為申辦方、研究者和受試者所知悉,以免影響后續試驗的執行和引入操作偏倚。在大多數情形下,如果適應性設計不是特別復雜,可由獨立數據監查委員會同時負責適應性調整的操作和執行;如果適應性設計較為復雜,申辦方可以考慮選擇具備適應性修改專業知識的專家組成獨立數據監查委員會;如果適應性設計極為復雜,而數據監查委員又無足夠的相關經驗,則有必要設置一個獨立的適應性設計委員會。根據復雜的程度,適應性設計委員會中可以包含多名統計師。因適應性修改涉及多個環節,設立一個有效的防火墻以防止期中分析結果外泄而造成可能的操作偏倚是執行中zui為重要的任務。為此,適應性設計的方案應包含一個完善的操作流程,特別是關于如何設置相關信息的訪問權限。同時,為避免不可控制因素對試驗結果的影響,還要考慮怎樣避免根據試驗所做的修改而被間接地推出期中分析的結果。應該注意的是,適應性設計委員會在所有提供給申辦方的任何修改的建議中,均不應涉及具體的期中分析結果。申辦方也要準備好所有需要的標準操作流程,并將所有涉及適應性修改的相關程序融入其中,同時記錄好所有實際操作的過程以備在申報新藥時審查。以上這些因素都應該在試驗的設計階段仔細考慮,并特別需要在試驗進行中嚴格地執行,以免影響試驗的完整性和試驗結論的可靠性。
(三)可行性
?適應性設計的可行性是指試驗的適應性修改能否在實際中實施。由于適應性設計比傳統設計更為復雜,并且實施和分析更加困難,在規劃適應性設計之前,需要考慮以下因素:適應性調整策略應該能夠保障試驗的合理性和完整性;相對于試驗周期,應該有充裕的時間根據試驗累積數據的分析結果進行適應性修改和后續試驗的執行;期中數據收集和數據清理應該可以快速完成,以便按預定計劃完成期中分析而無需中途暫停招募受試者;應該能夠快速修改隨機化程序/藥物供應系統;應該具備足夠的藥物供應管理的能力以及能夠負擔增加的藥物供應;應該提前準備好適應性設計的數據采集系統;應該保證與各相關方的溝通順暢有效;應該能夠配備專業軟件來完成復雜設計和相關分析的計算等,以滿足試驗運行中適應性修改和執行的需求。同時,在試驗設計階段,申辦方可以與研究者溝通,根據臨床考慮提出一個試驗的目標列表,評估所考慮的適應性設計在實際中能夠順利進行的可行性。如果相關適應性修改難以實施,則應該考慮其它設計。
?綜上所述,若計劃采用適應性設計,需要仔細地評估其是否確有優勢。若無法決策,可以采用模擬方法與傳統設計比較,以評估適應性設計的效率,并選出較優的設計。如果評估后適應性設計沒有體現出太多的優勢,建議謹慎考慮適應性設計。
?三、常用的適應性設計
?適應性設計是按照預先計劃,根據累積的臨床試驗數據的分析結果,在保證試驗的合理性和完整性的前提下,對臨床試驗方案進行修改。一方面,適應性修改是“按預先設定的計劃”進行的,而不是臨時提出的修改方案;另一方面,適應性修改是一個自我學習的過程,即通過對累積數據的不斷學習,相應地修改試驗方案,以適應不斷變化的研究環境。因此,適應性設計旨在更好地改進進行中的臨床試驗,而不是因設計本身缺陷而有極大可能導致臨床試驗失敗所做的臨時補救。
?適應性設計在應用中涉及范圍很廣,限于篇幅,本指導原則僅討論幾種常用的適應性設計,包括成組序貫設計、樣本量重估、兩階段無縫適應性設計、適應性富集設計、適應性主方案試驗設計、多重適應性設計。這些設計的原理和方法也適用于大多數其他適應性設計。此外,本章節中所討論的方法將會通過幾個假想的案例予以說明(見附錄2)。
(一)成組序貫設計
?成組序貫設計是指方案中預先計劃在試驗過程中進行一次或多次期中分析,依據每一次期中分析的結果做出后續試驗的決策,決策通常有四種可能:①依據優效性終止試驗;②依據無效性終止試驗;③依據安全性終止試驗;④繼續試驗。期中分析的時間可以基于日歷時間,也可基于累積數據的占比,如受試者入組比例或發生目標事件數的比例。如果期中分析至少有一次療效分析,且均有以無效性或優效性提前終止試驗的可能,則應調整每次分析的I類錯誤率,并將整體I類錯誤率控制在雙側0.05(或單側0.025)水平。調整I類錯誤率的常用方法包括Pocock方法、O'Brien & Fleming方法和Lan & DeMets方法。由于期中分析僅使用了部分數據,結果仍有較大的不確定性,評估有效性的方法應較為保守以增加結論的可靠性。無效性終止試驗的設計分為綁定邊界和非綁定邊界。綁定的無效性邊界會降低拒絕無效假設的概率,因此可以在控制整體I類錯誤的前提下,適當放寬優效性邊界,提高得到陽性結果的概率,但在期中分析結果一旦跨越無效性邊界時必須終止試驗。非綁定邊界即使在試驗結果跨越該邊界時,獨立數據監查委員會基于全面考慮后仍然可以建議試驗繼續進行。
?選擇期中分析的時間點也要仔細考慮。如果成組序貫調整計劃中存在以優效性提前終止試驗的可能,時間點的選擇應該考慮期中的數據是否充分以便能夠提供可靠的療效估計和安全性評價的結果,也包括重要的次要終點以及一些重要的亞組結果的估計。若期中分析是要驗證藥物的安全性和無效性,時間點則應該側重于如何zui大程度地保護受試者。
(二)樣本量重新估計
?樣本量重新估計是依據預先設定的期中分析計劃,利用累積的試驗數據重新計算樣本量,以保證zui終的統計檢驗能達到預先設定的目標或修改后的目標,并同時能夠控制整體I類錯誤率。
?初始樣本量的估計通常取決于效應量、主要終點的變異度、試驗隨訪時間、受試者脫落率等諸多因素,而這些常常基于以往的研究數據。多數情況下,試驗設計階段樣本量的估計所需要的參數信息往往不夠充分,可能會導致錯估樣本量。適應性設計中的樣本量重新估計為此類問題提供了有效的解決方案。
?樣本量重新估計的方法可以分為盲態方法和非盲態方法。
?盲態方法,也稱為非比較分析方法(non-comparative analysis),是指期中分析時不使用實際試驗分組的信息,或者雖然使用了實際試驗分組的信息,但未做任何涉及組間比較的分析,如在期中分析時對兩個治療組的數據合并后做的匯總分析。
?盲態方法的樣本量重新估計是指根據累積的數據,計算樣本量的重要參數(如合并方差或標準差),然后對樣本量進行重新估計,因期中分析時不涉及組間的療效比較,故一般不需要調整I類錯誤率。該方法比較容易實施,一般不會引入操作偏倚,而且相關的統計方法也較為完善,只需要在試驗設計的階段預先做好規劃。
?非盲態方法,也稱比較分析方法(comparative analysis),是指期中分析時使用了試驗分組信息(包括各組的真實名稱或可區分的分組代碼)的分析,分析內容涉及組間的比較。
?非盲態方法的樣本量重新估計是指根據累積數據以及分組信息,計算樣本量的重要參數(如每組的效應量),然后對樣本量進行重新估計,因期中分析涉及組間的療效比較,通常需要對I類錯誤率進行相應調整。
?非盲態分析的樣本量重新估計需要預先在研究方案中闡明,包括何時進行重新估計、決策時使用什么標準、重新估計時使用什么方法、如何調整檢驗水準α以便控制整體I類錯誤率、由誰執行非盲態分析,以及zui后由誰執行整個操作過程。應該特別注意,一個試驗中一般建議只做一次樣本量重新估計。當重新估計的樣本量少于初次設計的樣本量時,除非有非常特別的理由,通常不接受樣本量減少的調整。
?適應性設計中是否采用非盲態樣本量重新估計需要考慮多種因素。例如,若有比較可靠的前期數據,非盲態下樣本量重新估計是否必要?采用非盲態下樣本量重估所付的代價(如檢驗水準調整)與初始設計時略微放大樣本量相比,哪種策略更為有利?期中分析能否很快完成,是否可能因為入組較快完成而導致沒有充足時間用來調整試驗?在什么時間點進行期中分析?因此,設計應根據試驗本身的特點,仔細考慮各種因素,然后選擇出zui合適的方法。
?樣本量重新估計的方法有很多文獻可供參考,可根據具體試驗選擇一種合適的方法。
(三)兩階段無縫適應性設計
?兩階段無縫適應性設計,是指將一個試驗分為兩個階段,在第1階段結束時進行期中分析,依據預先設定的判斷標準,對第2階段的試驗進行適應性修改。無縫設計通常分為操作無縫設計和推斷無縫設計。操作無縫設計可將第一階段試驗受試者排除在主要分析之外,不需要對I類錯誤進行調整。推斷無縫設計在主要分析中包含第一階段試驗受試者,并根據自適應的性質和假設檢驗策略作出相應的調整。
?根據試驗目標和試驗終點,兩階段設計一般可分為四種類型,即同目標/同終點、同目標/不同終點、不同目標/同終點和不同目標/不同終點。任何一個兩階段無縫適應性設計都可以被適當地歸類,可根據具體試驗選擇合適的方法。
?如果試驗在兩個階段的試驗組數也相同,成組序貫設計可視為同目標/同終點試驗中的一個特例。兩階段無縫試驗中,常見的是I/II期無縫適應性設計和II/III期無縫適應性設計。前者多用于探索性試驗,在第1階段可能會探索一個生物標記,并在第2階段探索其早期有效性;后者常用于確證性試驗,在第1階段可做劑量選擇,并在第2階段驗證其有效性。
?獨立的II期試驗通常包括多個試驗組,如相同藥物的多個劑量水平,目的是選出合適的劑量并決定是否進行III期試驗。III期試驗是一個獨立于II期的試驗,其zui終分析并不包含II期試驗的數據,這種設計沒有充分地利用II期試驗的數據。推斷無縫適應性設計的zui終分析則包含了試驗的兩個階段入組的所有受試者的數據。這種設計具有很多優點,例如可以縮短通常由II期試驗結束時到III期試驗開始時的時間間隔、減少試驗的總樣本量、縮短試驗的時長、減少試驗的費用、增加zui終分析的樣本量等。同時,因第1階段入組的受試者有更長的隨訪時間,或能更早地觀察到藥物的長期安全性。
?采用無縫II/III期適應性設計需要考慮多種因素。由于期中分析時對第1階段結果可能無法進行全面深入地分析,加之選擇一個III期試驗的劑量還會涉及很多其他因素,以及適應性設計可能帶來的設計、操作和執行方面的困難,因此,如果對試驗藥物了解甚少,一般不宜選擇兩階段無縫適應性設計。還有一些情形,采用兩階段無縫適應性設計可能會有較大的風險。例如,III期試驗的主要終點需要較長的隨訪時間,第1階段或許只能夠用替代終點進行判斷,當替代終點與主要終點關聯性不高甚至較差時,用替代終點選擇III期試驗的劑量會帶來很大的不確定性。又如,在達到主要終點所需要的時間較長而入組時間又較短的情況下,為避免過多的受試者進入未選中的劑量組,需要暫停入組等待期中分析的結果,由此可能會引發出其他的問題。
?以上討論的兩階段適應性設計的方法也可以直接應用于其他類似的試驗,例如第1階段涉及不同藥物的選擇,或者聯合用藥和單藥的選擇。
(四)適應性富集設計
?以兩階段無縫適應性設計為背景,適應性富集設計(adaptive enrichment design)是指試驗第1階段結束后,根據期中分析的結果,依據預先設定的標準對目標人群進行適應性調整,以決定第2階段的目標人群。試驗的第2階段可能繼續在全人群中進行,或者僅入組亞群并有可能需要做一些對應的適應性調整,或者加大樣本量繼續入組全人群,這同時也自然地加大了亞群的入組率。試驗的zui終分析目標可能僅是全人群,或可能僅是亞群,或可能是全人群和亞群,其側重點則由α的分配比例來決定。試驗的zui終分析將包含試驗的兩個階段入組的所有受試者的數據,并有相應的調整方法以控制整體I類錯誤率。
?如果已知試驗藥物只對某特定亞群有效,那么,臨床試驗應該只在該亞群中招募受試者。但實際中更為常見的情形是試驗藥物有可能對某亞群有較大的療效,但不清楚對全人群是否也有足夠大的療效。在這種情況下,如果試驗藥物對全人群有足夠大的療效,只入組亞群受試者就會失去顯示對全人群有效的機會;如果試驗藥物對全人群療效較小但對某亞群有效,入組全人群受試者極有可能得不到預期的陽性結果,同時也失去了顯示對亞群有效的機會。采用兩階段無縫適應性設計來選擇目標人群,利用試驗本身的結果以便可以更科學地選擇出目標人群,增加藥物研發的成功率。
?因為適應性設計中目標人群的選擇涉及全人群和亞群,如果第1階段的期中分析采用非盲態下的組間比較,應明確定義兩個人群的統計假設和相應的統計方法,以控制整體I類錯誤率。
?對于目標人群的選擇標準,可以基于疾病特征、預后生物標志物或預測生物標志物等各種標準。一般而言,采用公認的疾病相關特征或預后相關生物標志物來選定目標人群,試驗的設計和操作會相對簡單。目前,采用預測生物標志物來選擇目標人群的研究日趨增多,但許多預測生物標志物的臨床價值尚不明確。如果試驗要用一個全新的預測生物標志物來選擇目標人群,必須要有對應的診斷方法。所用診斷方法必須已經被監管部門批準上市,如果沒有,可能需要同時研發。如果試驗數據zui終不支持所研發的體外診斷試劑(未能獲得器械監管部門批準上市申請),會直接導致試驗中關于試驗藥物的結論也不可靠。此外,如果需要同時研發伴隨治療的體外診斷試劑尚未確定亞群界定的閾值,若使用部分前期入組的受試者來確定閾值,這些受試者應該從zui終的分析數據集中剔除,以免zui終的陽性結果難以解釋。為更好的理解生物標志物預測的準確性和全面評估試驗的結果,通常鼓勵將非目標人群的信息也納入研究。
?在未能充分了解亞群中藥物效應的情況下,決定是否采用適應性設計選擇目標人群較為困難,同時也有較大的風險。如果無視有療效的目標亞群,在全人群中可能得不到陽性結果,或者即使在全人群中得到了陽性結果,但在非目標亞群患者中實際無效,從而導致倫理問題。另一方面,如果實際有療效的目標人群為全人群和若干亞群,而通過試驗僅僅選擇出了其中的一個亞群,導致有效的藥物得不到充分地利用。
(五)適應性主方案試驗設計
?主方案試驗設計是指一個整體臨床試驗方案含有多個子方案,不同的子方案可同時檢驗一種藥物對于多種疾病的臨床效果,也可同時檢驗多種藥物對于一種疾病的臨床效果,或者同時檢驗多種藥物對于多種疾病的臨床效果。每一個子方案可以是單臂試驗,也可以是隨機對照試驗。如果子方案都是隨機對照試驗,各個子方案有可能共用一個對照組,也可能有各自的對照組。主方案試驗也用來泛指由患者特定特征(如疾病、組織學類型、分子標記物)為標志的臨床試驗。主方案試驗具有很多優點,例如能夠為患者提供zui大的入組機會并選擇zui合適的受試藥物的機會。常見的主方案設計包括籃式試驗、傘式試驗和平臺試驗。
?適應性主方案設計是指在主方案設計中包含了一種或多種適應性調整的設計,它可以靈活地采用多種適應性調整,例如添加一個或多個新的子方案,提前結束一個或多個子方案,重新估計樣本量,調整檢驗的假設、主要終點和主要統計方法,或對不同的子方案設計做不同的適應性調整。
?主方案試驗需要統一管理,設有統一管理機構,如機構審查委員會、獨立數據監查委員會、獨立審查委員會。實施時需要采用中央隨機化系統、電子數據采集系統、中央標本庫和實驗室,使用統一設計的病例報告表、知情同意書和臨床監查人員等。
?籃式設計旨在評估一種藥物治療具有同一種生物學特征的不同疾病類型的臨床效果,該設計在一個整體臨床試驗方案中含有多個子方案,通常每一個子方案都是一個單臂試驗,而每一個子方案都針對一種或多種疾病類型。在腫瘤學領域,有時使用腫瘤組織學進行傳統的試驗非常困難或很難實現,而基因測序和全基因組分析已經實現了詳細的分子生物學分類,籃式試驗就是為了適應這一新的分類變化提出的。
?傘式設計旨在評估多種藥物針對同一種疾病或生物標記物類型的靶向治療的臨床效果,該設計在一個整體臨床試驗方案中含有多個子方案,每一個子方案針對一種或多種藥物,可能是單臂試驗或隨機對照試驗。傘式試驗常用來為確證性研究選擇候選藥物,也可用來作為確證性研究。
?平臺設計旨在評估多種治療針對多種疾病的臨床療效,該設計在一個整體臨床試驗方案中包含有多個子方案,每一個子方案都是一個隨機對照試驗,一般會采用同一個對照組。平臺試驗通常會維持試驗長期進行,并允許新的試驗藥物隨時加入試驗平臺,同時,對照藥物隨著時間推移也可能變更。
?主方案試驗雖然具有很多優點,但由于其復雜性,在計劃、執行、統一管理結構的建立、尤其是統計分析等方面都面臨著較大地挑戰。如果計劃采用主方案試驗,應在試驗各個方面可能涉及的各種問題做全面、深入和細致的研究后,再慎重選擇。
(六)多重適應性設計
?多重適應性設計是指一個試驗中采用兩種或兩種以上適應性調整方法的試驗設計。以上所討論的適應性設計方法都可以同時用于同一個臨床試驗。例如,一個臨床試驗在第1階段結束時確定了下階段的用藥劑量,其后需要做樣本量重新估計,再其后需要選擇目標人群。
?原則上講,如果一個臨床試驗設計包含了多種適應性調整,只要符合合理性、完整性和可行性的要求,多重適應性設計都可以考慮。由于多重適應性設計的復雜性,建議慎重地考慮一個試驗中是否的確有必要引入過多的適應性調整。
?四、適應性設計的其他考慮
(一)貝葉斯方法的應用
?貝葉斯適應性設計是指一個使用了貝葉斯方法并同時含有適應性調整的試驗設計。貝葉斯方法是一類統計方法,它根據貝葉斯原理將一個分布函數(先驗分布)總結的前期試驗的信息/數據和目前試驗中得到的數據結合在一起,從而得到一個用來總結這些信息/數據的新的分布函數(后驗分布),并基于此后驗分布函數做出統計推斷的方法。前期試驗的信息/數據可以基于目前試驗中將要檢驗的藥物,也可以基于其他相關的藥物。
?在臨床試驗中,首要任務是要得到一個準確和可靠的藥物療效估計。有時可以用一個先驗分布來總結前期試驗的信息/數據得到一個藥物療效的初始估計。因為前期試驗的信息/數據不夠充分或有其他的不確定性,其本身不能夠得到一個準確和可靠的療效估計,需要在目前的試驗中收集更多的數據。根據新收集的數據,對療效的初始估計(先驗分布)進行更新并得到一個新的估計(后驗分布)。用貝葉斯方法得出的療效估計常可視為前期試驗的信息/數據和目前試驗的數據以某種特定方式而做出的加權平均,即如果沒有目前試驗的數據,療效估計就會全部基于前期試驗的信息/數據;如果有目前試驗的數據,療效估計就是一個加權平均。目前試驗的數據的權重會隨著其數據量的增加而加大,并向1趨近。
?本指導原則中討論的使用基于頻率理論的適應性設計大都可用于貝葉斯適應性設計。由于貝葉斯方法在統計推斷中使用了前期或相關的信息/數據,在某些方面它自然有其優越性。貝葉斯方法的靈活性是可用一些統計模型來借用相關的數據。在很多情形下,獨自進行一個達到合適樣本量的臨床試驗會比較困難,若用貝葉斯方法來借用相關的數據從而得到更為可信的結論或許有其必要性。例如,兒童的臨床試驗中借用成人臨床試驗中的數據;在罕見病中由于無法入組足夠多的病人而借用類似的疾病適應癥的數據;在某一區域沒有入組足夠的病人而借用相鄰區域的數據;在一個非劣性臨床試驗中借用過去試驗中的數據從而減少對照組的病例數。貝葉斯方法對這些借用都會給出定量的分析和解釋。
?盡管貝葉斯方法在某些方面具有優越性,其zui大的問題是統計推斷的結果有不確定性。使用同樣的前期試驗的信息/數據和目前試驗的數據,若選擇不同的先驗分布或者即便選擇相同的先驗分布而使用不同的參數值,貝葉斯推斷也可能得出不同的結論。另外貝葉斯方法在zui終的統計推斷時也無公認的方法來選擇決策標準。因為這些問題,目前貝葉斯方法更多地用于Ⅰ期臨床試驗中藥物劑量的探索,Ⅱ期臨床試驗中用于選擇后續研發策略,Ⅲ期臨床試驗中的期中分析時的無效性推斷和一些預測分析,以及其他很多不以注冊為目的的分析。
?由于適應性設計的復雜性以及基于頻率理論的統計方法的局限性,盡管貝葉斯方法有其不足,在一些設計中使用貝葉斯方法或許是一種更為合適的選擇。如果使用貝葉斯方法,需要有足夠的前期信息/數據、文獻和研究以支持所使用的統計模型的合理性,包括所選擇的先驗分布及各個參數值。另外由于貝葉斯推斷基于先驗分布和參數值的選擇而導致的不確定性,還需要通過大量模擬結果來說明在各種假想的,有可能在實際中發生的情形下方案的實施特性,特別是要通過模擬顯示試驗中基于后驗概率所定義的決策標準是否合理,例如可用對應于基于頻率理論的統計方法的整體I類錯誤率來衡量所選擇的決策標準。再者,還要考慮使用貝葉斯方法在實際中的可行性,例如如何向研究者解釋各種統計模型的意義,基于后驗概率所定義的決策標準的意義,藥物療效估計的解釋,基于不等應答適應性概率的隨機分組是否給受試者帶來額外的安全性風險,以及更新應答適應性概率所帶來的延遲是否會使入組的實際操作變得極其困難等問題。這里的應答適應性概率是指根據已入組的病人的數據計算出的各個試驗組的療效,并以此概率來重新更新未來病人的隨機入組的比例。
?鑒于貝葉斯方法中面臨的許多挑戰,若采用貝葉斯方法,需要仔細和慎重考慮以上所討論的各種問題,事先做好研究和規劃。
(二)模擬方法的應用
?基于模擬方法的適應性設計是指在適應性試驗中,基于模擬方法考察所做統計推斷的合理性。在臨床試驗中,統計檢驗是在統計假設下基于某個分布理論或近似的正態分布理論而做出的統計推斷。這些分布理論或近似的正態分布理論所要求的條件在傳統的臨床試驗中一般都會得到滿足。為了適應藥物研發的需求,許多新穎、復雜的試驗設計不斷出現,例如主方案試驗同時涉及多個目標人群、多個假設、多個終點或多重檢驗,這對推導統計檢驗的分布理論提出了新的挑戰。在很多極其復雜的試驗中,基于分布理論的條件有可能不再滿足,因此借助模擬方法來建立統計推斷所需要的依據經常是唯yi的選擇。
?統計模擬試驗的zui大優點是在假設的臨床試驗情形下能更好地了解試驗特性。具體到臨床試驗的模擬,重要的是,怎樣選擇模擬的模型和參數使其盡可能合理地描述試驗在實際中發生的情形,并能夠控制整體I類錯誤率。因為有很多關于統計模擬的文獻可供參考,其涉及的模擬方法、計算機語言、模擬軟件、模擬誤差的控制等諸多計算細節就不在此一一討論。
?若無明確的分布理論依據,通過模擬方法來證明臨床試驗中統計檢驗的整體I類錯誤率能在零假設下完全得到控制從理論上來說是不可能的。整體I類錯誤率涉及整個零假設空間,即假設試驗和對照藥物療效相同,這從理論上來說有無窮的可能性,故任何一個模擬都無法窮舉所有的情形以便驗證。怎樣在模擬中排除一些明顯不合理的情形使其更符合實際,則需要從疾病特征和歷史數據來考慮,并使基于縮小的零假設空間的模擬結果從統計角度仍具有可靠性。另外在模擬時,除了考慮怎樣選擇主要參數外,還要考慮滋擾參數、入組率、脫落率/刪失率、隨訪時間和模擬的準確率等諸多其他因素。在選擇這些參數后,再加入適應性設計中涉及的各種修改,以及有可能涉及的多個目標人群、多個終點和多重檢驗,以便顯示所提出的統計方法在臨床試驗中經過多重調整后的I類錯誤率仍可得到控制。
?鑒于基于模擬方法的統計推斷具有不確定性,除非應用的適應性設計非常有必要,并且比傳統的臨床試驗確有很大的優勢,否則需要綜合各個方面的因素再進行慎重地選擇。如果有充足的醫學文獻、前期的數據等證據顯示應用適應性設計具有必要性,并且可靠的模擬方法、模擬結果顯示適應性設計確實具有很大的優越性,則可以考慮一個基于模擬方法的適應性設計。
?五、監管的考慮
?鑒于適應性設計的復雜性,申辦方應在設計試驗時及早與監管部門溝通,以便爭取更多的時間用來完善方案。
(一)與監管部門的溝通
?對于以探索性研究為目的的適應性設計,不一定需要與監管部門溝通交流。但是,若試驗有可能影響很多受試者的安全性,如病例數較大的主方案試驗;或試驗的早期以探索性研究為目的,但晚期有可能演化成以確證性研究為目的,則有必要與監管部門進行溝通交流。通常以確證性研究為目的的適應性設計都應與監管部門提前進行溝通交流,以便在設計早期有充分的時間考慮監管部門的建議、顧慮或意見,尤其是對于復雜或采用了全新方法的設計。凡經備案的與監管部門達成的一致意見應反映在修訂的試驗方案中。
(二)對申報資料的要求
?申辦方準備遞交的資料應包含所有用來支持采用適應性設計的理論、文獻和數據以便監管部門審評。資料的準備應主要圍繞預先設定的調整計劃,充分論述醫學意義、合理性、完整性和可行性。
?醫學意義是判斷采用適應性設計是否合適的重要因素。申報資料中應包含用來支持調整后試驗結果仍然具有醫學意義的充分證據。比如,在經過一次或多次調整后,對試驗結果的解釋有可能變得非常困難,或者試驗結果zui終達到統計學陽性但無醫學意義。
?合理性主要針對的是統計方法,zui重要的判斷標準是所使用的統計方法能否將整體I類錯誤率控制在雙側0.05(或單側0.025)的水平。申報資料中應包括預先設定的調整計劃,所有調整的程序和細節,以及所引用的全部文獻。如果適應性設計極為復雜且無具體的理論公式,可能需要通過模擬方法來說明。申辦方在計劃時需要考慮模擬結果能否經過第三方獨立的驗證。
?完整性考慮的是試驗的操作和執行,判斷標準是所使用的設計不會因操作或執行引入偏倚。申報資料中應包含所有操作流程,特別是怎樣設定防火墻以保證分析結果不被泄露。對于數據監查委員會負責的適應性調整,可參考其他相關的指導原則。
?可行性旨在評估試驗可能要做的適應性修改能否在實際中實施,這一點需要申辦方做出綜合判斷。
?以上只是申報資料應該包含的基本內容。如果申辦方認為還有其它資料有助于與監管部門的溝通交流,也可一并申報遞交。
(三)其他的考慮
?原則上,適應性設計中的修改計劃必須在臨床試驗開始前的試驗方案和統計分析計劃中預先設定。一般來說不建議對試驗進行非預先設定的修改。但在臨床試驗的操作實踐中,基于本試驗中的數據提示需要對試驗進行非預先設定的修改,此時應經過謹慎考慮后在保證不破壞試驗的合理性、完整性及可行性的前提下對試驗做出合理的修改,并需提前與監管機構進行溝通確認。此外,基于外部數據對于一個進行中的臨床試驗做出某些修改,并不屬于適應性修改,而是通過試驗方案的修正案來體現,通常需與監管部門進行溝通。根據外部數據對試驗方案進行修改的情形有很多,例如,某試驗中對標志物為陰性的病人藥物毒性太大或者同一類藥物剛完成的試驗顯示僅對標志物為陽性的病人有效,需要修改目標人群僅為陽性病人;同一類藥物剛完成的試驗顯示某主要終點的選擇不合適,或新發布的相應指南對主要終點另有定義,需要修改主要終點;新的標準治療的改變,需要修改標準治療的對照組,或因無法繼續入組病人而需要提前終止試驗。申辦方尤其要注意這些修改是僅基于外部數據,而非基于進行中的試驗本身的結果。
?參考文獻
1.CDE. 臨床試驗數據監查委員會的建立和實施指導原則. 2020
2.Bauer P, K?hne K. Evaluation of experiments with adaptive interim analyses. Biometrics1994; 50:1029–1041, correctioninBiometrics1996; 52:380.
3.Bauer P,Kieser M. Combining different phases in the development of medical treatments within a single trial. Statistics in Medicine 1999; 18: 1833-1848.
4.Bauer P,Posch M. Letter to the Editor. Modification of the sample size and the schedule of interim analyses in survival trials based on data inspections by H. Schaefer and H.-H. Mueller, Statistics in Medicine 2001; 20: 3741–3751. Statistics in Medicine 2004; 23: 1333–1335.
5.Chang M. Adaptive design method based on sum of p-values. Statistics in Medicine 2007; 26:2772–2784.
6.Chen C, Li X, Li W, Beckman RA. Adaptive Expansion of Biomarker Populations in Phase 3 Clinical Trials. Contemporary Clinical Trials2018;71:18-85.
7.ChenJYH, DeMets DL, Lan GKK. Increasing the sample size when the unblinded interim results is promising. Statistics in Medicine 2004; 23:1023-1038.
8.ChowSC, Chang M. Adaptive Design Methods in Clinical Trials. CRC Press;2nd edition 2011.
9.Chow SC, Shao J, Wang H, Locknygina Y. Sample size calculations in clinical research. Chapman & Hall/CRC, 3rd edition2018.
10.Cui L, Hung HMJ, Wang SJ. Modification of sample size in group sequential clinical trials. Biometrics 1999; 55:853-857.
11.EMA Scientific Guidelines: Reflection paper on methodological issues in confirmatory clinical trials planned with an adaptive design. https://www.ema.europa.eu/en/human-regulatory/research-development/scientific-guidelines;2007.
12.FDA Draft Guidance for Industry. Adaptive Designs for clinical trials of drugs and biologics. https://www.fda.gov/drugs/guidances-drugs/all-guidances-drugs2018.
13.Friede T, Kieser M. Sample size recalculation in internal pilot study designs: a review. Biometrical Journal2006;48:537–555.
14.Friede T, Parsons N, Stallard N. A conditional error function approach for subgroup selection in adaptive clinical trials.Statistics in Medicine2012; 31:4309–4320.
15.Friede T, Stallard Nigel. A comparison of methods for adaptive treatment selection. Biometrical Journal 2008;50:767–781.
16.Gould AL. Interim analyses for monitoring clinical trials that do not materially affect the Type I error rate. Statistics in Medicine 1992; 14:1039-1051.
17.HochbergY. A sharper Bonferroni procedure for multiple tests of significance. Biometrika1988; 75: 800–802.
18.Jenkins M, Stone A, Jennison C. An adaptive seamless phase II/III design for oncology trials with subpopulation selection using correlated survival endpoints. Pharmaceutical Statistics 2011; 10:347–356.
19.Lan KG,DeMetsDL.Discrete Sequential Boundaries for Clinical Trials. Biometrika1983; 70:659–663.
20.Lehmacher W, Wassmer G. Adaptive sample size calculations in group sequential trials. Biometrics 1999; 55: 1286–1290.
21.Maca J, Bhattacharya S, Dragalin S. et al.Adaptive Seamless Phase II/III Designs Background, Operational Aspects, and Examples. Drug Information Journal 2006; 40: 463-474.
22.Marcus R, Peritz E, Gabriel KR. On closed testing procedures with special reference to ordered analysis of variance.Biometrika1976; 63:655–660.
23.Müller HH, Sch?fer H. Adaptive group sequential designs for clinical trials: Combining the advantages of adaptive andof classical group sequential approaches. Biometrics2001; 57:886–891.
24.Müller HH, Sch?fer H. A general statistical principle for changing a design any time during the course of a trial. Statistics in Medicine2004; 23:2497–2508.
25.O’Brien PC, Fleming TR. A Multiple Testing Procedure for Clinical Trials.Biometrics 1979; 549–556.
26.Pocock SJ, Group Sequential Methods in the Design and Analysis of Clinical Trials. Biometrika 1977; 64:191–199.
27.Proschan MA, Hunsberger SA. Designed extension of studies based on conditional power. Biometrics 1995; 51:1315–1324.
