当前位置: 主页 > 日常养生 > 正文

两阶段生物等效性研究的试验设计及关注要点养生咨询网—中医养生养生保健食疗养生养生之道最好的养生网站提供生活小常识

时间:2021-10-13 来源:榨菜菜谱网 阅读:185次

  两阶段生物等效性研究目已得到多个国生物等效性指南的认,实施两阶段生物等效性研究时在控制I类错误的基础上保证目标把握度是很大的挑战。对目国外文献发表的两阶段设计生物等效性研究方法加以综述,详细了文献方法的研究策略、检验水准的校正方法、样本量再估算等,为国药品申办者在开展两阶段生物等效性研究提供参考。

  [关键词] 生物等效性;两阶段设计;适应性设计;样本含量再评估;把握度;检验水准

  在生物等效性研究中,样本量是非常关键的因素,生物等效性试验样本量估算取决于检验水准(α)、检验效能(1−β)、关键药动学参(AUC、Cmax)的个体内变异系(within-subject coeIIicient oI vaULation,CV)、试验制剂和参比制剂待评价药动学参数指标的实际差异(T/R)和设定的等效界值。但由于个体内变异及参比制剂与受试制剂间差异的真值往往在试验前不可知,在实施中,有可能由于对其错误的估计,造成纳入的样本例数过少或过多。样本例数过少,检验效能不足,犯II类错误的可能性加大,可能将等效的制剂误判为不等效,增加申办者的险;而样本例数过多,会研究成本增加,纳入过多的受试者暴露于试验药物也不符合伦理原则。如何兼顾统计效率与经济效益的矛盾双方,无论在理论上实践中都有意义。

  两阶段设计(twl-stage design,TSD)生物等效性研究由于其在样本量估算方面的适应性、灵活性,近年来已被各国指南所认可(IDA、EMA、加拿大、澳大利亚、日本、新西兰、WHO等)。虽然在2015年版《中国药典》9011药物制剂人体生物利用度和生物等效性试验指导原则中明确指出:“在证明生物等效性时,可以接受两阶段试验方法,最初受试者给药并分析数据,如果不能证明生物等效,则可以增加招募受试者,在最终分析中合并两组的结果”,但具体如何实施在指南中没有明确规定。本文将综述国内外关文献,对两阶段设计生物等效性研究的设计、决策树、中期分析、样本量再估算、检验水准的校正方法、结果判定等做详细介绍,为两阶段生物等效性研究提供可采纳的方法,以促进国内新药临床试验的发展。

  在以药动学参数为终点评价指标的生物等效性试验中,一般采用双周期、双交叉的设计方法,根据选定的药动学参数和预设的接受限,对两者的平均生物等效性做出判定。血药浓度-时间曲线下面积(AUC)反映暴露的程度,峰浓度(Cmax)和达峰时间(Tmax)是受到吸收速度影响的参数。当关键药动学参数(AUC、Cmax)的几何均数比(geometULc mean ratio,GMR)的90%可信区间(CI)落在预设的接受范围内时(通常为80.00%~125.00%),则被认为生物等效。在进行两周期双交叉平均生物等效性评价时,推荐的统计方法为:对关键药动学参数(AUC、Cmax)进行对数转换后,采用多因素方差分析,考虑可以合理假定对相应变量有影响的方差来源,如序列、序列内受试者、周期和制剂,得到误差的均方(MS),带入公式,来计算关键药动学参数(AUC、Cmax)的几何均数比的CI值。

  其中μT、μR分别代表受试制剂与参比制剂关键药动学参数的均数(经对数转换后),Se为标准误,s为MS的平方根,来自方差分析。公式中可以,当s,说明研究药物个体内变异,CV与s满足以下关系式:CV=ZxexpEsOI−Nz1/2,即使GMR接近于1(μT−μR接近于零),当样本例数(n)不够时,其GMR的90%CI亦有可能超出预设的等效范围,特别对于高癫痫病能有效治疗吗变异药物(CV>30%)的生物等效性判定时,失败的有可能是由于样本例数不够,把握低,而将本为等效的两制剂误判为不等效。采用经典的单阶段固定样本量的生物等效性设计往往会出现上述问题,失败,过去只能重新组织更大规模的生物等效性研究,造成人力物力资源的浪费。因早在上世纪90年代,即有国内外学者提出可以在生物等效性研究中沿用随机对照临床研究(random control tULal,RCT)中的适应性设计的思路,在生物等效性研究中提出成组序贯设计(group sequential design)、追加样本设计(add-on design)等,其中两阶段研究是成组序贯研究的特例,与以疗效指标为评价指标的RCT研究相比,由于以药动学参数为终点评价指标的生物等效性研究的规模较小,两阶段研究比较适用。

  两阶段设计是将生物等效性研究分成两个阶段,当第一阶段实验完成后进行期中分析(inteULm analysis),如零假设则可提前得出有效结论结束试验,否则进入下一阶段试验,重新评估样本量,招募第二阶段的受试者进行研究。一般来说,由实际试验数据估算的样本含量往往要比不确切信息下估算的更加准确,因此,根据期中分析的结果对样本含量进行调整,可以保证试验达到预定的把握度。另外对于不能无效假设的,也可提前结束以避免不必要的浪费,提高试验效率,更加符合伦理学的要求。但由于研究分为两个阶段,有可能使得检验水准增加(α inIlation),增加发生I类错误的概率(type I error,TIE),因此,有学者针对在两阶段设计中如何控制TIE进行了专门的研究。

  目前两阶段生物等效性研究已在国家与地区生物等效性指南中得到认可。2015版《中国药典》的9011指南也明确指出两阶段设计可以被接受。各国指南均要求调整后的显著性水平应在方案中预规定,指南还对实施过程提出了一些建议,如日本指南中就提出第二阶段招募的受试者例数(n?)应于第一阶段受试者例数的1/2(n?≥=n?/2)。欧盟、WHO、中国指南中要求在分析两阶段合并的数据时,在方差分析模型中应括阶段项。加拿大指南中对两阶段设计中显著性水平调整方法给出建议,推荐采用Pocock α消耗函数方法,两阶段调整后的名义检验水准α’(nominalalpha)均采用0.0294。

  根据假设检验数据统计的原理,重复检验若不对检验水准进行调整,会造成TIE的增大。重复实施k次假设检验,每次的检验水准α均为0.05,最终TIE可用下述公式估计:1-(--α)k。在实施两阶段生物等效性研究时,若不对两阶段α进行调整,TIE可能上升为9.75%,如果不对累积TIE进行控制,可能会使不等效的药物获得上市许可,增加患者风险。因此,在设计两阶段生物等效性时,对累积TIE进行控制。在生物等效性研究中控制累积TIE有以下6种方法。

  BonIerroni校正法其每阶段的名义检验水准调整为:α/k,k为阶段数,当采用两阶段设计时,第一阶段与第二阶段的α调整为0.025,则总的TIE基本可被控制在5%以下。BonIerroni校正法在控制TIE方面相对保守,每阶段的置信区间调整为95%(CI=1-2α’),纳入的总的样本量一般比固定样本设计的样本量要大。目前认为本法应用于生物等效性研究时由于样本例数要求较大,不符合伦理原则,一般不被推荐。

  Pocock消耗函数的公式为:α(t)=αln[1+(e-1)t],t为试验时间,采用Pocock校正法,各阶段名义检验水准基本相等,当采用两阶段设计时,每阶段的名义检验河南癫痫病医院靠谱吗水准(α’)调整为0.0294,在加拿大的生物等效性指南中推荐采用本校正方法,在欧盟的指南中亦参考本方法,认为在第一阶段与第二阶段均采用94.12%(CI=1-2α’)的置信区间可被接受。

  但Pocock校正法是基于平行组优效性假设检验的序贯设计的,数据一般要求已知变异度并符合正态分布,中期分析的时间点要求是在N/2(N为总的样本量)处。生物等效性一般为交叉设计,其药动学参数需进行对数转换后才符合正态分布,在试验前个体内的变异度为未知,进行中期分析的时间点并不一定在N/2时,因此,生物等效性研究不符合上述Pocock校正法应前提条件,在两阶段样本量不同的情况下,仍采用相同的名义检验水准理论依据不充分,可能会造成TIE的增加,需要采用蒙特卡罗拟合的方法对试验结果的TIE进行验证,模拟过程可由统计软件(如C、R、SAS等)实现。

  Potvin曾提出了4种(方法A、B、C、D)双交叉生物等效性研究的两阶段适应性设计方案,针对不同T/R的估计值与个体内变异的案例进行了模拟。方法A由于未对α进行调整,会造成TIE增大,不被推荐。而方法B、C、D的研究路径见图1和2,Potvin团队认为在受试制剂与参比制剂T/R=0.90时应用方法B、C,在T/R=0.90时应用方法D,均可以在控制TIE的前提下保证把握度。

  根据对第一阶段数据分析时α是否固定,可将适应性两阶段设计主要分成两种类型,类型I为无论中期分析时的结论是中止研究(不拒绝无效假设),还是继续进入至第二阶段,在两阶段均采用同一调整后的名义检验水准;类型II为根据中期分析的把握度,对第一阶段数据进行统计分析时,先采用α=0.05,根据计算得到的置信区间与把握度判断是否等效后再决定是否需要对α进行调整。这两种类型的设计方法的决策树示意图见图1、2。

  类型I的设计方案主要是以Pocock校正法为基础,Potvin提出的方法B即属于此类,两阶段的名义检验水准均调整为0.0294;而类型II的设计方案是基于传统的生物等效性理论,在未进入第二阶段前(此时α并未被消耗,仍可采用α=0.05)来进行生物等效性的判定。若决定继续第二阶段的研究,再对两阶段的α进行调整,Potvin设计的方法C与方法D均属此类,方法C与方法D研究路径一致,只是名义检验水准不同,在方法C中αadj调整为0.0294,而方法D中αadj调整为0.0280,适用于不同的T/R估计值。

  Potvin提出的两阶段适应性设计是目前两阶段生物等效性研究的基础,后来的学者基本是在他的方法基础上加以改良。

  对于试验前对个体内变异度估计不足,而根据第一阶段数据得出的实际CV较大时,往往在第一阶段纳入的样本量n?N,这种情况下,需要在第二阶段纳入较多的受试者才能保证把握度,此时又可能造成TIE的增加,有必要引入无效规则的概念(futility rule)。Fuglsang在Potvin方法C的基础上提出了方法E,对总样本例数设置了无效规则,定义总样本量的上限,规定Nmax为2n?、3n?、4n?或直接控制其例数,如规定Nmax≤60或Nmax≤80等,当通过中期分析时计算得到的总样本例数超出样本量上限时,试验终止,不再往下进行。此外方法E要求无论第一阶段的数据结果,人为强制规定都必须进入到第二阶段,还在方案中对第二阶段纳入的受试者数目最小值的限制规定为N?min=n?/2。决策树示意图见图P。值得注意的是,对受试者例数上限进行控制可脑瘫癫痫病发作的表现能会减小研究的把握度。

  Fuglsang认为与Potvin提出方法C相比较,对于高变异低初始样本量的研究来说,方法E所纳入的总受试者例数较少,更加符合伦理学的要求。此后,Fuglsang还把两阶段设计推广至平行设计生物等效性研究。

  Potvin提出的两阶段设计,在期中分析进行把握度计算,所应用的T/R采用的是假设值(一般假设为0.90或0.95),Fuglsang提出的方法E,在期中分析时也是以T/R为0.95的假设进行运算。Potvin未设计无效规则,而Fuglsang提出的方法E中的无效规则中针对样本总量,未对第一阶段GMR的点估计值(point estimate)提出要求。对此,Karalis设置了下列无效规则:若第一阶段的GMR超出接受范围(0.80~1.25),则终止研究;设置样本量上限(upper sample size limit,UL),若经中期分析,n?+n?>UL,试验终止,不再往下进行。Karalis等在Potvin方法的基础上提出两种总样本量控制的适应性两周期设计STD-1与STD-2,与之前不同的是,Karalis的方法在中期分析做样本量再估计采用的是第一阶段的GMR(而T/R的估计值)。Karalis认为有样本总量的限制,可以控制TIE的上升,UL设置得越低,结果越保守,Karalis在STD-1中名义检验水准设置为0.028 0,STD-2中名义检验水准设置为0.029 4,在其论文中模拟了UL=62与UL=150两种情况,没有发现TIE的明显上升。STD-1与STD-2两种方法的决策树示意图见图4、5。

  大多文献在数据模拟时,把80%作为目标把握度,在Fuglsang2013年的论文中,针对有申办者出于商业的考虑,希望将把握度增大至90%时,提出了名义检验水准的调整方案,以90%为目标把握度,采用Potvin方法B(假设T/R=0.95),αadj调整至0.028 4,采用Potvin方法C(假设T/R=0.95),αadj调整至0.027 4,用Potvin方法D(假设T/R=0.90),αadj调整至0.026 9,可将总的TIE控制在5%以下。

  在传统的固定样本生物等效性研究正式开展前,往往会先进行预试验,预试验的主要目的是考查采血时间点是否合理、了解体内浓度分布范围、评估两周期给药间的清洗时长及分析生物样本分析方法的可行性,也有申办者通过组织预试验来估计T/R差异以及药动学参数个体内变异情况。预试验一般不作假设检验,其结果不进行等效性的判定,且预试验的数据不可与正式研究数据合并。预试验与正式研究的临床研究中心、监护项目、入试者入排标准、采血点、清洗期、生物样本分析方法等允许不相同。而两阶段生物等效性中的第一阶段与第二阶段都属于正式研究,两阶段的试验应按同一方案执行,在同一临床研究中心实施,两阶段的药物批号、临床研究条件和生物样本分析方法均应保持完全一致。

  要求在开展前对两阶段生物等效性研究前做出详细的研究方案,明确两阶段生物等效性研究的方法类型、名义检验水准的调整方法、第一阶段的样本例数和中期分析样本再评估的策略。推荐根据试验药物的变异度、预估的T/R以及可能的脱落率来设计第一阶段样本量,双交叉生物等效性研究的样本量可用下面的公式来估计:

  公式中,ne代表估计的样本量;v代表生物等效限(以对数值表示),δ代表试验制剂与参比制剂的差南昌哪家医院治疗癫痫病好异(对数转换后),只有CV值在被低估把握度不足才进入到第二阶段。种认为既然进行两阶段生物等效性研究,而将第一阶段样本例数设置得较低的做法不被鼓励。第一阶段的例数过少,有可能会造成总的样本量增加。

  在实施两阶段生物等效性研究时,对第一阶段数据的中期分析非常关键,需要统计第一阶段结果的GMR,并根据第一阶段方差分析的误差均方(s²)来计算出CV(CV=[exp(s²)-1]1/2),按方案规定的决策树方法对总样本例数进行再评估。根据申办者对把握度的期望值、研究的成本预算、研究药物的CV估计等来综合考虑是否设置UL及其数值。

  采用单阶段固定样本量两周期双交叉生物等效性设计时,在对关键药动学参数(AUC、Cmax对数转换后)进行多因素方差分析(ANOVA)的因素项一般包括:序列、嵌套在序列间的个体、周期、制剂,而在进行两阶段生物等效性研究中由于增加了阶段项这一误差来源,在欧盟指南、中国药典9011指南中要求在进行多因素方差分析时加入阶段项,在欧盟PKWP问答中推荐在ANOVA模型中将阶段、序列、序列×阶段、个体(序列×阶段)、周期(阶段)、制剂作为因素来源进行分析,而制剂×阶段的交互作用没有实际意义,不适用于两阶段生物等效性研究。另外也有文献认为虽然欧盟药典专门提出了序列×阶段的因素项,但在实际应用中大都无意义。应注意采取措施保证两阶段研究的受试者人群、入排标准、研究实施方案、生物样本分析方法一致,以减小阶段间差异对结果的影响。由于序列与阶段均属于个体间效应,无论是否纳入方差分析因素,方差分析的残差(residual error)结果不受影响,不会影响最终等效性判定时CI的计算。

  鼓励申办者在试验完成后对研究的TIE及把握度进行验算,前文中介绍的Potvin、Karalis、Fuglsang等作者发表的论文方法已采用蒙特卡罗拟合法对试验结果进行了验证,能在控制TIE的基础上保证目标把握度,申办者在实施时可直接引用,但需注意引用的前提是变异度和T/R估计值不能超过文献验证时预设的范围。

  良好设计的生物等效性研究应符合伦理与学两大原则,尽量减少纳入的受试者例数。新西兰的指南中指出:在生物等效性研究中纳入不超过40名受试者是比较合适的。对于高变异的药物来说,申办者应综合伦理与学的原则采用合适的研究方法:如参比制剂校正的平均生物等效性(reference-scaled average bioequivalence,RSABE),或是同位素标记制剂的方法,这两种方法所介绍需样本量相对较少,更符合伦理的原则。对于高变异的药物来说,若采用两阶段生物等效性,设计中建议尽量引入总量控制。

  本文从统计分析角度综述了国外关于两阶段生物等效性研究的相关指南和文献,并阐述了实施两阶段生物等效性的注意事项。生物等效性试验是新药研发过程中评价药品和桥接安全性、有效性数据的重要手段。生物等效性试验评价中样本量的估计是一个比较复杂的问题,特别对于高变异的药物。两阶段生物等效性研究由于其在样本量估算方面的适应性、灵活性,近年来已被各国指南所认可,但关于具体的两阶段生物等效性方法药监部门没有相应的评价细则,如何在进行两阶段生物等效性研究中在控制TIE的基础上保证目标把握度,需大量试验基础与理论的。本文详细介绍了Potvin、Karalis、Fuglsang等作者发表的两阶段生物等效性论文的研究策略、检验水准的调整方案、样本量的再估算方法,希望能给国内药品申办者和临床研究单位在实施两阶段生物等效性研究时提供参考。