NEJM视角——临床试验主要终点“阳性” good enough?
时间:2021-09-22 16:18:20 热度:37.1℃ 作者:网络
文章来源:医药魔方Med
作者:阿拉蕾
编者按
这些天,WCLC、ESMO、CSCO接踵而至,相信大家也会看到临床试验“阳性”的各种报道。新药研发按下了“加速键”,能切实的给患者带来获益。但是,“阳性”结果就代表了最后的成功?就可以改变临床实践?
早在2016年,顶级期刊《新英格兰医学杂志》就发表过评论性文章,对于“阳性”结果,我们还需要更多的思考。这里,我们对文献的重点内容进行了翻译整理,意犹未尽的读者,原文更精彩!
主要终点达到统计学意义,是采纳新的治疗方案的必要条件,但这还不够。整个临床试验结果将受到众多利益相关者的审查,包括:监管机构、支付方、期刊编辑、审稿人、临床专家、指南委员会、临床医生、患者和评论家。为了明确这项临床试验结果是否提供了足以影响医疗实践的证据,需要对试验数据以及相关试验的结果进行深入的分析评估。
主要终点为“阳性”时 需要思考的11个主要问题
1、P<0.05,是否提供了足够有力的证据?
2、治疗获益有多少?
3、主要终点在临床上是否重要?
4、次要终点的结果与主要终点是否一致?
5、重要的亚组分析结果是否一致?
6、临床试验的样本量是否能让人信服?
7、试验是否提前终止?
8、安全性问题是否会抵消疗效的获益?
9、疗效-安全性问题是否具有患者人群的特异性?
10、试验设计和执行中是否有不足?
11、研究结果是否适用于我的患者?
P<0.05,是否提供了足够有力的证据?
如果P=0.05,表示有5%的可能会出现假阳性。如果一项临床试验想提供让人无可置疑的、显示出真正治疗方案差异的证据,应采用更小的P值,比如P<0.001。
治疗获益有多少?
治疗方案的差异,需要有临床意义——足够大。通过相对比(例如:相对风险或风险比)和绝对比(例如:随访期间事件发生率的差异,需治疗次数的差异)来确定。另外,还需评估95%置信区间。
主要终点在临床上是否重要?
部分疾病的临床研究使用的是替代终点或复合终点。一些大规模临床研究的结果让人们对这些替代终点的合理性产生质疑。此外,需仔细评估复合终点的结果,确定是哪些因素导致最后的阳性结果。
次要终点的结果与主要终点是否一致?
如果次要终点也显示出治疗获益,则会增强对总体“阳性”结果的信心。反之,如果次要终点没有显示出获益,质疑可能会“成真”。
重要的亚组分析结果是否一致?
治疗效果可能因人而异。可能在所有类型的患者中观察到的疗效一致,但在某些高风险亚组中具有更大的获益。更具“挑战性”的情况是,“阳性”试验的亚组分析是“阴性”的。需要谨慎,多个亚组分析可能会出现错误的结果。是否需要保护这部分患者接受似乎无效(或有害)的治疗,需要根据统计交互作用的强度和生物学合理性。
临床试验的样本量是否能让人信服?
当小样本量临床试验的主要终点达到统计学意义时,需要谨慎。小样本量试验的效力不足,治疗效果容易被夸大,可能会出现假阳性。
试验是否提前终止?
中期分析时,有力的证据显示出治疗优势,临床试验有时会提前终止。但是,这种做法常会夸大疗效。随着试验的进行,与真实疗效相比,预估的疗效可能会发生随机变化。
安全性问题是否会抵消疗效的获益?
当一种新的治疗方案具有疗效优势时,确定其安全性是否会抵消获益十分重要。需提供有效性和安全性的平衡说明。
疗效-安全性问题是否具有患者人群的特异性?
新的治疗方案的净获益可能只针对特定部分的患者。对于主要终点风险增加者来说,新的治疗方案是值得接受的;而对于不良反应风险增加者来说,可能是有害的。统计模型可有助于分析利弊。
试验设计和执行中是否有不足?
主要终点具有显著的优效性,因偶然性得出这一结果的可能性较小。但是,还是要排除在试验设计和执行中可能存在的不足。
研究结果是否适用于我的患者?
任何研究的结果,都是在特定的患者中、采用特定的治疗方案。这样的结果是否能推广到其他类型的患者,需谨慎考虑。研究所在的地区也可能会影响实际应用的推广。许多重要的临床试验是多国的,这就赋予了全球性的意义,然而不同地区的医疗实践情况也存在不同;如果患者招募由一个地区主导,则全球适用性可能会受到限制。此外,遗传、环境、饮食等差异,也可能会影响研究结果的推广。
参考文献
N Engl J Med. 2016; 375: 971-9.
来源:新浪医药。