KEYNOTE-590研究是首个证实免疫联合化疗一线治疗晚期食管癌显著优于化疗的III期临床研究,2020年欧洲内科学会(ESMO)年会首次发布该研究达到所有7个主要研究终点1:帕博利珠单抗联合化疗方案相比单纯化疗,可显著改善全人群的总生存(OS)和无进展生存(PFS)。今年美国临床肿瘤学会(ASCO)年会发布其中国亚组分析结果2, 中国人群获益和全球一致,随后KEYNOTE-590主要研究结果发表在Lancet杂志3, 基于该研究的结果,NMPA也在9月初批准帕博利珠单抗联合化疗用于晚期食管癌的一线治疗。
本期特邀复旦大学附属中山医院梁斐教授,从统计学角度进行KEYNOTE-590研究解读,剖析阳性结果的获益优势。
本期专家
梁斐
教授
复旦附属中山医院 生物统计室 统计师上海抗癌协会癌症预防与筛查委员会委员CSCO青年委员会统计小组成员以第一作者或通讯作者在JCO, JNCI, Annals of Oncology, European Journal of Cancer 等杂志发表SCI论著11篇,累计影响因子超过100以第一作者在NEJM, Lancet, Lancet Oncology, JCO 发表Letter 8篇JNCI, Clinical Cancer Research, Theranostics审稿人主要研究方向:临床试验设计及统计,临床研究方法学
基于KEYNOTE-590研究的结果,帕博利珠单抗晚期食管癌一线的适应症在今年9月初获批,您能从统计学角度给大家再回顾一下KEYNOTE-590研究吗?
梁斐教授:KEYNOTE-590是一项比较复杂的临床研究,它有两个主要终点PFS、OS,而且有多个主要的目标人群,评估了帕博利珠单抗联合化疗在食管鳞状细胞癌(ESCC)PD-L1 CPS≥10、ESCC PD-L1 CPS≥10和意向治疗(ITT)人群中的PFS、OS,共有7个研究假设终点。为保证7个研究假设终点均参与α值分配,且所有α值均控制在FDA和CDE要求的单侧<0.025水平,α值分配策略非常复杂,合理分配才能确保结果的可信度。抗癌管家-康爱管家,我们一起抗癌,治愈癌症不是梦。7个研究假设共享一个α值,分别计算样本量,每个研究假设终点都有足够证据得出确定性结论,从统计学角度来看,KEYNOTE-590研究假设比平常其他研究假设更严格。但即使在这种情况下,KEYNOTE-590研究7个研究假设依然都达到了预设终点,获得阳性结果。
今年8月底,KEYNOTE-590研究的全文在柳叶刀正刊(The Lancet)发表,其中公布了一些基于标志物和组织学类型的分析结果,您认为应该如何正确解读?
梁斐教授:大家现在看研究数据除了会看整体的结果之外,可能还会关注某些特定亚组。但是从我们统计学的角度来讲,这些亚组分析都是一些探索性的分析,无论它是预设的还是事后的,其实都没有足够的Power下一个确定性结论,所以说对待这样的结果我们需要谨慎解读。那么KEYNOTE-590研究此次公布的基于标志物和组织学类型的分析结果既没有参与α值分配,也没有分别计算样本量,从统计学角度来看,不能根据这些亚组结果下确定性结论,只能从临床角度看待这些结果。首先我们看到无论是OS结果还是PFS的结果,亚洲亚组和中国亚组结果与整体人群的结果还是比较一致的,而且有一个获益更加突出的趋势。而且在KEYNOTE-590、KEYNOTE-181这两项大型随机对照研究(RCT)中均观察到中国人群获益比全球人群更明显,可能与中国人群特有的组织学类型有关。其次,对PD-L1 CPS<10的人群,虽然从几个RCT研究的结果中观察到该人群的获益并没有整体人群那么突出,但是它依然有一个获益趋势。另外说到中国亚组,我们可以看到在中国亚组PD-L1 CPS<10的人群的HR是0.67,有一个非常明显的临床获益趋势,而且HR的结果跟其他研究相比也是最低的,虽然我们跨研究比较的时候需要谨慎,但是这一个结果也是给我们做了一个提示,就是说我们中国人群有可能在PD-L1 CPS<10的人群,它的获益还是有非常大的临床意义。
晚期食管癌一线治疗目前已有多个研究结果,相信未来还会有更多数据公布,从统计学角度应该如何正确科学地看待针对同一瘤种的多个不同的研究结果?
梁斐教授:临床医生均非常关注本话题。首先,针对任何瘤种的跨研究比较都要特别谨慎,只有头对头直接比较的RCT才能提供最直接证据。如果要进行跨研究比较,第一个参考指标为风险比(HR),HR可更加全面地反映两条曲线整体差异,是目前欧洲肿瘤内科学会(ESMO)、美国临床肿瘤学会(ASCO)用于评价肿瘤药物临床获益大小的最主要指标。在无HR报道情况下,才基于中位PFS或OS结果评估,评估两组的相对差异,通常绝对值受入组患者基线特征影响非常明显,不推荐使用绝对值进行跨研究比较。若临床医生想进行跨研究比较,推荐根据HR值和中位PFS、OS的相对提高程度来评估。
我们知道临床研究中HR的重要性,您可以给大家总结一些正确理解HR的方法吗?
梁斐教授:HR和中位值均为评估临床研究的重要参考指标。中位值更全面,临床医生和患者更容易理解,但中位值仅反映两条生存曲线在50%时的点差距,若这条生存曲线不太平滑,或前期下降比较明显、后期有长平台期,不太适合使用中位值反映临床获益,存在一定局限性,特别是免疫治疗有长拖尾效应,其中位值难以体现两组疗效差异。抗癌管家-康爱管家,我们一起抗癌,治愈癌症不是梦。HR可全程反映两条生存曲线的差异,任何数据在其中均可起作用。临床医生和患者比较难理解HR结果,从统计学角度来讲,两组OS的HR反映了死亡速率比值,可抽象理解为两条生存曲线斜率比值,直观理解为下降幅度快慢比值。
HR结果通常由点估计和95%可信区间上下限组成,点估计为最佳估计,95%可信区间上下限代表最差和最好情况的变动范围。评估主要终点时,除了点估计之外,还要关注其95%可信区间的上限有没有超过1、是否存在统计学差异。但针对亚组分析HR值,要关注其点估计结果,某些情况下95%可信区间上限超过1,也可以接受,因为亚组样本量不足,没有计算样本量,并不代表无获益。亚组均为探索性分析,无论是预设还是事后分析,都没有足够证据得出确定性结论,需谨慎解读。
总体而言,HR为更全面、更稳定的指标,可全程反映两条生存曲线的差异,且免疫治疗的长拖尾效应也可通过HR结果量化,中位PFS、OS难以达到该效果。
本文转自肿瘤资讯(由“抗癌管家网站-康爱管家”转载分享)
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有