人工智能预测T细胞受体-抗原结合特异性,使癌症治疗中预测的不可能变为可能

人工智能预测T细胞受体-抗原结合特异性,使癌症治疗中预测的不可能变为可能
2021年11月09日 15:23 麻省理工科技评论

恶性肿瘤的治疗面临着诸多困难,亟需新的治疗策略。而肿瘤新生抗原的发现,为治疗癌症提供了崭新思路。癌细胞在发生发展过程中,会产生很多基因突变,而部分基因突变也会产生正常组织细胞所没有的蛋白质,这些蛋白质很有可能也会激活免疫系统,并引起免疫系统对癌细胞的攻击。这些由癌细胞基因突变所产生的、能被免疫细胞所识别并激活免疫系统的异常蛋白质,被称为肿瘤新生抗原(neoantigen)。

近期,美国德州大学西南医学中心(UT Southwestern)定量生物研究中心(QBRC)王涛课题组研发出一套人工智能模型(pMTnet),能够预测肿瘤新生抗原与免疫T细胞受体(T cell receptor)特异性结合,为肿瘤免疫治疗提供了突破性预测手段。

用计算来解决生物学问题:AUC 精确度高达 0.827 的人工智能模型

在正常的免疫应答中,免疫 T 细胞通过识别和结合特异的新生抗原,发挥清除肿瘤的功能。因此识别和筛选肿瘤新生抗原是新生抗原疗法的第一关,目前,随着基因组测序技术以及主要组织相容性复合物(MHC)表位数据库和预测算法的发展,鉴定和筛选个体患者的肿瘤新生抗原已成为可能。然而,T 细胞的复杂性加之肿瘤变异的不确定性使得预测瘤新生抗原与T细胞的特异性结合被认为是不可能的,这也是现代免疫学亟待攻克的难题之一。

“此前,绝大多数的人都认为,使用计算机来预测新生抗原与T细胞的特异性结合是不太可能的,而我们的工作首先证明了这一可能性。” 王涛表示。

传统的实验手段(如 MHC 四聚体检测,tetramer assay)技术要求较高,耗时较长且成本高昂。王涛课题组建立的深度学习模型 pMTnet,通过人工智能机器学习的高速计算优势,为研究者节省了繁琐的实验时间和昂贵的实验成本,提供了一个平台性的预测手段。

“免疫学研究涉及到数量庞大的蛋白质与基因的排列组合问题,因此,使用计算的办法,包括生物信息学、生物统计学、机器学习等来研究免疫学问题,具有天然的优势。” 王涛介绍。

pMT 的训练和预测主要基于三项数据:T 细胞-肿瘤细胞结合时相互识别的抗原序列、主要组织相容复合体(MHC)的序列、和 T 细胞受体的序列。通过迁移学习(transfer-learning),pMTnet 完成了深度学习的模型的训练。

图 | pMTnet 模型的最终结构

为了测试模型的预测精确度,课题组从此前发表的 30 多项研究数据集中收集了 619 对已被实验验证的抗原和 T 细胞相互结合的数据,这些数据组成的测试集完全独立于此前的训练集。结果显示,pMTnet 模型的受试者工作特征曲线 (receiver operating characteristic curve,简称 ROC 曲线)的曲线下面积(Area Under Curve,AUC)达到了 0.827 ,与其他类似生物信息学预测模型(如 TCRex,,TCRGP,netTCR 等)相比,pMTnet 的预测精确度有着明显的提高。“0.827 这一精确度是十分惊人的。”王涛欣喜地表示。

图 | pMTnet 模型的精确度测试结果

运用该模型,王涛课题组有了一系列新发现。首先,他们将 pMTnet 应用于皮肤黑色素瘤(skin cutaneous melanoma)、肾细胞癌(renal cell carcinoma)、肺腺癌(lungadenocarcinoma)和鳞状细胞肺癌(lung squamous carcinoma)这 4 种有强免疫效应(immunogenic)的癌症研究。

他们发现,不同种类的抗原的免疫效应存在着明显的差异。其中肿瘤新生抗原的免疫效应强于自身抗原(self antigen);而一种只存在于肾细胞癌的内源性逆转录病毒(humanendogenous retrovirus) 的免疫效应强于肿瘤新生抗原和自身抗原。

紧接着,研究者利用 pMTnet 预测了可以和肿瘤抗原结合的免疫 T 细胞,并发现:MTnet 预测出的能与患者体内肿瘤抗原高概率结合的 T 细胞,与没有结合的 T 细胞相比,有着更强的扩增的现象。理论上,成功识别抗原并引起下游免疫信号应答的 T 细胞会出现类似的高度扩增的现象。这结果也进一步印证了 pMTnet 的精确性。

最后,王涛课题组进一步研究了肿瘤新生抗原和免疫 T 细胞之间的相互作用对于肿瘤预后和免疫疗法(immunotherapy)的治疗效果的影响。他们将 pMTnet 应用于 4 个有预后(prognosis)信息的癌组织数据集,3 个经过免疫治疗的皮肤黑细胞瘤数据集,和 1 个经过免疫治疗的胃癌细胞集。他们发现,当 pMTnet 预测出的能够与 T 细胞结合的肿瘤新生抗原,来自于肿瘤的主干突变(truncal mutation)时,患者表现出更好的预后和免疫治疗效果。

平台型技术为肿瘤免疫治疗提供便利

近年,肿瘤的免疫治疗受到越来越多关注,并取得了突破性进展。肿瘤的免疫治疗是指利用机体自身的免疫系统来清除肿瘤细胞,包括抗体治疗、细胞治疗、疫苗治疗以及近几年非常火热的免疫检查点抑制剂(抗PD-1/PD-L1抗体)治疗等。

已有较多的研究显示以新生抗原为靶标的免疫治疗(包括细胞免疫治疗和疫苗免疫治疗)在黑色素瘤、乳腺癌以及肺癌患者上已取得了不错的临床效果。因此筛选鉴定出肿瘤特异性新生抗原,并且预测T细胞受体与新生抗原的特异性结合,是改善肿瘤免疫治疗效果的关键。

预测新抗原和 T 细胞受体的结合是研究目前还属于一个非常新的领域。王涛课题组此次的模型证明了这种特异性结合是可以使用人工智能进行预测的。尽管当前的预测精确度尚未达到 1 的水平,但该模型也提供了一种平台型技术,为癌症研究者和临床医生提供了高效简便的预测方式,为癌症疫苗的设计以及个性化肿瘤免疫疗法提供便利。

下一步,王涛课题组将在此基础上继续提高 pMTnet 模型的预测精度,并将其应用在跟肿瘤免疫治疗有关的临床应用上。这一深度学习算法将极大地推动基于肿瘤病人个体遗传学特征的精准免疫疗法,特别是以癌细胞为靶点的T细胞疗法的成熟和进步。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部