立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 104|回复: 0

[分享] Science | 解密免疫系统:MAL-ID“阅读”免疫受体序列实现精确诊断

[复制链接]
发表于 2025-4-22 16:45 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
今天为大家介绍的是来自斯坦福大学Scott D. Boyd教授与Anshul Kundaje教授团队发表的一篇论文。传统的临床诊断主要依靠医生查体、了解患者病史、进行各种化验检查和影像检查,但很少利用人体免疫系统自身所记录的信息。实际上,我们的免疫细胞(B细胞和T细胞)表面的受体分子携带着身体遇到过的各种病原体和异常物质的“记忆”。研究团队分析了593名志愿者的免疫细胞数据,开发出一个创新的诊断工具——MAL-ID机器学习免疫诊断系统。这个系统既可以同时筛查多种疾病,也能够精确诊断某一特定疾病。它不仅能识别特定的感染性疾病,还能诊断自身免疫疾病,评估疫苗接种效果,甚至判断疾病的严重程度。更令人兴奋的是,这个系统能够解释其诊断结果背后的科学原理。例如,它成功复现了科学界已知的人体对新冠病毒、流感病毒和艾滋病毒的免疫反应特征,找出了能特异性识别这些病毒的免疫受体,并发现了狼疮和1型糖尿病这两种自身免疫疾病的独特免疫特征。这个分析框架为科学研究和临床诊断提供了一个强大的新工具。



现代医学诊断主要依赖实验室检测来发现细胞或分子异常。对于传染病,可以通过检测病原微生物来确诊。而对于系统性红斑狼疮(SLE)、多发性硬化症或1型糖尿病(T1D)等自身免疫疾病,由于没有单一的致病因素,需要综合多种诊断方法。目前的诊断很少利用B细胞受体(BCR)和T细胞受体(TCR)的数据。这些受体的基因在每个免疫细胞发育过程中通过随机重组产生,形成多样化的抗原特异性受体库。在应对病原体、疫苗和其他刺激时,BCR和TCR的组成会发生变化。虽然受体库测序已经在淋巴细胞恶性肿瘤的诊断和治疗监测中发挥作用,但在更广泛的临床诊断中应用面临多个挑战:

  • 许多患者体内抗原特异性B细胞和T细胞的频率较低。
  • 免疫受体基因的多样性高。
  • BCR会积累体细胞高频突变。
  • 实验方案和患者人口统计学特征的差异可能影响结果。
为应对这些挑战,研究团队开发了MAL-ID(机器学习免疫诊断)系统,该系统结合了三种机器学习方法来分析BCR和TCR数据,用于检测传染病或免疫系统疾病。

模型架构与实验结果



图 1

在图1中,MAL-ID系统就像一位经验丰富的“AI医生”,它通过三种不同的方式来分析免疫细胞的“指纹”(即免疫受体):

  • 分析免疫基因的使用模式和变异特征。
  • 寻找不同患者之间相似的免疫受体序列。
  • 使用先进的AI模型来理解免疫受体的结构特征。



图 2

如图2所示,研究团队收集了近600名志愿者的血液样本,包括新冠、艾滋病、狼疮、1型糖尿病患者,以及接种过流感疫苗的人和健康人群。通过分析这些样本中数以千万计的免疫细胞数据,MAL-ID系统展现出了惊人的诊断能力。在多种疾病的同时诊断中,系统的准确率达到了98.6%,远超现有的诊断方法。特别是在狼疮这种难以诊断的疾病中,系统表现出了极高的准确性:能正确识别出93%的狼疮患者,同时对非狼疮患者的判断准确率达到90%。这一成果对于改善狼疮的早期诊断具有重要意义。更重要的是,这个系统不仅能告诉医生“这个患者得了什么病”,还能解释“为什么会得出这个诊断结果”,这对于提高医生和患者的信任度至关重要。

批处理对于诊断的影响有限
为了验证MAL-ID系统的可靠性,研究团队进行了一系列严格的测试,确保系统的诊断结果不会受到实验条件和操作差异的影响。

首先,研究团队使用来自其他研究机构的数据进行测试:在分析其他机构的B细胞数据时,系统完美区分出了7名新冠患者和6名健康人;在分析其他机构的T细胞数据时,系统对17名新冠患者和39名健康人的识别准确率达到90%。随后,研究团队进行了更严格的验证:研究团队测试了使用不同采血方式获得的10名新冠患者样本,并对13名健康人的血液样本进行了重复测序。结果显示同一个人的重复样本有着高度一致的诊断结果,9位健康人的重复样本诊断结果相似度超过97%。这些验证结果表明,MAL-ID系统的诊断能力是稳定可靠的,不会因为样本处理方式的不同或实验条件的变化而受到显著影响。这一特性对于系统未来在临床实践中的应用至关重要。

年龄、性别和种族对诊断的影响有限
研究团队特别关注了一个重要问题:患者的年龄、性别和种族是否会影响MAL-ID系统的诊断准确性?这个问题很重要,因为一个好的诊断系统应该能够准确诊断不同背景的患者。研究发现:

  • 性别对诊断结果几乎没有影响,这意味着系统对男性和女性都同样准确。
  • 种族背景对诊断结果有轻微影响,准确率为78%。这可能与不同种族的遗传背景和生活环境差异有关。
  • 年龄对诊断有一定影响:
  • 系统能以75%的准确率识别50岁以上的人群;
  • 对儿童的免疫特征识别特别准确;
  • 但这些年龄相关的差异并不影响疾病诊断的准确性。
并且,研究分析的病人群体具有广泛的年龄分布:最年轻的群体是1型糖尿病患者,典型年龄在14-15岁左右;新冠患者年龄较大,典型年龄接近50岁;其他疾病的患者年龄分布在这两者之间。为了确保系统的可靠性,研究团队专门测试了仅使用年龄、性别和种族信息进行诊断的效果。结果表明,这些人口统计学特征只能达到85%的准确率,远低于MAL-ID系统的98%。这证明系统确实是在分析免疫系统的特征,而不是简单地依赖患者的基本信息来做出判断。这一发现具有重要意义,说明MAL-ID系统有望成为一个普遍适用的诊断工具,不会因患者的年龄、性别或种族而产生明显偏差。

MAL-ID系统概括了免疫学知识
研究团队深入分析了MAL-ID系统是如何“学习”和“理解”人体免疫系统的。这就像解码一本免疫系统的“密码本”,每种疾病都留下了独特的“密码”组合。



图 3

图3揭示了不同疾病的独特免疫特征:

  • 新冠病毒感染者的免疫系统主要产生一种叫做IgG的抗体,并且使用特定的基因(IGHV1-24和IGHV2-70)来制造这些抗体。
  • 艾滋病患者的免疫系统则倾向于使用另外一组基因(IGHV1-2和IGHV4-34),主要产生经过特殊改造的IgM/D类抗体。
  • 流感患者的免疫反应主要依赖IGHV3-23基因,同时产生多种类型的抗体。
  • 狼疮患者的免疫系统使用IGHV4-34和IGHV4-59基因,特别是产生IgA类抗体,这与已知的医学研究发现相符。
  • 1型糖尿病患者则显示出更复杂的模式,涉及多种抗体类型。



图 4

图4证明了系统的“学习”确实有效:当研究人员用已知能够与新冠病毒结合的抗体来测试系统时,系统能够准确识别这些抗体。在某些情况下,系统的识别准确率甚至达到了100%。这说明系统不仅仅是在“死记硬背”,而是真正“理解”了不同疾病的免疫特征。这些发现不仅证实了MAL-ID系统的可靠性,也为我们理解不同疾病如何影响免疫系统提供了新的视角。这对于开发更精确的诊断方法和更有效的治疗策略都具有重要意义。

讨论
研究开发的MAL-ID系统通过分析免疫受体序列,成功实现了对多种疾病的精确诊断。系统采用三重模型分析框架,结合B细胞和T细胞信号,在542名受试者中达到了0.986的AUROC诊断准确率。系统不仅能识别病毒感染和自身免疫性疾病的特征,还能克服年龄、性别和种族带来的差异影响。MAL-ID系统的成功关键在于其创新的分析方法:综合分析免疫系统组成特征、重要序列组的识别,以及对单个序列的语言模型解释。这种方法不仅提供了准确的诊断,还揭示了不同疾病中B细胞和T细胞的独特作用模式,为未来的临床应用奠定了基础。
编译|于洲
审稿|王梓旭
参考资料
Zaslavsky M E, Craig E, Michuda J K, et al. Disease diagnostics using machine learning of B cell and T cell receptor sequences[J]. Science, 2025, 387(6736): eadp2407.

原文地址:https://zhuanlan.zhihu.com/p/1898047051167667027
楼主热帖
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表