今天为大家介绍的是来自斯坦福大学Scott D. Boyd教授与Anshul Kundaje教授团队发表的一篇论文。传统的临床诊断主要依靠医生查体、了解患者病史、进行各种化验检查和影像检查,但很少利用人体免疫系统自身所记录的信息。实际上,我们的免疫细胞(B细胞和T细胞)表面的受体分子携带着身体遇到过的各种病原体和异常物质的“记忆”。研究团队分析了593名志愿者的免疫细胞数据,开发出一个创新的诊断工具——MAL-ID机器学习免疫诊断系统。这个系统既可以同时筛查多种疾病,也能够精确诊断某一特定疾病。它不仅能识别特定的感染性疾病,还能诊断自身免疫疾病,评估疫苗接种效果,甚至判断疾病的严重程度。更令人兴奋的是,这个系统能够解释其诊断结果背后的科学原理。例如,它成功复现了科学界已知的人体对新冠病毒、流感病毒和艾滋病毒的免疫反应特征,找出了能特异性识别这些病毒的免疫受体,并发现了狼疮和1型糖尿病这两种自身免疫疾病的独特免疫特征。这个分析框架为科学研究和临床诊断提供了一个强大的新工具。
讨论
研究开发的MAL-ID系统通过分析免疫受体序列,成功实现了对多种疾病的精确诊断。系统采用三重模型分析框架,结合B细胞和T细胞信号,在542名受试者中达到了0.986的AUROC诊断准确率。系统不仅能识别病毒感染和自身免疫性疾病的特征,还能克服年龄、性别和种族带来的差异影响。MAL-ID系统的成功关键在于其创新的分析方法:综合分析免疫系统组成特征、重要序列组的识别,以及对单个序列的语言模型解释。这种方法不仅提供了准确的诊断,还揭示了不同疾病中B细胞和T细胞的独特作用模式,为未来的临床应用奠定了基础。
编译|于洲
审稿|王梓旭
参考资料
Zaslavsky M E, Craig E, Michuda J K, et al. Disease diagnostics using machine learning of B cell and T cell receptor sequences[J]. Science, 2025, 387(6736): eadp2407.