导语: 生物技术尤其是基因测序技术的飞速发展,为精准医疗的发展创造了条件。目前,基因检测、诊断、治疗等相关技术已取得了很大的突破。近期,曾领导人类基因组计划的美国国立卫生研究院(NIH)主任Francis S. Collins博士联合美国All of Us测序计划首席执行官Joshua C. Denny博士在Cell发表评论文章“Precision medicine in 2030—seven ways to transform healthcare”,展望了未来十年精准医疗的持续发展以及改变医疗保健的七大机遇。 测序中国对原文进行了编译,以飨读者。 精准医疗通过考虑个体在遗传、环境和生活习惯等方面的差异,有望进一步改善人类健康状况。在未来十年中,精准医疗将继续改变医疗保健领域,并在以下关键领域得以拓展:庞大的队列研究、人工智能(AI)、常规临床基因组学、表型学和环境以及在不同人群中的价值回报。 自2003年完成第一个人类基因组测序以来,临床医生一直期望以数据驱动的医疗保健领域的变革。分子和表型研究的新发现将带来更精确的诊断,更合理的治疗和更有效的疾病预防。2011年,美国国家研究委员会的特设委员会根据新兴的精准医疗领域提出了“人类疾病新分类法”的理念。 如今,发展精准医疗的某些承诺已经实现。目前,研究人员通常使用医疗数据作为发现、识别癌症和许多其他常见及罕见疾病的基因组基础,并引入分子靶向疗法,以及利用新的机器学习方法来掌握大规模计算能力。同时我们也开始从精准医疗中获益。 也许没有比COVID-19大流行更能说明精准医疗的重要性了。COVID-19疫情爆发后,基因组学和分子技术成为确定病原体、开发诊断和治疗方法以及创建候选疫苗的关键。快速分析得到的病例报告暴露出COVID-19可引起患者的巨大健康差异,并强调了获得对影响健康的社会决定因素有更详细了解的重要性。大型机构基于医疗保健数据迅速构建了庞大的数据库,用于快速调查风险因素和结果,证明了整合医疗保健数据的强大功能。 在这场波及全球的疫情中,从现有研究队列中收集数据可以进行快速基因组分析,确定与疾病易感性和患者预后相关的基因位点。此外,COVID-19还需要注意纵向队列研究,以识别急性传染病的临床和生物学危险因素以及长期后遗症。目前,应对COVID-19疫情的许多工作都是基于精准医疗的基本能力。 与此同时,COVID-19疫情也凸显了我们对精确医疗更快更深入发展的需求。在本文中,我们提出了可加速实现精准医学愿景的七个机遇,并阐述了其影响。 庞大的、可互相操作的纵向队列研究 在过去的20年里,“UK Biobank”、“the Million Veteran Program”、“FinnGen”和“All of Us”等国家级队列研究通过基因组、实验室分析、生活方式评估以及健康结果的纵向随访,积累了大量的人群数据。获得数据的深度和广度是惊人的,发现各个医学领域的机会也是如此。 为了最大限度地发挥这些资源的作用,一种“开放科学”的方法应运而生。例如,UK Biobank已经向来自80个国家的19,000多名“纯粹的研究人员”敞开了大门,研究人员可以在首次登录的两个小时内开始使用“All of Us”研究计划的数据云。 该领域下一步的目标很明确:让研究人员更轻松地合并来自多个队列的数据。目前,这需要辛苦的人工表型判断和建立包括各个队列专家在内的大型联盟。幸运的是,大家正在努力推进这一进程,例如全球基因组学与健康联盟(GA4GH)等组织正致力于开发和协调通用的数据模型和文件格式,以促进队列研究协作和互操作性。由于认识到队列研究对合作的需求,国际十万人以上队列联盟(IHCC)汇集了43个国家的100多个队列,参与者超过5000多万,比目前最大的单个队列大了近两个数量级,很难评估这项工作将给全球研究工作带来怎样巨大的影响。 提高科学研究的多样性与包容性 随着数据深度的提升,研究人员有机会采用更具体的措施调整针对不同种族的研究,特别是“种族”将大量的社会、文化、政治、地理和生物因素融合在一起,并可以保证系统性的种族特征。在研究和临床护理中,常规收集健康的社会决定因素,再结合对环境影响、习惯和遗传的更精确检测,可以提供更合理的、基于病因的调整,并产生更好的风险分层和治疗方法。 除了增加研究对象的多样性,生物医学研究人员的多样性也应受到重视。更加多样化的研究团队(包括文化、祖先、信仰、科学背景和方法学等方面)可以带来对创新、信任和文化敏感性的更多了解,更有可能提出与不同受众有关的问题,并最终提供更好的研究策略。 大数据与人工智能 常规临床基因组学指导预防、诊断和治疗 基因组研究作为靶向方法一种更便宜、更有效的替代方法,其应用可使越来越多的罕见病被诊断出来。早期基因组测序可以解决诊断难题并发现“隐藏”的孟德尔遗传病,例如不明原因的肾脏疾病、非典型糖尿病或不明原因的发育迟缓等。基因测序为部分孟德尔遗传病指出了可以显著改善健康状况的特定新疗法和筛查策略,例如建议携带HNF1A突变或具有肝/肾衰竭特殊特征的年轻糖尿病患者使用磺酰脲类药物。 在过去的十年中,多项研究表明,许多常见疾病(例如糖尿病或高血压)都可能与成千上万个基因位点的遗传风险相关联。这些结果通常是通过对数十万名参与者的数据进行收集的大规模遗传研究发现的。虽然这些基因位点中许多可能具有非常小的遗传效应(odds ratios <1.01),但它们明确了疾病发病机制中可能有显著的治疗意义的途径。此外,将遗传变异加权聚合为多基因风险评分可以实现与罕见的孟德尔遗传病变异体相似的预测。同时,多基因风险评分的使用可以对传统筛查方法可能遗漏的个体进行风险分层,从而确定新的治疗或筛查人群。 基于此,我们预计将发现更多常见疾病的多种遗传原因和靶向疗法,这有利于为患者及其家庭提供更具体的治疗和预防策略。此外,我们很可能还会发现许多遗传疾病的严重程度、外显率和表现度都受到不同遗传变异、生活方式和环境相互作用严重程度的影响。典型例子包括伴有囊性纤维化的不同类型的CFTR突变、具有α-1抗胰蛋白酶缺乏症的SERPINA1突变,这两种突变都可能因为遗传变异、生活习惯(例如吸烟)和暴露(例如肝炎病毒的合并感染),在不同的年龄具有不同的表现。 因此,常规测序将为二次研究分析提供有价值的数据集,从而推动人们更全面地了解疾病的外显率、变异致病性以及影响给定遗传变异可变表达性的因素,也将因此发现更多由偶然变异致病的患者。美国医学遗传学和基因组学学院已鉴定出59个基因,这些患者应该考虑偶然发现的变异。这些基因包括遗传性癌症综合征、心肌疾病和潜在的致命性心律失常,因此可以采取措施降低其风险。如今,约3%的患者携带致病性变异,其中绝大多数患者此前并不知道。随着基因组知识的增加,可操作基因的数量和受影响人群的比例将显著增加。 EHRs作为表型和基因组研究的数据来源 例如,一项研究表明参与者在平均约8年的随访中平均接受了190多项临床笔记,14项放射学研究和700多项实验室检测(Robinson等人,2018)。发现特定内表型(例如心脏射血分数)或新兴表型(例如COVID-19),罕见和特定表型(例如下颌骨坏死)或了解疾病特定表现(例如支气管扩张)的能力 需要访问完整的EHR数据。 基于EHR的研究已经为一些大型临床相关基因组研究提供了帮助,其中一些队列超过100万个体。通过系统收集健康相关信息,EHRs 可提供表型和数据,并助力新的研究设计,这些通常是无法在科研收集中获得的。例如,一项研究表明,参与者在平均8年的随访中,平均有190多份临床记录、14份放射学研究和700多份实验室检测。发现特定的表型(例如心脏射血分数)或新出现的表型(例如COVID-19)、罕见的表型(例如颌骨骨坏死),或了解疾病的特定表现(例如支气管扩张),通常需要获得完整的EHR数据。 EHR数据需要整理和统一,并能反映临床和保险方面的偏差。诸如临床记录或影像数据之类的非结构化EHR数据,通常需要自然语言处理或机器学习等高级方法才能在大规模群体应用中发挥作用。虽然所有这些工具的可用性和适用性都越来越高,能够提供在规模、深度和细节上获取数据的途径,但这对于纯研究收集的数据是不可行的。 用于临床和研究更多样化、更高分辨率的表型组学和环境暴露数据 由于患者生命的绝大部分时间是在医疗保健系统之外度过的,可穿戴设备和其他患者提供的信息可完善EHR,提升远程医疗能力,这在COVID-19疫情期间首次得到了大规模验证。此外,这些工具的集成可能会产生一种转变:大多数与健康相关的数据都是在医疗保健环境之外获得的。 隐私、参与者信任和回报价值 精准医疗的应用依赖于广泛的人群参与,而广泛参与需要信任、隐私保护和对参与者的价值回报。但科学并不总是值得信赖的,也不总是平等地尊重所有参与者。透明度、真诚互动以及将参与者纳入研究治理可以提高信任度,并确保一个更具思想性和文化敏感性的方向。All of Us从一开始就让参与者参与了各级治理,并通过为参与者提供尽可能多的研究数据来寻求价值回报。 随着COVID-19的流行,科学已成为对现有医学威胁的最佳答案。但是,我们要提醒人们,医学进步的好处并不总是惠及所有人。在接下来的十年中,生物医学方法、计算算法和高分辨率数据的可用性将大大增加。实施一项需要国际合作的大胆计划,以吸引不同群体的参与者和科学家,深入分析人群,获得丰富的临床和研究数据,并通过真正的学习型医疗保健系统将这种知识应用于临床实践中,将帮助我们实现使精准医疗面向所有人的愿景。 · END |