“Biomarker”这个词在用于生物医学领域之前,多见于地质学文献,曾被翻译成“生物标志化合物”,指的是地质材料中来自于活的生物体的一些有机化合物。上世纪六十年代,这一词汇开始出现在医学文献中。上世纪八十年代,它被正式地引入到生物医学领域。在生物医学领域,对它也曾有过不同的描述。2001年,美国NIH 召集的生物标志物定义工作组(Biomarkers Definitions Working Group)对生物标志物给出了一个定义:它是指“一种可客观检测和评价的特性(characteristic),可作为正常生物学过程、病理过程或治疗干预药理学反应的指示因子”。 生物标志物定义的提出意味着人们对它的认识更加明确,也反映出人们对它的关注。这一定义提出后的十几年,也是生物芯片、新一代测序等高通量技术快速发展的十几年。伴随着这些检测技术的发展,产生了海量的有关生物标志物的数据,发表了大量的相关文献。围绕生物标志物的发现、筛选、验证以及应用等环节而产生的市场也在不断扩大。据估计,2015年全球生物标志物相关市场总额为241亿美元,预计以13.58%的复合年增长率增长,至2020年,市场总额将增长至455.5亿美元。生物标志物主要应用在医疗诊断和药物研发等领域,它已成为这些领域的重要主题。 一. 生物标志物的分类 从生物标志物的定义可以看出,生物标志物涵盖的范围广泛,而且,随着检测技术的进步,更多的特异性的检出结果可被视为生物标志物。人们从不同的角度对它进行了分类。 根据生物标志物的潜在用途,可将其分为四类。 1.用于疾病诊断的生物标志物。它包括疾病早期诊断或预后标志物。这类标志物目前应用最广,影响最大,人们也最为熟悉。例如,常规体检检测的血压、血糖以及其它一些检测指标。它反映了疾病的存在与否,有时也反映疾病的进程。 随着技术的进展,这类标志物不再单单是一些生化指标。一些遗传学指标也被视为这类生物标志物。 2. 用于检测疾病活动的生物标志物。这类标志物被用来评估疾病的严重程度,或评估疗效。有时也被用来检测药物的毒副作用。有些生物标志物身兼多职,也具有诊断的功能。譬如上述的血压血糖指标。C反应蛋白(C-Reaction Protein, CRP)是这类标志物的一个代表。它能极好地反映类风湿性关节炎的病程以及干扰素对该病的疗效。 3. 反映药物作用效果的生物标志物。这类标志物最受医药工业界重视。与上一类型也有些重叠。它们直接反映了药物与靶标(受体或酶)的结合情况以及药理学效果。例如,一些影像结果可以作为药物作用的标志物。对神经退行性疾病患者脑部进行D2 受体造影,可以证明相关药物的效果;对II型糖尿病患者的血糖漂移进行测定,可以证实DPP4抑制剂型药物西格列汀(sitagliptin)的疗效。这类标志物在新药申请时可以作为直接的证据证明药物的作用机制及效果,可以显著缩短申请周期。 4. 与药代动力学有关的生物标志物。药物的转运与代谢涉及到药物的疗效,也涉及到药物的毒副作用。转运或代谢过程的效率不同个体可能有差异,这与遗传有关。因此,有时需要参考分子遗传学层面的生物标志物,合理地选择药物或决定药物剂量。这在某些抗癌药的使用方面需要特别注意。例如,抗癌药物抗癌妥(Irinotecan)由胆红素尿苷二磷酸葡萄醣醛酸酶(UDP- glucuronosyltransferase, UGT1A1)催化后,经胆汁和尿液排出体外。但UGT1A1*28基因型的患者使用该药时需要谨慎。因为,UGT1A1*28等位基因与药物代谢有关。再如,使用免疫抑制药物硫唑嘌呤(Azathioprine)时需要检查TPMP基因位点以减少药物毒副作用的影响。。 如果从生物标志物的自然属性的角度,则可将其分为核酸(DNA,RNA)类、蛋白类、糖及其衍生物类等不同类型。 核酸类标志物的研究进展近十几年来非常快,这得益于核酸测序等技术的飞速发展。毕竟,核酸的组成与结构比蛋白简单。DNA类型的标志物代表了以下变化或现象:SNPs,InDels,CNVs,甲基化等修饰,细胞遗传学水平的染色体插入、缺失、重排或重复,单倍型,短序列重复等等。RNA类型的标志物包括:RNA序列,RNA表达水平,转录组,RNA加工,非编码RNA(microRNA,lncRNA),等等。 蛋白类的生物标志物人们对它认识和利用的时间较长。前面已经提到,常规体检用到的一些蛋白指标(酶类),属于这类标志物。用于检测这些标志物的样品如血液、唾液易于获得,检测程序也不烦琐,因此,它们得到临床上的广泛应用。近年来, 蛋白质组(proteome)学的发展促进了这类标志物的研究。 糖组(glycome),类似于基因组或蛋白质组,是一个生物体或细胞中全部糖类的总和,包括简单的糖类和缀合的糖类。在糖缀合物(糖蛋白和糖脂等)中的糖链部分有庞大的信息量。一些蛋白的糖基化与疾病有关。某些多聚糖可作为乳腺癌标志物。 除以上类型外,一些代谢组学(metabolomics)的研究结果也被用于生物标志物的研发中。代谢组(metabolome)是指生物体内源性代谢物质的动态整体。理论上代谢物包括核酸、蛋白质、脂类生物大分子以及其他小分子代谢物质。但目前只涉及相对分子质量约小于1000的小分子代谢物质。代谢物(metabolite)的数与量的变化可作为某些疾病的指征。 二. 生物标志物的研究技术与策略 生物标志物的覆盖范围如此之广,其研究技术也是多种多样。几乎所有可用于研究核酸、蛋白质、糖类等生物大分子的技术都能用于生物标志物研究上。 对于核酸类的标志物,例如SNPs, CNVs,microRNAs和lncRNAs等,可用测序或基因芯片的等技术检测;对于蛋白、多肽类生物标志物,可以采用的技术有质谱分析(Mass Spectrometry,MS)、高效液相色谱分析(High Performance Liquid Chromatography, HPLC)、液质联用(LCMS)、双向电泳(Two-Dimensional Gel Electrophoresis, 2DGE)以及蛋白芯片等;对于代谢组和糖组类生物标志物,也可采用上述的一些技术。图1 显示了生物标志物研究的常用技术。 生物标志物的研究策略,可分为两类:基于假设或某个理论的策略(功能候选策略)和不基于假设而基于数据的策略(组学策略)。前者基于已知的病理生理学过程或已知功能的关键分子,评估功能可能与之相关的候选基因及其产物在疾病(变异)样本和正常样本中的差异,有时还检测变异与疾病严重程度的相关性。这一策略假设了功能相关的分子,并将其作为候选对象进行考察、验证。它只能在较小范围内发现标志物。组学策略不从特定基因或功能入手。这种策略通过分析不同状态的生物样品产生的大量数据,发现某一模式后再将它与功能途径联系起来。该策略可在大范围内发现标志物,但有时候研究结果假阳性较多,重复性差。有人建议两种策略应结合起来使用。 图1. 用于生物标志物研究的一些技术 三. 高通量组学技术在生物标志物研究中的应用 进入本世纪以来,生物芯片、新一代测序等高通量技术快速发展和成熟,极大地助推了生物标志物的研究。这些技术,不但可以发现某一基因或其表达产物的变异,也可以在整体层面上提示基因间的相互作用、基因间的功能关系。许多与遗传有关的人类复杂疾病的发病涉及了不止一个基因功能网络。如果每个网络由各自的生物标志物代表,那么,这些标志物的组合(biomarker panel)则可以更加客观地反映出复杂疾病的状态。组合式的生物标志物兼顾了检测的敏感性和特异性,在检验结果的重复性方面也更胜一筹。转录组学、蛋白组学、代谢组学等组学技术的发展带动了这一类型标志物的研发。 上海伯豪生物技术有限公司作为高通量组学技术服务的供应商,见证和参与了多种疾病诊断新型生物标志物的研究。 2011年,公司协助相关研究团队使用Agilent microRNA芯片对肝癌患者、肝硬化患者、慢性乙型肝炎患者以及正常人群的血清血浆microRNA表达谱进行了研究,筛选出15个明显差异表达的microRNA,用RT-PCR的方法进行验证,最终建立了一个包含7个microRNA的panel,用以区分肝癌患者和其它对照人群。这项研究成果对于肝癌的早期诊断和治疗有重大意义。2010年,伯豪公司与合作单位利用Agilent芯片平台,在几万个基因中发现了一个对肿瘤有举足轻重作用的基因——SCARA5,该基因可作为一个有开发潜力的标志物,用于肝癌的新型诊断和治疗。这一研究成果受到国际同行的高度评价。 除上面提到的基因芯片技术外,高通量的新一代测序技术、蛋白芯片技术以及多种验证技术,在复杂疾病的生物标志物发现过程中也显示出巨大的优势,这也是上海伯豪在多年的技术服务过程中所感受到的。 四. 生物标志物研究面临的挑战和希望 生物标志物的重要意义目前主要体现在医药方面。发现一种有效的疾病生物标志物,其社会意义和经济价值有时不亚于开发出一种新药。生物标志物的应用使得分层医学(stratified medicine)和个性化医疗成为可能。这些新的医疗模式缩短了新药申报周期,节省了药物研发的费用,在治疗上更有针对性,也为患者省去了不必要的开支。基于生物标志物检测的靶向疗法为肿瘤和一些遗传性疾病的治疗带来了希望。医药学界和不少药物研发机构投入了巨资用于新型生物标志物的研发。 高通量技术的出现,以前所未有的力量加速了生物标志物研究数据的产出。有关生物标志物的研究项目和文献报道日益增多。但在巨额投入下展现的一个事实是,目前真正可用于疾病诊断的敏感而特异的单个的生物标志物仍然不多。组合式的生物标志物提高了敏感性和特异性,但有时检测结果在不同人群中的重复性不理想。原因除了在于检测技术的差异和数据处理方式的不同外,还在于病人遗传背景的不同。有些疾病,不同个体之间的生物标志物基础值差别较大,在检测结果阳性和阴性的判断上带来了问题。如何在海量的数据中挖掘出有意义的信息并用于生物标志物的研发,如何才能更准确地推出有临床意义、经得起临床验证的生物标志物,确实是相关研究面临的一大挑战。但有理由相信,随着检测技术的进步、更理想的统计分析方法或算法的推出、更大容量更全面的病例样本的使用以及人们对生命活动细节认识的不断加深,越来越多的、理想的生物标志物将被发现并且在临床实践中得到应用。 总结 生物标志物是精准医学实施的有力工具。它涵盖的类型多,范围广。目前,高通量组学技术在生物标志物的研发中得到了广泛的应用。应用高通量技术研究生物标志物,不乏挑战,但这类研究仍然充满希望。 |