突破起点:Sanger 测序奠基生命密码解读1977 年,Frederick Sanger 开发的双脱氧核苷酸终止法(Sanger 法),为基因测序铺就基石,开启人类系统性解读生命密码的序章。 技术原理:在体外 DNA 复制时,利用双脱氧核苷三磷酸(ddNTP)的特殊结构。ddNTP 在脱氧核糖的 3’位置缺失羟基,能通过 DNA 聚合酶作用融入合成的 DNA 链,却无法与 dNTP 形成磷酸二酯键,使 DNA 链延伸终止。 操作与优势:将待测 DNA 模板、DNA 聚合酶、dNTP、引物及带有荧光标记的四种 ddNTP 混合进行 DNA 合成反应。DNA 聚合酶依模板指引,从引物延伸 DNA 链,ddNTP 与 dNTP 竞争性掺入,生成以特定 ddNTP 收尾的不同长度 DNA 片段。经电泳分离按长度排序,检测荧光标记确定片段末端碱基,推断 DNA 碱基序列,其准确率高达 99.99%,是当时最可靠的测序方式。 里程碑成果:1980 年,噬菌体 X174 的全基因组(5375bp)通过 Sanger 法完成测序,这是人类首次成功破译完整生物体基因组全序列。1990 年启动的人类基因组计划(HGP),前期主要依靠 Sanger 法,历经 13 年、耗资 38 亿美元完成首个人类基因组序列,被视为生命科学领域的重要里程碑。 局限性:Sanger 法通量较低,单次测序只能读取 700 - 1000bp 的碱基序列;成本高昂,达到 1000 美元 /kb,大规模测序工作面临时间与经济成本压力,亟待新技术突破。 高通量革命:第二代测序崛起为突破第一代测序技术瓶颈,2005 年后,第二代测序技术应运而生,开启高通量测序新时代。 罗氏 454 测序技术:采用焦磷酸测序法,将基因组 DNA 打断成小片段,连接接头后与磁珠结合,在油包水体系中进行 PCR 扩增,每个磁珠上扩增出大量相同 DNA 拷贝。将磁珠放入 Pico Titer Plate 板中,多种酶协同作用下,引物与链模板结合,dNTP 按互补配对原则添加延伸 DNA 链,释放焦磷酸(PPi)。PPi 与腺苷 - 5'- 磷酸硫酸酐(APS)反应生成 ATP,ATP 驱动荧光素酶催化荧光素氧化产生荧光信号,检测荧光强度和顺序确定 DNA 序列。该技术实现单次百万级 DNA 片段并行测序,通量较 Sanger 法提升千倍。 illumina 的 Solexa 技术:2006 年推出,采用桥式 PCR 结合边合成边测序方法。DNA 片段两端连接不同接头,固定在 Flow Cell 表面,与表面引物杂交形成 “桥” 状结构后进行 PCR 扩增,形成大量 DNA 簇。边合成边测序时,反应体系加入带有可逆终止基团和荧光标记的 dNTP,DNA 聚合酶每次添加一个 dNTP 后,通过激光扫描检测荧光信号确定碱基种类,去除终止基团和荧光标记后继续反应。Solexa 技术读长可达 250 - 300bp,成本降至 0.01 美元 /kb。 SOLiD 技术:2007 年推出,运用连接酶测序。将基因组 DNA 打断成小片段,两端连接接头形成文库,与磁珠上的引物杂交,在连接酶作用下,用 8 碱基长度的荧光探针进行连接反应。探针第 1、2 位碱基对应特定荧光颜色,通过双色编码纠错机制提高测序准确性。每次连接反应后检测荧光信号确定碱基,切除探针 3' 端 5 个碱基进行下一轮连接。SOLiD 技术准确率达 99.94%。 影响与局限:第二代测序技术使全基因组测序成本大幅下降,2014 年降至 1000 美元,促进千人基因组计划、癌症基因组图谱等大型科研项目开展,也推动无创产前检测、肿瘤靶向治疗等领域发展。但存在短读长(<500bp)问题,进行基因组组装或分析复杂结构变异时依赖拼接算法易出错,且基于 PCR 扩增可能引入偏好性与错误,影响测序结果准确性和可靠性。 单分子突破:第三代测序登场2011 年,PacBio 推出首款商业化单分子实时(SMRT)测序系统 PacBio RS,开启单分子长读长测序新时代。 PacBio RS 及后续发展:PacBio RS 采用零模波导(ZMW)纳米结构,实现单分子 DNA 聚合反应实时观测。零模波导纳米孔内固定单分子 DNA 聚合酶,孔内四周有荧光标记脱氧核苷酸,形成稳定背景荧光信号。当荧光标记脱氧核苷酸掺入 DNA 链时,特定颜色荧光持续一段时间后被切除,共聚焦显微镜实时记录荧光信号确定碱基序列。2013 年 RS II 系统发布,零模波导数量从 15 万提升至 30 万,酶化学优化,平均读长提升至 5000bp,准确率达 99.999%(Q50)。 2015 年 Sequel 系统推出,采用全新 SMRT Cell 设计,拥有 100 万零模波导,通量提升 10 倍,成本降至 0.02 美元 / 百万碱基。2020 年 PacBio Sequel II 系统完成人类基因组端粒到端粒(T2T)测序,填补 8% 的序列空白。 纳米孔测序技术:以英国牛津纳米孔公司技术为例,核心原理是利用纳米孔蛋白固定在电阻膜上,核酸聚合物在动力蛋白牵引下穿过纳米孔时,因 ATCG 单个碱基带电性质不同,引起电阻膜上电流变化,实时监测并解码电流信号确定碱基序列。该技术具有长读长、设备成本低、测序芯片可再生利用、实时获得序列信息、便携式测序装置、无需 PCR 扩增且能保留原始碱基修饰信息等优势,在新冠病毒实时监测和遗传病快速诊断等方面有应用,但发展初期错误率较高(>5%)。科研人员采用高覆盖度测序和混合测序等策略提高准确性。 创新浪潮:第四代测序迈进近年来,第四代测序技术取得显著进展,为基因测序领域注入新活力。 高端仪器突破:中国广州生物岛实验室领衔研制的 120 千伏场发射透射电镜 TH-F120,由广州慧炬科技有限公司负责生产和商业化运营,2024 年完成首单交付。该透射电镜具备超高分辨率,能直观显示病毒和蛋白质的原子结构,助力发现药物研发靶点,在新一代信息技术领域对半导体芯片检测和工艺改造发挥关键作用,打破透射电镜进口依赖局面,为第四代测序技术微观研究提供有力工具。 人工智能助力:DeepMind 的 AlphaFold3 在蛋白质结构预测方面取得革命性进展,能以前所未有的精度预测 “蛋白质数据库” 内几乎所有分子类型的复合物结构,准确率在基准测试中比现有最好传统方法高出 50%,无需输入结构信息,为药物研发、基因组学研究等领域提供强大助力,开辟测序技术与蛋白质研究结合新路径。 企业技术创新:华大智造的 G400-ER 纳米孔测序仪通过 AI 算法提升准确率至 99.8%;DNBelab C4 实现单细胞分辨率全基因组空间定位,推动肿瘤微环境研究。罗氏计划 2026 年推出基于 SBX 技术的纳米孔测序仪,读长达 Mb 级且无需光学系统。中国企业齐碳科技的 QPrenano-32 和臻熙医学的测序仪进入临床验证阶段,加速国产替代进程,降低测序成本。 推动前沿领域研究:第四代测序技术凭借超长读长、实时监测、无需 PCR 扩增等优势,有望推动单细胞与时空组学研究取得新突破,为生命科学研究向更深层次迈进提供强大技术支撑。 应用场景广泛测序技术飞速发展,应用场景不断拓展,从科研领域渗透到医疗健康、农业与生态等领域,展现巨大应用价值。 医疗健康领域:在肿瘤早筛方面,贝瑞基因参股子公司和瑞基因基于 cfDNA 全基因组测序技术开发的莱思宁灵敏度和特异性分别达到 95.42% 和 97.91%,可提前 6 - 12 个月实现肝癌极早期诊断,还能一次检测筛查中国六大高危癌种。在病原鉴定方面,宏基因组测序(mNGS)无需培养和预设,可全面分析样本中所有核酸,一次测试检测多种病原体,如美国加州大学旧金山分校科研团队研发的 mNGS 技术对脑脊液样本分析的准确率达到 86%。在遗传病诊疗领域,新一代测序技术尤其是三代测序技术弥补了二代测序不足,可检测与遗传病相关的基因突变或染色体异常,帮助制定个性化治疗方案,三代测序技术在罕见病领域的渗透率预计到 2030 年将提升至 20%。 农业与生态领域:华大智造完成 3000 份水稻基因组重测序,挖掘出与耐盐碱、高产等性状相关的基因,为耐盐碱品种培育提供基因资源和理论基础。在水产养殖中,单细胞测序技术可用于研究水生生物的细胞类型和发育机制,为病害防治和品种改良提供新思路。在生态研究方面,illumina MiSeq 平台通过对肠道菌群测序,发现特定肠道菌群在肥胖发生发展中起到重要作用,利用 16S 扩增子测序研究工业大麻在镉胁迫下微生物群落的适应机制,发现特定真菌能提高大麻幼苗抗逆能力。 |