目前全球二代测序的市场已经被illumina、赛默飞和华大基因占据,已经建立了很高的壁垒,其他公司想要在二代测序上有所突破难度很大,因此目前大部分的初创公司都选择进行三代测序的创业。 三代测序是相比于二代测序和一代测序而已,读长更长,相比较传统的PCR和NGS,三代测序有更高的准确性、更全面的变异检测、更加简便的检测等优势。 我们知道,整个人类基因组大概有3G大小的基因序列,其中人类基因编码区仅占整个基因组的2%左右,剩下的非编码区有98%,这部分区域的功能还亟待研究,这部分序列可能与遗传病、肿瘤等的发生也有关联。 如果说二代测序可以检测基因区的一些变异,用于罕见病的诊断、肿瘤的筛查等,三代测序则因为读长更长,还可以应用于98%的非编码区的变异。 而在价格方面,三代测序的成本也将逐步下降,有预测说到2025年底,三代测序和二代测序将几乎平价。 二代测序在进行测序时要把DNA分子进行复制和扩增,发出的荧光信号才能够放大并被光学系统检测到,进行碱基识别。所以二代测序有很高的通量,可以产生庞大的数据,但是读长很短。我们目前定义的三代测序是指单分子测序。 由于各自的特点,由于目前三代测序的成本还没有降下来,所以我们都是用二代测序先做小的变异分析,再用三代测序做大的变异。不过以后三代测序的成本和准确度提高之后,是否会取代二代测序,从理论上应该是会的。当然,在一些ctDNA和液体活检领域,不需要很长的读长,短时间之内二代测序还是有优势的。 第一台单分子测序仪是Helicos,不过它的读长很短,只有30-50个碱基,尽管是单分子测序,但并没有形成市场影响力。一直到Pacbio公司的单分子测序仪上市,不过Pacbio刚上市时虽然改善了读长,但是错误率很高,大约15%,主要是在早期没有成熟的算法、软件和数据库去矫正数据,所以很难真正去应用。 2012年开发出新的算法,可以用二代测序数据去矫正三代测序的数据,后来又开发出可以用三代测序的数据去矫正三代测序,才把长序列变的比较准确。有了长序列就可以开始进行基因组的组装。 2019年Pacbio推出了Sequal系列测序仪,目前读长可以长达20kb,比二代测序增长了上百倍的读长,而且经它的读长很长,准确度也不差,可以达到99.9%,但是通量不高,导至临床应用比较难。 Pacbio把三代测序应用在遗传病罕见病的诊断上,国内的贝瑞基因用的也是Pacbio的三代测序,目前主要在做地中海贫血的基因检测。上个月,贝瑞基因公告,其基于Pacbio三代测序仪Sequal的的SequalII CNDx已经通过了技术检,在报临床诊断的注册证过程中,之后相信还会有更多的扩展。 Pacbio三代测序仪的成本和通量的改善主要依靠增加测序芯片孔的数量实现,早期的芯片一开始从15万个孔,到30万个孔,后来再到100万个孔,目前是800万个孔。按照现在设备的更新周期3-4年一次,一次提高10倍到20倍左右的通量,成本也会降低10倍左右。 随着国家政策的推进,目前illumina一家独大的局面应该会有所改变,毕竟成本还是一个很重要的因素,由于illumina的成本问题,很多公司开始围绕华大智造建立一个生态系统,后续的集采也会对国产测序仪有很好的推动作用。 另一家公司是Nanopore,采用的是纳米孔测序技术,它可以做成一个像手机大小的测序仪,实现便携式的测序,测序界的POCT,移动的测序仪,在任何一个地方都可以进行病原检测。不过纳米孔测序的问题在于数据量很大,对计算的要求很高,目前准确度还差一点,停留在98%左右。不过,随着技术的发展,Nanopore的准确率也越来越高。 目前,很多罕见病的诊断都靠二代测序,检出率大概只有50%,剩下的50%还找不到原因,所以用读长更长的三代测序技术去解决之前读长短解决不了的问题。目前还有大量的疾病是找不到病因的,尤其以遗传性疾病居多,这些都是三代测序的机会。 综合来看,目前三代测序主要分为以PacBio为代表的单分子荧光测序技术和以牛津Nanopore为代表的纳米孔测序技术,Pacbio依靠HiFi测序技术实现了又长又准的读长,而Nanopore则可以测到超过100Kb的序列。 国内三代测序仪的研发也吸引了大量的人才和资本,比如齐碳、希望组、普译、儒翰、安序源、孔确等国内的创业公司,都表现出极大的潜力,不久的未来三代测序将会是医疗行业一个重要的发展方向。 |