Chapter One 开宗明义 /// 长读长测序及其原理 测序技术发展多代,本质是对四种碱基通过不同类型的信号进行检测。一代测序Sanger法读取的是荧光信号;二代NGS测序中,illumina平台读取的是荧光信号,Ion Torrent测量的是pH值的变化。三代长读长测序的典型平台包括了Pacbio和ONT,Pacbio仍是读取荧光信号,而ONT则是通过电信号判断碱基类型。 长读长测序,顾名思义对应二代NGS技术的短读长测序。与短读长打碎再进行拼凑不同,检测长读长片段对整个待测样本的还原更为简易直观。此外,三代长读长测序无需进行PCR扩增,既节约时间,也可避免扩增带来的偏差。 虽同为长读长技术,Pacbio和ONT技术路线还是存在较大差别。故在代际分类时,也有人将先推出的Pacbio路线称为三代测序,将ONT的纳米孔测序路线称为四代测序。 Pacbio技术路线 测序原理 Pacbio采用的测序方式是边合成边测序,其测序芯片SMRT Cell的技术核心为零模波导孔(zero-mode waveguides, ZMWs),每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。 ZMW是在硅基材上覆盖的铝箔上加工的直径约100 nm、高度约70nm的圆柱形孔,其直径远小于检测激光的波长(>600nm),因此下方激光只能照亮ZMW底部约2-30nm而不能穿透小孔进入上方溶液区——只有进入这个范围的荧光染料才会被激发,避免了背景干扰。 测序流程 Pacbio的测序流程如下图所示,需要经历DNA打断、建库和测序几个关键环节。PacBio建库所采用的接头是环状单链,其两端分别与待测DNA双链的正负链相连,可得到一个哑铃型的DNA文库。 图源:安诺优达 制备完成的DNA文库加入测序芯片,通过自由扩散进入ZMW(底部锚定了DNA聚合酶)中,被聚合酶捕获,从而将DNA序列锚定在零模波导孔底部。ZMW中同时包含四种被不同荧光基团修饰的dNTP,当DNA与聚合酶形成的复合物被ZMW捕获后,4种不同荧光标记的dNTP通过布朗运动随机进入检测区域并与聚合酶结合,与模板匹配的碱基生成化学键的时间远远长于其他游离态碱基停留的时间,因而可通过荧光信息存在时间的长短区分匹配的碱基与游离碱基,进而通过统计4种荧光信息与时间的关系图对DNA模板序列进行测序。 测序效果 Pacbio现阶段有CLR和HiFi两种测序模式,其中CLR为超长测序模式(插入片段30kb以上),产生的数据是基于单循环测序的结果,一次插入片段只测序一次,准确度和PacBio常规测序保持一致,在85%左右。 Pacbio哑铃文库可以打开变成圆环型,在测序的过程中周而复始进行多次测序,减少随机误差,提高准确率。这种模式被称为HiFi模式,通常片段在10kb-20kb,多次测序后的准确率可以达到Q30级别,即99.9%,相应地,其成本会有所上升。 ONT技术路线 测序原理 与Pacbio相比,ONT的测序方式更为简洁。纳米孔测序将孔蛋白嵌在绝缘的人工膜上,通过记录DNA或RNA链过孔时产生的电流信号对碱基序列进行检测。其技术核心为通道孔蛋白,其中心由一至二个缩窄区形成数纳米的孔道(限制区),仅可容许单链DNA分子穿过。碱基穿过通道时会引起通道电学性质的变化,4种不同碱基理化性质的差异会导至其穿过纳米孔时引起的电学参数变化不同,检测这些变化可得到相应碱基的类型,进而实现测序。 测序流程 纳米孔测序的流程同样包括了DNA片段化、建库和测序几个环节。其建库要点是给待测DNA两端加上接头,接头具有Barcode和解螺旋(马达蛋白)的作用。建库好的DNA样本在马达蛋白的牵引下结合到孔蛋白上,将双链DNA解开成单链后,DNA单链在电场力作用下通过孔道蛋白。DNA分子停留在孔道时,离子通过会带来电流变化,不同的碱基带来的电流变化不同。基于电流变化的频谱,通过识别算法可得到碱基序列。 测序效果 多年来,ONT对测序化学进行不断改进,其flowcell已经有了多个版本的升级,目前最新的kit达到了单链Q20的准确率,通过duplex双链过孔的方法可实现接近Q30级别的准确度。 总体上,Pacbio与ONT的两条技术路线各有优缺。Pacbio准确率高,但读长相对较短、成本较高;纳米孔测序读长更长、更为便捷,但准确性略显不足。与二代测序相比,目前Pacbio和ONT的测序成本均较高。 Chapter Two 珠玉在前 /// illumina的发展史 illumina成立于1998年4月,于2000年上市。上市初的illumina只有105个员工,盈利似乎遥遥无期。经过20多年的发展,如今的illumina已经拥有超过1万名员工,成长为名副其实的行业巨头。 发展历程 研究illumina的发展历程,illumina的发展转折点主要发生在2006-2008年间。在本世纪初,illumina还是一家聚焦在基因芯片领域的企业,直到2006年才实现第一次盈利。同年,illumina做出了其发展路上的关键选择——收购Solexa,正式涉足基因测序领域。 随后几年,illumina利用Solexa的SBS技术已经对数量庞大的微生物、植物、动物和人类基因组进行了测序。新一代测序(NGS)数据产出增加的速度超过了摩尔定律——每年增长一倍以上,基因组测序的成本也从1千万美元迅速降到了1千美元。 现如今,illumina就像是测序领域的Windows系统,是机构眼中不会出错的选择。截止2022年,全球90%以上的测序数据由Illumina的仪器产出,illumina的年收入已经突破45亿美元,俨然是测序行业的绝对标杆。 发展特色 illumina是一家具备鲜明特点的公司,其发展路径被诸多Biotech企业津津乐道。概括illumina的发展历程,不难发现:技术、产品与商业模式相辅相成才能成就一家伟大的公司。 技术 illumina无疑是一家技术领先的公司。在illumina平台推出之前,最初的一代测序需要斥资数十亿美元、耗费3年的时间才能完成人类基因组的检测。Solexa平台的“边合成边测序”技术,通过在Flowcell上快速扩增富集信息,再通过可逆阻断技术实现每次只合成一个碱基、并激发荧光基团捕获碱基信息。这种技术大幅降低了测序的成本和检测的时间,还可以保持较高的准确性。 下图比较了2017年时几个主要测序公司的平台,可以看出虽然在读长上存在一定不足,但在操作时间和产生数据量上illumina遥遥领先,体现了其在技术层面早早确立的优势。 Next-Generation Sequencing in Oncology: Genetic Diagnosis, Risk Prediction and Cancer Classification. Int J Mol Sci 产品 先进的技术需要依托符合用户需求的产品才能被大规模使用。自2010年推出HiSeq2000平台以来,illumina保持着“年更”的频率,持续进行产品的更新迭代,实现了仪器高中低通量的全覆盖。到目前为止,illumina累计装机量已经超过了2.3万台。 在仪器和芯片处理能力不断提升的情况下,illumina的测序成本也在快速下降。2010年推出的HiSeq2000平台将全基因组测序成本降至1万美元;2014年将基因组测序成本降至1,000美元;在2017年,推出了NovaSeq,再次将测序速度翻倍、成本减半,距100美元的基因组检测更进一步。 illumina业务精简,核心主业聚焦在高通量生物芯片检测仪、高通量测序仪及定量PCR仪,这有助于illumina保持产品打磨的精细度,持续推出符合用户诉求的产品。 商业模式 对于检测系统,最重要的组件便是仪器和耗材,仪器进入检测机构后,试剂耗材的消耗可以产生源源不断的收入。illumina通过自研和并购双管齐下稳固业务,前期夯实平台能力,后期拓展应用方向。 在收购Solexa、通过仪器升级建立优势后,illumina开始在应用端发力。2013年,illumina完成了对Verinata的收购,其聚焦于繁殖和遗传健康;2020年,illumina宣布了对Grail的收购,虽然这笔交易还未完全尘埃落定,但也体现了其对进一步拓展应用的雄心。 此外,illumina在全球各地和合作伙伴建立合作关系,在NIPT、肿瘤、遗传病检测等领域开展了广泛深入的合作。illumina还成立了风投基金Illumina Venture,通过股权与更多上下游企业绑定,建立了自己的生态圈,不断巩固作为先发者的优势。 Chapter Three 风自何来 /// illumina未触及的机会 随着越来越多的新进入者加入测序行业,谁可以成为illumina的挑战者也成为了大家讨论的热点。illumina留有哪些未曾覆盖的机会,Pacbio和ONT又是否足以把握住呢? 应用领域角度 目前,整个测序市场的渗透率还比较低。在2023年的JP Morgan上,illumina重申了对测序领域广阔前景的信心,这个庞大的1,200亿美元的市场,当前渗透率仅有7%。在科研应用、肿瘤检测、遗传病检查、生殖健康等领域,测序技术都大有可为;其中肿瘤检测的预期市场规模最大,可高达780亿美元。 虽然illumina如今已经在155个国家拥有了超过9,500名用户,并持续在全球各地与合作伙伴开展临床试验、获得临床认证,但根据其芯片消耗情况,illumina的终端市场仍然是科研市场占比较高(55% vs 45%)。测序行业理论上还处于上半场。 科研层面,三代测序可以实现基因组的T to T检测,更适合进行基因组组装、发现新物种等。相比二代测序主要聚焦于基因的片段,三代测序对测定染色体结构变异、进行全基因组测序、检测表观修饰等领域都具有优势,纳米孔测序还可直接检测RNA。长读长提供的更多信息有助于在科研市场打开新的领域。 临床市场上,illumina的主要应用领域为肿瘤、NIPT和遗传病。其中,NIPT领域二代测序已经建立了较强的优势,预计三代测序难以撼动。Pacbio平台凭借其较高的准确率开始向遗传病领域发展,根据贝瑞的信息,其已经在Pacbio平台上开发了地中海贫血、脊髓性肌萎缩症、先天性肾上腺皮质增生症等疾病的检测。ONT则通过新冠在病原体检测领域进行了快速积累,2022年其新冠业务收入超过了5,000万英镑;2021年,ONT也成立了子公司Oxford Nanopore Diagnostics,专注诊断领域的开发。 对精准治疗的明珠——肿瘤检测市场,三代测序也具备一定优势。基因层面对肿瘤的判别主要基于点突变和甲基化,二代测序在寻找点突变方面可以满足使用,但无法直接检测甲基化修饰。Pacbio可通过DNA聚合酶合成序列时,时间和信号强度形成的脉冲信号的差别,对甲基化进行鉴定;ONT则可直接检测甲基化碱基的差异电信号。三代测序还可以检测复杂的基因组变异、染色体结构变异等,收集更全面的癌症基因组信息。目前两个平台均在增强甲基化检测产品的开发,ONT更为积极,推出了自适应采样靶向测序和Remora算法,可综合检测全面的甲基化表征。 临床市场对于成本、时效、准确度方面的要求均要高于科研市场,两条典型路线均存在一定的欠缺——Pacbio成本过高、通量较低,ONT则是准确度不足,所以此前二者均没有大举进入临床市场。但2022年,Pacbio和ONT均针对各自的不足推出了最新的产品,下文将对其产品和业务模式做进一步分析。 业务模式角度 长久以来,illumina的主体用户集中在LDT、大型医院及机构中,这些用户可以支付起高昂的设备成本,并且也有着大量的检测需求。illumina的设备中,通量最高的NovaSeq系列售价可以达到98.5万美元,但其测序成本也可低至4.8美元/Gb;通量最低的iSeq装机成本仅有1.99万美元,但测序成本高达521美元/Gb。 我们都知道,illumina降低测序成本的主要方法是增加芯片的通量,提高单张芯片的检测能力。NovaSeq将成本降至10美元/Gb内是以大量样本为基础的,这种体量的仪器只有满负荷运行时才具备经济性。此外,illumina的测序流程也总体较长,从样本制备、文库构建到上机测序、文库分析,全流程需要经历多个工作日,且对人员的操作要求高。高成本和复杂的流程将能力有限的科研用户和临床用户拒之门外,他们不得不采用送检的模式满足需求。一方面,获取结果的链条拉长、信息不够及时;另一方面,尤其在临床角度,检测过程院方无法把控,使得很多LDT结果对临床只能起“参考”作用。 (根据JP Morgan Presentation整理) 综合来看,illumina的商业模式更聚焦需求量大、支付能力强的“高端”用户。但梳理其近年来的装机情况,即便测序成本相差十倍以上,illumina低通量的入门机型的存量和增量均显著高于高通量和中通量机型。illumina全球装机接近的22,850台设备中,约有14,280台为低通量的MiSeq、MiniSeq或iSeq机型。可见,依然有大量的用户有着使用测序平台的需求,但无法被illumina当前的业务模式较好服务。 2022年,illumina产生了45亿销售收入,与2021年几乎持平;其中被定义为常规业务的耗材和服务带来的收入超过了80%,这一数字在2021年也接近80%。这意味着illumina或将进入新的发展阶段,更依靠丰富应用菜单、销售耗材来带动销售。而illumina模式无法触及或较好服务的客户,就是其他测序平台的机会。 Pacbio illumina和Pacbio都有着“重资产”的业务属性,前期业务发展依靠装机驱动。2011年推出首款商业化产品后,Pacbio也保持着一定的更新频率,近年来速度明显加快,2019年推出Sequel II,隔年推出了Sequel IIe,2022年又发布了最新的Revio平台。 2020年,Pacbio重新组建了内部高管团队和销售团队,吸纳了许多illumina的资深人士,在2021年取得了销售业绩的重大突破,新增装机171台,耗材销售增加一倍以上。但步入2022年,Pacbio业绩增速放缓,新增装机为138台,芯片的消耗量同比增加为24%。整体2022年的收入中,约46.88%为耗材收入;而同年illumina和ONT的耗材收入占比均大于65%。虽然年内新装机的设备不会产生立竿见影的芯片销售,但与2021年近乎翻倍的芯片销售相比,2022年的耗材销售并不理想。这带来了一个担忧,目前用户对Pacbio平台的使用很可能是不饱和的。 2022年中,Pacbio发布了最新的Revio平台,通过增加ZMWs的密度和增加SMRT Cell的数量,双管齐下地将测序通量提升了15倍,从而也把人类基因组的测序成本降低至1000美元内。不过,Revio通量的提升放大更多来自于芯片堆积(4个SMART Cell并行),而ZMWs的密度增加仅有3倍多、略不达预期。 Revio平台上市3个月内收获了来自43个客户的76台预订,并在2023年3月完成了首台Revio的装机。不过,Revio平台高售价(78万美元,是Sequel IIe的两倍)、高通量特点,还是聚焦在大批量客户,与illumina的客群重叠度较高。 笔者认为,对于Revio的前景还是应当谨慎乐观,超过半数Pacbio平台是在过去两年装机的,对于老用户来说面临着新旧设备的取舍。需要密切关注Pacbio在2023年全年的装机量、单台Revio产生的芯片消耗量,评估Revio是否可以让Pacbio平台的使用更“饱和”。 Oxford Nanopore 与其他企业推出的“庞然大物”相比,ONT的设备小巧轻便。创立至今,ONT主打轻资产路线,通过推出各种低价Starter Packs拓展客群。其MinION像优盘一样大,起售价只需要1000美元。毋庸置疑,这极大降低了测序仪的使用门槛,提高了可及性。 就在本周,ONT发布了2022年的财报。2022年ONT的生命科学LSRT业务实现销售收入1.47亿英镑,其中耗材收入的占比超过了65%,是当年业绩的主要驱动因素;同时,LSRT业务的综合毛利率达到了56.3%,与上年比提高了2.5个百分点。从财务表现上看,ONT目前的商业运作更为成功。 2022年底,ONT的活跃客户超过了8,200个,当年新增量超过1,900个。ONT将客群按照单用户年产出分为了S1、S2和S3三个档次,分别对应低中高单用户。S1为年产出低于2.5万美元的用户,占据了ONT全部用户的87%。2022年,三类用户数量的增速旗鼓相当;单用户平均产出有一定下降,但均在10%内,总体上ONT目前的拓客较为稳步快速。 准确性一直是ONT最被诟病的因素。早期在单链过孔的情况下,ONT的准确度与Pacbio的CLR模式接近。Pacbio通过环状测序的方式提高了准确度,而ONT由于专利问题只能采用其他方法。多年来,ONT一直在通过不断改良测序化学和算法,最新推出的Kit准确度可达到>Q20,这将进一步拓展ONT测序平台的应用。同时ONT也开发了Duplex双链过孔的方法,可以达到接近Q30准确度的水平;但目前能实现双链过孔的比例还不高,这将提升Q30数据的成本。未来,Q30级别数据的性价比对于ONT的应用推广至关重要。 小结 技术原理和特点使得不同测序技术适用的细分领域不同,预计短中期内,三代测序的主要市场仍在科研领域、逐步渗透临床市场,主打与二代测序的差异化应用。 现阶段,ONT的商业化态势略优于Pacbio,客户基数、客群特征、收入结构更为积极,更有希望提升测序技术的可及性。2022年,Pacbio和ONT均针对各自的不足推出了新的产品,但产品迭代难以一蹴而就,其发展前景仍需观望,长读长测序平台的产品升级也远没有结束。 Chapter Four 步履不停 /// 持续行走风才会迎面吹来 人们戏称一款优秀的测序平台需要具备的几个要素是“多快好省”。多是要产生足够多的信息,快是测序流程简洁、测试速度快,好则是数据质量好、准确性高,省顾名思义是指成本低。二代测序和三代测序企业都在不断改进以接近用户诉求。 |