DNA是遗传信息的主要载体,是生命奥秘的根本。而DNA合成则是人类探索生命奥秘过程中的必要工具。传统的柱式DNA合成技术能够适应一些小规模的科研场景。但如果深入到基因组层面,即使是最小的病毒基因组,也有几十Kb的长度,常见模式微生物大肠杆菌的基因组更有约4.2Mb的大小。如果使用传统的柱式DNA合成法来制备,这些最简单的基因组的制备成本就动辄数百万元。 应对于更复杂的DNA合成需求,高通量原位DNA合成技术逐渐进入人们的视野。DNA合成技术的高通量化正如电子计算机当年经历的小型化过程。如果没有光刻机和大规模集成电路制造技术,电子计算机可能今天仍然深藏于象牙塔中,无法在各领域发挥关键性作用。 那么,能够推动生命奥秘探索的“高通量原位DNA合成技术”究竟是怎样的呢?这一产业又将如何实现国产化?本文梳理了DNA合成技术的发展过程,并对产业的未来发展进行了预判。
DNA的生物合成和化学合成 生物体内的DNA合成是通过DNA聚合酶进行的,DNA聚合酶可以合成与模板链完全互补的DNA链。DNA生物合成的优点是速度快、条件温和、错误率低,人们利用这个原理发展了PCR技术,可以快速廉价的得到DNA链。但DNA生物合成依赖模板链,只能从已有的生物基因组中获取模板,合成互补的DNA链,却无法在没有模板的情况下,从头合成全新的DNA链,因此不能满足合成生物学和DNA存储的需求。 化学合成法曾在很长一段时间中成为直接合成DNA的主要方法。DNA化学合成基于固相化学合成的原理。固相化学合成的思路最早应用于多肽合成,性能突出,后续也广泛用于核苷酸和多糖的合成。发明人Merryfield因这一技术获得了1984年诺贝尔奖。 DNA化学合成由多个反应循环组成,单个循环主要包括脱保护、偶联、加帽、氧化四个步骤,循环地将合成载体上被保护的DNA链末端脱去保护,连接一个新的被保护的核苷酸单体,DNA链长加一。合成过程中多余的原料和杂质留在溶液中,而产物则保留在固相的载体上,因而不需要每步反应都进行纯化,特别适合长链生物大分子的自动化合成。DNA化学合成不需要模板,可以按需合成DNA链,但由于有机合成反应并不完全,如每循环合成效率为99%,则合成长度为100的DNA链,最终产物的得率只有0.99^100,即36.6%,因此DNA化学合成得到的链长往往小于生物合成。 图1:DNA固相化学合成(亚磷酰胺法)原理(图片源自网络) 利用DNA固相化学合成技术,可以在每个反应器上合成一条DNA,但由于化学合成的效率没有生物合成那么高,得到的DNA链长度通常不能超过200碱基。目前业界基于固相合成原理的柱式DNA合成仪(图2),通过柱式反应器进行DNA合成,借助工业自动化技术,可以同时控制192或者最多1536个反应器进行同时合成,即192或者最多1536条DNA链的合成通量。但限于反应器的尺寸,合成通量实际上已经达到了极限。如果仅用这个技术来进行大基因组合成,仍然如同步行环游世界一样困难重重。因此,DNA固相化学合成与合成基因组之间巨大的技术鸿沟,还需要用巧妙的方法来填平。 图2 柱式DNA合成仪。常见的有96*2=192通量,可控制192个柱式反应器合成。但由于反应器物理尺寸有限制,384*4=1536实际已经是这类仪器的通量极限。(图片源自网络) 高通量的“控制开关” 半导体行业中曾经遇到过类似的瓶颈。1938年人们发明了晶体管,并在1950年前后掌握了PN结的工作原理。一个晶体管就如同一条化学合成的DNA短链,不能发挥很大的作用,而利用光刻机、掩模板和光刻胶,人们可以在硅片的不同区域刻画出不同的图形,使得一些区域被暴露参加化学反应,另一些区域被光刻胶等保护起来不参加化学反应,通过这样的高通量“控制开关”,就可以在硅片的不同区域分别加工出微小的PN结、导线、电阻、电容等,最终制造出功能强大的CPU等芯片。信息产业摩尔定律式的飞速发展,证明了高密度集成芯片能极大降低电路成本和极大提高集成度。光刻机和芯片对信息产业的发展起到了飞跃性的提升效果。 因此,基于同样的思路,只要把大量的DNA化学合成位点集中在一个表面上,再设计合适的开关机制,自动控制表面上成千上万个合成位点的打开和关闭,使得反应按需地在特定区域进行,就可以制造出真正意义上的高通量DNA合成芯片。高通量DNA合成芯片在芯片大小的表面上可以同时进行数以万计甚至更多的DNA合成,合成成本比常规合成降低了几个数量级。尽管得到的每种DNA产物也比常规合成也降低了几个数量级,但在获得初始产物后,接下来就可以利用廉价高效的PCR技术对初始产物进行大量复制,大幅降低扩增成本。因此利用高通量DNA合成技术,实际可以把DNA从头合成的成本降低几个数量级。 而高通量DNA合成技术和装备使得低成本的合成生物学、DNA存储等变得可行,使得深刻认识、改造生物体成为可能。实际上,因为高通量DNA合成装备的这一重要性,目前在市场上几乎只能采购DNA合成服务,而高通量DNA合成设备却无法购买。
高通量DNA合成的技术路线 高通量DNA合成仪器目前较为成熟的技术路线主要有三种:光化学法、电化学法、微液滴法。 光化学法是美国Affymetrix公司(现已被Thermo Fisher公司收购)最早应用,以光做为反应开关。利用多组光掩模遮挡紫外光,使得芯片不同局部在不同时间经光催化产酸,脱去DNA单体的保护基,从而连接上不同的DNA单体。但光催化反应效率稍差,难以获得很长的DNA链,除固相杂交基因芯片外,目前应用较少。 图3 光化学方法高通量DNA合成(图片源自网络) 电化学法是美国CustomArray公司(现已被GenScript金斯瑞公司收购)最早应用,以电流为反应开关。其芯片上集成了高密度的电极阵列,每个电极可以独立控制,电极通电时可产酸,脱去DNA单体的保护基,连接DNA单体。该方法合成DNA质量优于光化学法,但合成时芯片全部浸泡在反应液中,局部产生的酸仍有可能因为扩散而影响相邻区域,实际效率不如微液滴法。 图4 电化学法高通量DNA合成(图片源自网络) 微液滴法使用特殊设计的微液滴发生装置在芯片上产生微小液滴,通过空间隔离方式来控制反应,目前美国Agilent公司和Twist公司通过定制的喷墨打印装置实现了这一方法。每个反应位点可以按需在不同的时间点提供反应液的微液滴,故而每个反应位点之间都是物理隔离的,不存在交叉污染的可能性。因此这种高通量合成方法制备的DNA质量最好,目前应用最为广泛。但是精确独立控制大量微液滴内的合成反应,对芯片制造、微液滴、控制与反馈、软件系统等都提出了很高的需求,其研发需要横跨多个专业领域,技术壁垒也最高。 图5 微液滴法高通量DNA合成(图片源自网络) 全球资本市场对于微液滴法高通量DNA合成设备表现出了很高的期待。2018年10月Twist上市时,发行价才只有每股14美元,在至今不到3年的时间内,Twist的股价最高曾到达过214.07美元的高峰,企业市值达到百亿美元级别。国内也有多家NGS企业与Twist达成了合作,虽然这些合作分布于不同的具体场景中,但是达成这些合作的基础,都在于Twist领先的高通量原位DNA合成技术。 目前,基于前述三种原理之外的高通量合成设备,市面上尚未出现,但在科研阶段还有一些有意义的探索。有学者利用DNA连接酶实现了酶促的无模板DNA合成,其原理本质是将酶和核苷酸连接,构造出可以酶促DNA合成的特殊单体,可看作是固相合成的一种变形。该方法目前仅停留在实验室水平,成本甚至远高于传统柱式合成,而柱式合成比高通量合成的成本高出几个数量级,暂时看不到其应用于高通量合成的商业可行性。 另一种可能性是使用组合化学进行高通量DNA合成。其原理是每循环将DNA合成载体分成4份,分别放入4种亚磷酰胺单体中连接不同单体后,再把载体重新混合起来。根据排列组合,n个循环得到的产物共有4^n种。这种方法原理和控制简单,但冗余的产物太多,绝大多数的产物是无用序列,需要配合一系列方法从中筛选少量有用产物。
高通量DNA合成设备的国产化进程 近年来,国内生命健康领域发展迅速。高通量测序在疾病筛查、农作物检测、法医鉴定等场景的应用已经普遍开展,并且呈现出向上的发展势头。可是,这些应用源头的检测试剂中使用的DNA探针,仍然基本依赖于国外进口,国内厂商仅能开发传统柱式DNA合成仪,其由于前述的成本在数量级上劣势,仅能应用于低端的DNA引物市场。 杭州原合生物是首家独立掌握研发微液滴法高通量DNA合成仪器技术的国内厂商。创始人蔡万世博士曾研发出探针杂交、多重PCR两套独立自主知识产权的基因捕获技术,深刻体会高通量DNA合成技术对于基因行业的必要性;创始人郑晖博士具备多学科综合背景,曾成功研发包括固相化学合成微流控芯片和自动化合成仪在内的多种仪器,是国内为数不多具备高通量合成装备相关经验的专业人士之一。 研发团队迎难而上,历经数年艰苦攻关,突破了合成工艺、控制系统、芯片加工修饰等多重难题,采用微液滴方法在芯片上成功地原位合成DNA。目前首款合成芯片已经可以一次性合成6200条DNA,合成密度可以达到每平方毫米150条DNA以上,合成DNA长度>80nt,均一性好,单条DNA产量约0.5fmol,合成错误率小于1%。仪器性能已经可以初步满足基因测序、基因合成等高通量DNA的主要应用场景。预计在年内,即可达到合成通量在10万条以上,合成长度>150nt的技术水平,从而实现国产高通量DNA合成设备的技术突破。 图6 杭州原合生物高通量DNA合成芯片的产物均一性测序结果 国产高通量DNA合成设备的应用生态 国产高通量DNA合成设备能够极大降低DNA的合成成本,有望提高国内生物产业的竞争力。目前国内的高通量DNA合成应用已经非常繁荣,相关领域的前景逐渐明朗。健全的应用生态将进一步促进这一技术装备不断迭代,缩小与最先进设备的差距。 一方面,高通量DNA合成正在推动现有技术升级。 高通量合成助力寡核苷酸池相关应用 寡核苷酸池(oligo pool)被广泛用作各种探针库。例如,遗传病筛查服务中经常使用杂交探针捕获兴趣片段用以测序。为了达到整个人外显子组的覆盖,通常需要合成百万条目的oligo探针。如此规模的探针库,以高通量合成的方式来构建显得十分合适。另外,针对某些兴趣区域而特别订制探针库也将变得更为容易。这似乎为定制化的测序筛查服务提供了方便。 除此之外,寡核苷酸池也常用于各种功能筛选库的构建,如靶向定制基因集的CRISPR gRNA文库,用于功能筛选的基因突变体文库,抗体库等。随着高通量合成的普及,这些手段或将成为验证和发掘生物功能的“常规手段”。 以极低成本合成基因,助力合成生物学行业发展 由于化学合成正确率的限制,长链的基因通常是由小片段的寡核苷酸链拼接而成。高通量的oligo合成,间接带来了合成大量基因甚至基因组的能力。因此,合成生物学(synthetic biology)相关领域无疑将收益颇深。 近年来,得益于DNA读写相关技术基础的日益成熟,以及当前时代社会对新生产方式的期待,生命科学研究开始从被动解析向主动创造转变。从格物致知到建物致知,同时知以致用,将基础研究积累的基因功能知识与工程思想结合,通过构造生物系统的方式,解决医药、化工、食品、能源、材料、农业等领域中的实际生产问题。合成生物学被普遍认为是下一次生物技术浪潮的焦点,有望触发未来彻底的产业变革。 目前,国外已有大量合成生物学相关公司相继成立,并出现完整的产业链条。上游提供基因合成,中间平台提供生物系统设计和构建方案,下游完成具体的产业应用。国内行业内也已经显现出相似的趋势。相信国产高通量合成技术的出现,也有利于合成生物学相关产业的振兴。 另一方面,高通量DNA合成也在孕育新兴应用场景。 除了现有技术的升级,DNA合成能力的飞跃有可能“破圈”,实现生物行业以外的应用。比如,DNA天然可以作为4进制的存储介质(A/T/C/G),并拥有信息密度高,存储时间长等优势。在数据量爆炸的世界,如果能进一步大幅压缩每碱基的合成价格,DNA存储也将不失为一种很好的信息存储方式。
我国已经是一个制造大国,但要成为制造强国,还必需在一些尖端制造装备技术上实现突破。高通量DNA合成装备集合了科学仪器、化学制剂等领域多项关键核心技术,关系到生物行业一系列下游技术领域的发展,其重要性不言而喻。杭州原合生物预期在7月份举行交流发布会,届时将进一步介绍其研发DNA高通量合成装备和数据。作为服务方,杭州原合生物将与广大科研院校和生物产业的同仁一起,为构建自主自强的民族产业链不懈努力。 |