基因测序全产业链划分为上游的测序仪器与试剂耗材市场,中游的基因测序服务市场和下游的生物信息学分析市场。中下游市场面向群体包括医院、药厂、科研机构以及消费者等,可分为医疗和非医疗两个领域。
图10. 基因测序全产业链及应用
医疗领域可分为人体基因组和人体微生物基因组两个子领域。针对人体基因组的主要产品有肿瘤学(诊断筛查与治疗、靶向用药、伴随诊断等)、生育(无创产前诊断、胚胎植入前检测、新生儿遗传病排查、亲子鉴定等)、遗传学疾病和新药研发指导等。目前人体微生物基因组与宿主健康的关系也已被重视,如2007年和2008年,美国国立卫生研究院(NIH)和欧盟先后启动了人体微生物组计划(HMP)和人体肠道宏基因组计划(MetaHIT),可通过分析人体微生物基因组检测宿主的肠道疾病、神经系统疾病、肝病、糖尿病、肥胖以及腹腔肿瘤等。
在非医疗领域中,可以通过环境微生物基因组研究治理环境污染的新方法、探测石油存储和地质学研究,也可以用于农牧业配种和司法鉴定等。本篇报告主要讨论基因测序在医疗领域中针对人体基因组的应用。
1. 欧美公司垄断测序仪器与耗材市场
■ 二代测序是目前主流测序技术,Illumina占最大市场份额
测序技术是测序仪器的核心所在,迄今为止已历经四代发展。其中主要的是前三代测序技术:第一代测序技术,即Sanger测序技术;第二代测序技术是当今主流技术,主要有Illumina公司的Solexa和HiSeq技术,Life Tech公司的Solid技术和Roche的454技术;第三代Pacific Biosciences公司的SMRT测序技术。第四代测序技术正向着测序仪器体积更小的方向发展,如Oxford Nanopore Technologies公司的MinIon纳米孔单分子测序技术。
[url=]
[/url] 图11. 测序技术发展史
二代测序技术凭借通量大、精度高、价格相对低廉等优势,已成为目前主流测序技术。由于专利保护力度大和技术门槛高,二代测序仪器制造市场壁垒较高,已被欧美公司垄断。主要公司有Illumina, Life Tech(被Thermo Scientific以136亿美元收购)和Roche。其中Illumina凭借其超高通量和相对较长读长的优势,占有超过70%的市场份额。
[url=]
[/url] 图12. 二代测序仪器市场份额
■ 三四代测序技术10年内凭借超长序列读长取代二代测序技术
我们预计10年后二代测序技术会被三、四代测序技术所取代。各代测序均有不足之处,一代测序的主要缺陷是低通量和高成本,二代的缺陷是序列长度较短,三四代测序在准确率方面有严重缺陷。由于NGS技术面临的短序列缺陷可以通过生物信息学工具在一定程度上进行弥补,因此二代测序技术是现今最稳定,应用范围最广泛的测序技术。但目前科学家正在通过减缓DNA序列通过纳米孔速度的方式提高第三代测序的准确度,相关成果已发表在《Nature》子刊。我们预计10年内三、四代测序的准确度将会显著提升,届时将在保证测序通量的基础上,凭借着超长序列读长的优势取代二代测序。
[url=]
[/url] 表3. 四代测序技术重点参数比较
2. 基因测序服务市场百家争鸣,积极向上下游延伸
目前全球有上千家厂商提供测序服务,中国有超过200家。美国拥有全世界最多得测序仪,中国测序仪数量不超过500台。随着市场对测序的需求不断提升,中游市场提供测序服务的对象包括医院、疾控中心、科研机构等,提供包括用于无创产前诊断、肿瘤诊断与治疗、遗传学诊断以及辅助生殖等相关的基因测序服务。
[url=]
[/url] 图13. 全球测序仪器数量分布
我国测序服务提供商积极地向产业链上游延伸。国内在测序仪器市场的开发策略分为两类:
(1)第一类是通过与国外仪器生产商合作,买断产品在国内的全部权利。如贝瑞和康与Illumina合作生产的新型测序仪、华大基因收购美国基因测序仪公司Complete Genomics后基于该平台开发BGISEQ1000测序仪、达安基因与Life Tech合作的DA8600测序仪。这种模式虽然使用国外的仪器技术,但通过国内的仪器设备通道申报CFDA,申报和审批相对较快。
(2)第二类是自主研发模式,如紫鑫药业与中科院基因组所合作的自主研发的二代测序仪器已于2014年4月18日发布,数据产出量与Roche 454相当。
中下游市场结合非常紧密,测序服务公司往往会提供有偿的生物信息学分析服务。美国大型的测序服务公司有:Sequenom, CardioDx和Foundation Medicine等,国内的主流测序服务公司有华大基因、诺禾致源、贝瑞和康、达安基因以及北陆药业等。不同公司根据提供服务的内容有所区分。
[url=]
[/url] 表4. 国内外主流测序服务公司
3. 下游数据解读能力需进一步发展
人体基因组共有23对染色体,包含超过30亿个碱基,而目前仅有3%能从临床给予解释。由测序服务公司提供的原始序列文件在经过系统地分析处理前,无法提供任何有效的信息。数据有效分析的三要素包括高性能计算平台、专业的分析软件和高质量的大样本数据库。计算平台用于对测序仪器得出的原始序列文件进行质量剔除、序列匹配等一系列分析的基础工作,分析软件和大样本数据库用于遗传解读和咨询。据Ebiotrade调查,69%的被调查人员认为数据的分析解读是影响测序产业链发展最大的瓶颈。
数据分析的有效性将决定下游市场公司的核心竞争力。目前全球有超过100家生物信息公司提供基因数据分析服务,成熟的高通量测序技术产生了海量数据,生物信息学分析市场涵盖数据压缩存储、工作平台、数据分析软件等。现阶段生物信息学技术可以对基因组学数据进行初级分析,主要集中在分析人体基因组的SNP和Indel检测,而分析SV和CNV则受限于样本量较少和NGS测序技术的局限性,无法使用精确的数学模型将上述变异与样本表型相关联。
来源:银河证券 文:李平祝、霍辰伊、王晓琦(实习生)
|