立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 2136|回复: 0

[产业观察] 疾病检测—高通量测序光鲜背后的挑战!

[复制链接]
发表于 2015-7-11 22:40 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
在过去几年,高通量测序技术迅猛发展,在基因遗传领域创造了一个又一个奇迹,尤其在基于遗传信息检测的个体化医疗(精准医疗)方面。现在的高通量测序光鲜亮丽的同时,背后又面临什么样的挑战?

1、测序技术日渐强大

GWAS(Genome-wide association study),即全基因组关联分析,是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs。“考虑到样本数量,遗传方式,外显率等,我们能从实验中检测到多大比例的相关突变?”通过对常见疾病的GWAS研究,人们发现很多常见病的遗传性可能归因于等位基因突变频率的高于常见突变,突变频率达5%或更多。如果得到了验证将非常有利,因为检测突变的SNP芯片成本低;对同种突变,关联分析的检测能力很强;关联分析能解释一些个体中的遗传易感性,缩小了后续的研究范围。

GWAS已经揭示了数千的遗传关联,然而很大比例的常见疾病风险来源于罕见突变,这些罕见突变来自个人、家族或一个群体。为了实现对这些罕见突变的检测,需要大样本的研究(1万或更多样本)。此外,许多罕见突变是无法通过SNP芯片检测到的或者是未知的,因此需要高通量测序。尽管测序成本不断降低,但这种大规模的研究仍需要大量资金。

2、选择合适的检测手段

全基因组测序研究最大的优势就是对遗传变异的检测无偏好性,可以让研究人员在进行关联分析时不用进行假设(如假设相关的突变都在编码区)。不利的一点就是每一个基因组中都包含有3-4百万个突变。

经典的GWAS研究主要依赖于SNP芯片,芯片包含70-100万精心选择、经过验证的位点。应用全基因组测序检测突变有极大可能检测到未知患病风险的突变,但同时还会检测到上百万与疾病不相关的突变。

相比之下,候选基因的研究或外显子测序因为是对最有可能发生功能突变的预选区域做研究,有很大的优势。它们不仅是可以得到更少的突变,更重要的是这些突变最有可能影响蛋白质。

3、误差难免

如果对1万个样本进行测序,基于成本和实验的精确性必须考虑测序深度。一些样本可能因为技术问题如建库失败或污染产生错误的测序结果。测序过程中还存在人为因素和机器错误。某些错误可以通过算法矫正,但有些错误无法通过计算的方法来矫正,虽然发生概率很低最终也只能排除样本。数据库和文献也可能包含错误的报告。最近ClinGen consortium检查发现,OMIM数据库中数百的突变信息被临床实验室注释为良性的或未知的突变。

4、不可能预测所有突变结果

VEP和ANNOVAR等注释工具可帮助研究人员鉴别哪些突变最有可能有害。而这些工具的注释仍是基于已知的基因组信息(目前还不完整)和研究人员对突变影响的猜测。大部分的人类遗传突变,包括大量有调控功能区域的突变集中在非编码区。相比于发现这些突变,深入了解非编码区域将会耗费更多的时间和资源,面临更大的挑战。因此,对疾病风险相关突变影响机制研究探索将是一个艰难而长远的道路。

5、软件硬件的升级需求强烈

高通量测序技术产生了海量新数据,需要不断提高分析工具的处理能力。由于测序技术的不断快速发展,开发软件需要时间,保证这些软件能跟上技术发展的要求非常困难。几年前, Illumina短read测序仪单端读长只有36bp,现在Illumina的Hiseq X10的读长可达到150bp,MiSeq平台可达到250bp。但想要很好地检测结构变异及探索人类基因组上的复杂区域,这样的读长仍然太短。

6、期待挖掘单个基因的故事

在过去50年里,遗传领域的巨大投资和研究进展给予了人类关于基因与健康的惊人知识财富。我们需要足够的信息对一个基因进行解读,解释为什么某一基因发生突变就会对表型产生影响。由于许多基因功能未知,就目前所了解的疾病相关的表达模式、序列相似性、代谢通路组成及其他数据资源,想要很好的解释一个基因与特定疾病的关系,仍然有许多工作等待科学家们去完成。

来源:测序中国
楼主热帖
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表