立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索
小桔灯网 门户 资讯中心 人物专访 查看内容

【NGS接龙】谱元科技创始人覃俊杰:微生物检测的创业之路(上) ...

2023-10-24 10:12| 编辑: 归去来兮| 查看: 1330| 评论: 0|来源: 测序中国

摘要: 复合背景才能更好地驾驭交叉学科。

由测序中国发起的“NGS十周年接龙活动春节前的最后一波正在来袭。 受武汉未来组生物科技的CEO汪德鹏邀请,今天,谱元科技和谱元研究院的创始人兼首席科学家覃俊杰来分享他的NGS故事(上篇)。

人类发展好比一台漫长的的舞台剧,仿佛所有角色都由毫无经验的新人扮演,在不知所措中出场,一边了解剧情、一边努力表演。在短暂的上场时间里,有的自信满满,有的小心翼翼,有的起起落落,有的平平稳稳,但没有谁能真正评价你演出的好坏,只求能充分发挥大自然赋予每个人的天性,不虚度这个仅有的出场机会。

初识生物信息

我的天性是喜欢数字,喜欢推理,更喜欢挑战。中学期间参加过各种奥赛,唯独生物没有获奖。特别喜欢阅读科学史和各类科普著作,例如《第一推动丛书》,唯独没有读完其中的生物学部分(《细胞生命的礼赞》、《我们为什么生病》等)。高考前一次有关基因工程的讲座,让我一时冲动选择了一个陌生的、但自认为会有用武之地的生物专业。

说实话,本科的生物课程是违背我天性的。专业课程中,充满着大量观察性、描述性的知识。让我不得不把更多的精力投入在高等数学、大学物理、全国数模、美国数模、ACM(大学生程序设计竞赛)等非生物专业的活动中。大三时一次偶然的机会,读到一本讲人工智能的书籍。当时脑海中突然闪现出一个想法:计算机科学发展的更高目标是写出具备智能生命特征的代码,而生物科学正在用细胞学、分子生物学、计算机等技术去破译已经存在的生命代码。两门学科不约而同地在做同样一件事情——理解生命,只是角度不同而已。这次思路上的“想通”,也让我自豪地再次选择作为生物专业学生了。

一次偶然的机遇,知道北京顺义有一家适合我的地方——华大基因。当得知自己的三人小组获得美国大学生数学建模竞赛的一等奖之后,我们既高兴又彷徨。我们喜欢用数学、物理知识去做科研,但是在生物科学领域有适合我们的方向吗?鼓起勇气给中科院理论物理所的郝柏林院士发了封email,说明了我们的情况。没想到他很快回信并推荐了华大。后来,我通过进入中科院北京基因组所读博士,正式加入了华大——在这里,让我真正全面认识生物信息学,源于四次启蒙:

第一次启蒙,是李松岗和郑伟谋两位老师,那是在研究生面试中。他们的提问非常细致和严谨。我面试完的心态是:不管他们对我是否满意,反正我对这两位老师是非常满意的!严密的分析推理,以及生物数据背后的理论模型基础,这是生物信息学的基础,也是这两位老师在日后教会我的。

第二次启蒙,是听王俊在中科院研究生院的讲课,后来也成为他的博士生(导师喜欢我们直呼姓名,或者叫老大,本文中使用前者啊)。抛开“个人魅力和前排座位很难抢”不谈,王俊从一张貌似简单的测序深度分布图中教我们分析,得出一系列之前想象不到的结论。此后,每次给王俊汇报工作进展,我必须也只需要准备好两点,一是分析结果图,二是其中的结论,也就是point在哪里。我导师以他过人的聪明才智,教会我一个道理:再复杂的研究工作,如果不能简单清晰地表达出来,并让外行人听懂,这就意味着研究工作的失败。

第三次启蒙,是下学期听汪建老师的课程。“未来的生物产业是什么,你们可以想象吗?一个复杂的分子生物学实验工作都可以装到这样一张芯片上完成。”汪老师以他前瞻性的眼光和产业化思路,让我看到生物信息学未来的应用前景更加广阔。实验都能自动化地在芯片上完成了,肯定要大量借助计算技术去分析处理各种信号啊。未来的生物信息学是属于敢于创新、敢于交叉的人才。

第四次启蒙,是回研究所后,跟着李恒、阮珏、李瑞强、郑鸿坤、张勇等众多生物信息学前辈一起工作。例如,首次实现的生物信息算法是序列比对。在李恒师兄的要求下,非常关注时间复杂度和空间复杂度。后来学习的Perl编程,更多地只是开发生物信息流程,而李恒、阮珏两位师兄教我的,才是最核心的生物信息学开发工作。可能是受ACM影响,我当时经常是快速写完一个算法,甚至用数学分析后的公式直接得到结果后,就认为开发工作完成了。任何一个严谨的、成熟的生物信息学软件都是一个软件工程。我初到华大时,大型机上很多好用的软件都是几位师兄用C、C++等开发好的。在二代测序数据的分析中,非常有名的华大SOAP系列软件包,是李瑞强师兄以及一些计算机专业的朋友共同开发完成的。同前人相比,国内的生物信息算法开发工作还有待加强啊。

在生物信息领域,我认为有两类人很受欢迎,一类是计算机或数据挖掘基础较好的,可在理解生物学问题的基础上开发一系列稳健的、易用的生物信息算法和软件;另一类是生物基础较好的,并且会编写简单流程和使用现成生物信息软件,可带着各种生物学问题对数据进行个性化的分析探索,最好再能根据生物信息分析结果来设计新的实验方案。

走进微生态领域

工作领域太多,可能一个也不突出,也可能会在最后等到一个新的机会。在参与了多个项目,熟悉了各种分析方法和生物学问题后,我终于等到了属于自己的方向。这得感谢师姐——马丽佳,觉得我总是这样在各个项目里“打工”是不符合博士生要求的,所以抓住一个机会把导师从欧洲带回来的MetaHIT项目(欧洲人体肠道微生物群落研究项目)交给我负责。是偶然也是必然,因为当时只有我一个博士生没有自己独立工作的方向。

尽可能得到前人的指导,站在前人的肩膀上,让我一直觉得自己是非常幸运的,总能遇上各种给我帮助的老师,例如生物信息学方向,以及这里要介绍的微生态研究方向。MetaHIT项目主席Dusko教授,在我心中他是一位德“艺”双馨的微生物学家。当我淹没在数百万的肠道菌群非冗余基因中而束手无策时,他举重若轻地告诉我:“非常好!你看,平均每个细菌差不多有几千个基因,换算过来,每个人肠道里大约只有1000种左右不同种类的细菌”。天哪,怎么能这么计算呢?太不严谨了。两种进化距离较近的细菌会共有更多的基因,更不用说同一种细菌下还有不同的菌株,而我们构建的基因集中已经把这些高度相似的基因去除了。我立刻非常认真地把这种观点表达出来。出乎意料地,Dusko微笑地对我说:“俊杰,你说的都对,但是科学界目前还在争论人肠道环境里到底有多少种细菌。以前是通过分离培养法、通过16S基因检测法,来估计人肠道细菌种类,但是准确性都不如我们正在做的宏基因组方法。所以,虽然不严谨,但已经比当前认识进了一大步”。果如其言,后来别人引用我们这篇文章时,常引的结论就是基因个数和细菌种类数。

复合背景才能更好地驾驭交叉学科。从2008年第一次分析宏基因组数据开始(汶川地震时,在陈晨师兄指导下进行环境微生物宏基因组数据分析),到现在已经有近8年共1万多小时的投入了。一开始是计算机技术用得多些,如超大数据集的组装、基因集构建、各种分类算法开发等。然后是数学用得较多,如微生物丰度的生态学模型、宏基因组数据关联分析、预测模型等。再后来是生物学用得多些,如重要物质的代谢通路、新发现细菌的分离培养、特定生境的微生物特点等。到现在,我觉得还要大量学习医学知识,因为这些共生微生物都会对宿主产生影响,所以宿主的健康疾病状态也需要专业的研究。可以预见,接下来我们还需要社会科学、大数据科学等新知识的注入,来帮我们更好地理解微生物世界。微生物世界,好比人类世界的缩影,只是尺度不同,复杂度上没有差异。生活在同样的环境中,为什么这种菌会在你体内定殖,这是必然的吗?让我彻底理解这种逻辑上的必然性,就如同理解生物进化一般,偶然和必然共同决定了生命运动的轨迹。


注:如需转载请注明来源(测序中国),谢谢!

声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部