金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
last update: 2020/5/31
我去年在中国农大暑期班上讲刚好跟学生们讨论过这方面的内容,跟大家分享一下:
生物信息学从上世纪80年代开始进入逐渐形成一门学科,一直到现在,伴随着生物学以及其他工程学技术的进步,其实它的内涵和外延也在一直发生变化。国内主流教材以及专著对生物信息学的理解大多数还停留在上世纪90年代末,其内容集中于基因编码序列的分析(BLAST,NCBI数据库,多序列比对,微芯片分析,分子进化树等等)。过去的20年里,伴随着测序技术、蛋白质组技术等等高通量技术的发展,生物信息学的内涵和外延都有了极大的发展。从行业近些年来的发展看来,生物信息学其实有广义和狭义两个定义。
广义的生物信息学,正如其他答案里援引的,是通过开发和应用计算工具来解答生物学问题的一门学科。很多从业者,包括很多大牛,都会用”生物信息学“这个词来笼统地介绍自己的工作领域。广义的生物信息学其实其实包含了”开发“以及”应用“两个维度。狭义的生物信息学,与现在流行的”数据科学“非常类似(可以称为”生物数据科学“),侧重于通过计算机和统计的方法,对生物学数据进行挖掘,获得新的知识。与数据科学一致,狭义的生物信息学从业者需要领域特殊知识(domain specific knowledge,比如人类遗传学),计算机以及统计三个方面。目前国内大多数培训机构的课程,针对的正式这个领域,面向的也主要是生物学家。
相应的一个最近较火的学科”计算生物学“,则偏重于开发新的算法、统计方法以及软件,为生物学新知识的发现提供工具。从业人员往往需要计算机、统计、数学、工程学等数量背景,对生物学知识的要求相应较少。
伴随着行业的发展,大家对从业人员数量背景的要求越来越高。比如在Broad Institute以及Cambridge周围的药企,大多数的职位都是计算生物学的职位,对数量背景要求很高(我们招聘时候会像互联网公司一样考算法题)。相较于生物学,系统的数量训练难度更高,而正因如此,行业里最优秀的科学家往往都有非常强的数量背景。说几个我比较熟的,比如Lior Pachter(数学家), Gad Getz(物理学家),Mark Daly(物理学家), Hilary Finucane(数学/理论计算机科学), Alkes Price(数学家), Poru Loh(应用数学/计算机科学), Aviv Regiv(物理学家), Ben Neale(统计学家/遗传学家), Alex Bloemendal(数学家),Heng Li(物理学家),Hailiang Huang(物理学家)。当然还有我们研究所的创始人Eric Lander,也是数学家出身。
当然不是说你没有好的数量背景就没戏了,很多优秀的人也是生物学/医学出身,比如Daniel MacArthur(遗传学家), Heidi Rehm(遗传学家), Bill Sellers(癌症生物学家), Mat Meyerson(癌症生物学家), Levi Garraway(癌症生物学家), David Altshuler. 他们的共同特点是(我跟其中很多位一起工作过/正在一起工作),对于数理的直觉特别好,能够很快地理解到数理方法的本质,并看到可能存在的问题。科学的本质都是相通的,当你在一个领域做到顶尖之后,是能够做到触类旁通的。
不过从行业发展的整体趋势来看,对于新一代想要从事生物信息学/计算生物学的学生/研究者,我强烈建议大家重视系统的数量训练(统计学方法、计算机算法、软件工程方法等等)。从我的对国内行业发展的优先经验中看(了解相对较少,可能有失偏颇),中国目前的从业人员在这方面的水平薄弱,跟国际差距较大(当然也有很优秀的,比如诺禾致源的创始人李瑞强就很厉害)。这与国人对于新概念的接受,以及相应的训练项目落后其实有直接的关系。我2009年出国的时候,美国比较好的高校几乎都已经有非常强调数量背景和训练的项目了(比如康奈尔的Tri-institute Computational Biology program和Harvard的Bioinformatics and Integrative Genomics等)。生物信息学这个专业在很多本科院校都有开设,在很多好的高中也有相关的课程。我们从当地高中选上来做生物信息学暑研的学生,工作能力比我接触过的很多国内受过硕士训练的人还要强(两边的水平其实都挺让我吃惊的)。所以如果你的数理能力强,就在竞争中占得了先机。
就先讲这么多 |
|