金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
我给你一个清单吧。从名称上这几个专业的重叠程度很大,要具体看有什么样的能力或做什么工作来确定具体的前途。后面我会把这三个学科统称生信。生信专业所需要学习的东西,可以分成三类内容:数学,计算机科学,生物学,(如果要做科研某些方向可能还需要点物理学,因为你说了你走公司路线,所以这个谨供参考)。你可以从具体的学习内容上判断,偏重什么方向更适合你。
首先说,国内的生物学专业的数理基础普遍非常非常差。做生信,很多人理解就是写代码处理数据,按照这样的目标学出来也就只能搬砖无论在公司或科研单位。所以我给的清单里有不少是打基础的,同时,我会给出每类内容的上限,因为生信最终的落脚点是生物学,所以学习其他的内容总要有个限度。那些属于那个专业自己而与生物学距离比较远的东西,可以不去学习。
数学:目前国内的生物专业总会有一年的高数,但是完全没有后续课程衔接:(。在这个基础上生信所需要的数学需要这样补:一个学期的初等概率论,一个学期的数理统计。如果学有余力,可以再加一个学期的随机过程。这里的一个学期是相当于48-72学时的学习时间的量。可以去其他专业旁听,推荐去听工科专业或者物理专业的,而不要去听数学专业的,因为你要学的不是推导定理,而是基于定理如何计算或建模。目前的高通量分析,最困难的是对数据的解释。这需要相当的统计学能力。生物专业本科水平的一个学期的生统(就你说的那种生物统计学课程)按这个标准要求,基本上可以忽略不计。即使在公司里,一个懂统计的生信数据分析人员肯定比只会跑流程的人更吃香。生信所需的数学划一条上限就是涉及实变和泛函的高等概率论和高等数理统计。换句话说,测度论不用去学。在这些与统计有关的数学内容之外,学有余力的话,可以看一点微分方程的东西以及数值计算的东西。
---有知友问到一些关于 计算机学科课程的问题,修改了下面关于数据结构这部分的说法---
---修改了关于语言的建议,希望对自学者的可操作性更强一些---
计算机科学:作为非计算机科学背景,首先会遇到的问题是学什么语言。专注地使用一种语言以达到一定的熟练度,是很好的思路。长期来看,如果从一种语言换到另一种,也是很好的经历,因为对多种语言的了解会增加对编程这件事的认识深度。当然如果能同时使用两种语言,或者是“高低搭配”的形式,比如C+python,或者是一种能写而另一种能看代码,都是很好的能力。具体到推荐什么语言上,推荐两个原则:第一“就近原则”。就是说,不是因为一种语言被声称是“最好的语言没有之一”而去学习它,而是你周围有什么朋友/舍友/同事擅长某种语言,你就跟着他/她去学。这样的一个优势是有了问题可以立即在专家那里得到答案。在学习的最初阶段,必然会出现大量的低级问题,如果有人能在十几分钟之内帮你说明白这些问题,要比自己花几天时间上网查答案要方便得多,痛苦程度也低得多;第二“多能原则”,编程语言作为一种工具,我个人推崇那种用一个工具完成尽可能多的工作的思路,而且作为非计算机专业的人员,必须考虑学习新工具的成本。就我个人来说,因为早年经历的原因,几乎所有工作都是用python解决,而且遇到字符处理直接就import re上正则,从不用shell或者awk/seed之类,当然我个人这是比较极端的例子。在具备初步的语言能力的基础上,有三门计算机的专业课要学,第一,算法与数据结构,从某种意义上程序就是算法加数据结构。对于非计算机背景的人,有太多的人(尤其生物学背景)满足与写能用的脚本而不注意程序的质量。实际上,当学一个语言遇到足够复杂的问题时自然会接触数据结构和算法之类的问题。这一关是绕不过去的。如果觉得严奶奶的数据结构学起来太痛苦,至少可以先从《大话数据结构》这样的入门书看起,而且,现在基于java乃至python语言来讲算法和数据结构的书已经有一些了可以选择。第二,以linux为例的操作系统,虽然是以linux为例很容易落入lin/win的口水战。但是,我想说的是,进程、内存、IO、文件。这才是最核心的东西。第三,数据库,关系、范式,至少要知道一点。SQL要会用,mysql/postgresql要玩玩。因为生物信息学一个重要内容就是在现成的公共数据库里找东西。这三样东西也可以按照一个学期48-72课时来学习。但是语言的话需要大量的时间去练习,多写代码才会有感觉。划一个上限,偏硬的东西,电子电路之类,不用学;偏软的内容里,面向对象,网络工程,软件工程不用学。因为生信中的软件是给基本上有相近水平的同行用的,而不是给完全小白的外行用的,而且往往是在计算集群上用命令行实现的,因而图形界面的东西完全可以不考虑,也不太需要网络传输的东西。
生物学:生信要学的其他专业的东西那么多,自己专业要学的东西肯定要减,而只保留最核心的骨干课程。这里我列七门课。基础的:动物学,植物学,微生物学;进阶的:生化、细胞、遗传;高级的:分子生物学。不能再少了,再少就不是完整的生物学背景了。如果学有余力,基础的课程可以增加有机化学,进阶的课程可以增加生理学和生态学,高级的课程可以增加进化生物学,基因组学和种群遗传学。这些课程也基本都是一个学期的内容。这里国内很多专业会开设的所谓四大工程不推荐。这可以看成生物专业的“上限”,因为做生信所面对的是高通量的生物实验技术所产生的数据,遗传工程细胞工程之类,基本用不到。
最后顺带说一下物理学,做生信需要的物理背景很容易被忽略。但是在做进化生物学或者系统生物学的研究中,往往需要一点这方面的内容。在大学普物基础上,学一门物理化学,再学一门统计物理(有的院校生科院会开一门有相当重叠的物理化学课,也好)。这里面,物化是普物,有机化学和统计物理之间的过渡,如果基础好,可以跳过这门课直接学统计物理。有了前面的数学基础,统计物理基本上不难,顶多在重整化群那里会遇到一点困难,稍微多下点功夫也不是问题。如果是做偏基础的研究并且个人有兴趣且学有余力的话,多看一点非平衡统计物理的内容,会对将来的发展非常有好处。
可以这样跟你说,目前我接触到的基于组学的整个科研和产业圈,生信人才奇缺,能招到的人,能顺利把流程跑下来的就算是合格人才了,能面对客户理解需求并完成流程的人员,奇缺。同时,国内的生信专业普遍很水。与科研和产业对接所需的完整训练严重不足。你对照我上面的清单,自己把基本功练好,出去找工作应该不愁薪酬的问题。 |
|