金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
自新冠爆发以来,生物信息学的分析在整个病毒研究中发挥了重要的作用。从最初的系统发育树证明Covid-19与SARS病毒的亲缘关系,到最近的“基因组+生物地理学”分析,都体现了生物信息学在疾病控制和个性诊疗中的强大应用能力。
今天的文章,何老师来与大家具体聊聊生物信息科学与最近大热的数据科学都是什么?有什么区别?生物信息学家可以转换为数据科学家吗?在这个过程中有什么挑战,数据科学家需要哪些技能呢?
到底什么是生物信息学?
生物信息学综合了数学、计算机科学和生物学的各类工具,通过处理生物带来的数据获得我们想要的信息从而进行预测。比如,在已知的序列里,用计算机找到它在哪个物种的哪个染色体上的哪个位置;或者是已知了特定序列,在另一些序列里预测组成成分。现在正处基因数据的爆炸时期,尤其是二次测序能产生无限多数据。
生物信息学和传统的生物学不同,包含了NGS和基因组学。只有真正了解数据的来源,才能更好地分析和处理,挖掘出背后隐含的生物知识,那么如果你想进入生物信息领域,你需要的基本知识点有哪些呢?
- 了解基因组、转录组、蛋白组、染色体、基因、表现遗传、变异类型等一些列生物原理
- 明白NGS技术、测序仪、NDA检测的基本方法
那么除了基本的生物信息以外,因为生物信息学是重在数据的,所以在这个领域中同等重要的是数学和计算机,主要是编程能力和算法设计能力。那么这就涉及到了,生物信息学专业的学生,究竟要掌握哪些技术技能点呢?
生物信息学家需要哪些技术技能?
除了基本的生物基础理论,生物信息学家需要具备以下技术点。当然大家不需要在以下每个方面都是专家,但至少应该了解,并在某些方面有一些实践的经历:
- 掌握Linux进行在Terminal中进行数据分析
- 至少掌握一门高级编程语言,首先推荐Python,其次如果有能力掌握C/C++则更好
- 学会使用常用的组学数据分析软件,比如bwa、samtools和picard等
- 有一定的数理基础和统计学基础,包括常用的假设检验,贝叶斯推断和回归分析等
- 多看开源的组学算法,比如在github上多了解
- 留意最顶级的CNNS杂志
数据科学家必备核心技能有哪些?
那么说完了生物信息学,近年来大热的岗位数据科学家们,应该需要哪些核心技能呢(只列举核心的必备技能包):
- 数学与统计学的知识:统计学、多元微积分、线性代数等
- 编程技能:Python语言、R语言或Excel等
- 数据整合与预处理的能力:主成分分析法PCA等
- 数据可视化
- 基本的机器学习的技能
- 终身学习:多利用Github代码库来了解最前沿发展信息
- 团队协作力
- 数据科学的伦理道德
其实要成为数据科学家也不是一件容易的事情,因为不仅要掌握上述技能,还要能熟练的应用。。
这2个领域,求职者能互相切换么?
简单来说,不是任何生物信息学家都能成为数据科学家的,因为需要额外的学习数据分析的新技术和软件,但如果学生选择申请博士/博士后,增强了数据处理这方面技能的积累,这两个的界限会比较模糊。
但两者在工作的领域肯定是有很大不同的,数据科学家一般是在工商业界比较活跃的,通过分析数据来给客户产出新的产品思路,或者预测新的发展趋势。而生物信息学家则更关心的是如何利用生物学的数据,来发掘基因、病理等生物学新领域。
此外数据科学家很注重团队的合作,与和客户的互动沟通,而生物信息学家很多时候是独立思考和实践,较少的机会会进行公共演讲或合作沟通。
总而言之,这两个领域所需的技能是相似的,并且生物信息学家在掌握了一定技能后是可以在数据科学家的角色中进行转换的,但需要调整自己的思维来配合不同的行业。
更多留美干货,欢迎关注厚仁教育:
厚仁教育 |
|