立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 2727|回复: 5

[分享] 生物信息就业是否真的比其他生物类方向更好?

[复制链接]
发表于 2024-9-25 21:12 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
本人生物专业,正面临方向选择,在网上浏览了比较多的信息,大家普遍认为生物信息是生物类就业较好的专业。
可是题主去一些招聘网站搜索生物类的岗位,有以下发现:
第一,生物信息的岗位少于其他方向(如生化),甚至在某些二三线城市很难找到生信的岗位。
第二,生信的薪资并没有明显比其他方向的薪资高。
这些明显与网络上对生信的一片叫好有所出入,请各位前辈解答题主的疑惑。

原文地址:https://www.zhihu.com/question/409176198
楼主热帖
回复

使用道具 举报

发表于 2024-9-25 21:12 | 显示全部楼层
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

作为本科学生物,后来转行生物信息的人,经常会被人问起,为啥学习生物信息了呢?这背后通常会带着一些困惑,生物信息分析好不好学?
生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题。但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程序。也许你可以跟着一个测序分析流程完成操作,但不懂得背后的原理,不知道什么参数需要修改,结果可以出来,却把我不住对还是错。
我读书的时候,实验室纯计算机出身的人员只占很小比例,更多的是大学期间学生物的;特别的,有个做的挺好的师兄,本科是商科出身。从这来看,像我这样本科学生物转行生物信息还不算是有跨度的。这也从一个侧面说明,专业背景不是能否学好生信的决定因素。
想想自己大学开始自学生信的时候,可以说是一头雾水,只知道先学习编程,查了查资料,是要学习perl语言,但是不知道要在什么地方写,怎么去运行。费了些劲,在windows上安装好perl,写个文本文件,改下后缀,发现文件的图标变成了perl的图标,双击就可以运行了,不会写命令行参数,不会输出重定向,一种傻呵呵的体验。
后来接触了Linux系统,体验到在终端输入命令的快意,才找到了编程的感觉。不过,深深印在脑海里的还是作为一个生信小白的时候,写一个程序不知道在哪写在哪运行。看过不少的教程都默认学习者会打开终端,会使用终端,会在终端运行命令。而我却是个例外,什么都不会。程序可以照着教程写下来,却不知道怎么运行。所以在我后来写python教程的时候(后台回复
python
可获取),第一部分就是介绍程序在哪儿写,在哪儿运行,怎么运行。(最开始学习perl,在研一时在QQ群一个同一大学学长的忽悠下,尝试了下python,那时有些编程基础,寒假在家看了遍《python简明教程》就可以写了,以后也就习惯了这个语言)。
我个人是个理解能力比较差的,尤其是在接触新的领域时,阅读不少教程,总觉得这些教程都是给有些基础的人写的,自己去学习时,需要多方尝试多多综合,才能找到门路。为了方便自己学习,也为了记述学习过程,就开始写博客去记录,力争从一个小白的视角、从最基础的角度去写作,记述哪怕是最简单的一步操作,一个错误,提供一个近乎人人可以直接上手的教程 (比如虚拟系统Docker的使用教程任务流控制管理的Airflow教程,这些文章被转载后,在同一平台相比于同类的教程阅读量多了10倍,我想这正是因为简单、可操作,为初学者接触这些工具提供了最大的便利)。
在初步知道程序语言怎么运行并能成功运行完示例后,就要系统地读一本简明教程;简明的教程不多见,因为一般的教程都涵盖的面比较广,而我们初期只需要关注最基本的就好

(所以我提取了我个人认为比较重要的基础内容,形成教程),可以找本经典书,请身边朋友划下重点,先从头到尾读一遍,不管理解多少,然后再读一遍。读不下去,就抄写一遍。最好的自学方式就是守住一本教材,一遍一遍地去读去熟悉,每看一遍都会有一些了解,从陌生到熟悉,慢慢就串起来了。然后就开始自己去写代码,代码就是我们思想的体现;我在教人写代码时,总会让他先描述下如果没有程序,我们自己是如何一步步的手动处理这个问题的,模拟的是程序运行的过程。理清一遍思路之后,怎么想的就怎么写,只要你敢写,就成功了
当然这个时候一般会遇到初学者经常犯的错误,写完代码,觉得自己写的很对,但运行时却总是提示错误。绝大多数情况下,错误是我们自己写作的错误;起码在最开始时,要相信是自己的错误,不是程序语言设计的错误。错误的种类就这么几种,比如引号未配对、缩进不对、少了空格、文件名不对、变量名字不一致等。这时需仔细看屏幕提示的错误信息,在提示的错误行附近反复去查看。在之前的python教程和后续的文章中,都有或会提到经常出现的错误和解决办法。
能让程序提示的错误都算不上大的错误,而程序运行成功,不等同于程序的逻辑是对的,获得的结果是对的。程序是我们设计的,多数情况,我们对程序的输出结果是可以预估和判断的,不符合预期的结果是我们最应该慎重对待的。
在能独立写作程序后,一方面是学以致用,在解决问题中逐步学习;这时谷歌是你最好的帮手,把你遇到的错误或想解决的问题的关键字提取出,一键搜索,可以帮你解决大部分问题。另一方面,则是去学习别人的代码、学习初学时跳过的内容,利用社区中提供的优秀的模块或包来简化、加速自己的操作。入了门,就不需要像刚开始时,什么操作都自己去写了,俗语叫“自己造轮子”;可以用很多经验更丰富的开发人员做好的轮子解决我们的问题。

学习生信从来就不是一个简单的事,需要做好持久战的心理准备。
在学习时,我们都希望由浅入深的逐步深入,不断地练习和实践,这就是为什么我们需要一本书,因为书很系统。但生信发展的历史短于计算机编程的历史,如果想要一门程序设计的入门数据,每种语言都可以找到几本。但想要一个囊括生信的书,就有些难了。本身生信跨领域,需要多学科的知识,而其内部又有不少分子,都囊括了太大,包括的少又有些隔靴搔痒的感觉。
我们当时都是零基础下自学Linux,
自学Python,自学R,自学高通量测序;这些学习经历,之前都零星地记录在博客里。现在回头去看几年前自己记录的东西,觉得好简单,而当时却费了很大的力气。这些零星的随手记,当时也只是为了自己看,到现在确实只有自己能看得懂,不便惠及更多的人。
因此我们创建了生信宝典,希望从不同的角度传播知识。这个不同有三点含义,一是形式上的不同,摒弃之前主编们单人作战想写啥就写啥,而是有组织有计划的内容聚合,提供一系列的教程,由入门到提高。二是内容的不同,不去用网上现有教程的通用数据做例子,而是拿实际生物数据,讲述如何解释生信中普遍碰到的问题,讲述如何处理自己的数据。三是立足点不同。在写作时,我们回到了当年,在回忆中用整个阶段的学习去指导当初的那个小白,从那些会了的人觉得微不足道而不会的人又迈不过的坎入手,直击痛点。知识点的收录依据不是是否炫酷,是否难,而是是否必要。如果必要,再简单,也要提及;如果不必要,再炫酷,也暂不纳入。
通过大量的生信例子、关键的注释和浓缩的语句形成下面的一系列学习教程。每一篇内容都不多,可以当做小说阅读,也可以跟着去练,反复几遍,每读一次都会有不同的收获和体会。
教程合集

加拿大生信课程

Illumina测序应用手册

系列教程

蛋白质组学研究

转录组研究

单细胞

GEO/TCGA数据

扩增子三步曲

宏基因组教程

宏基因组分析专题

ChIP-seq专题

Linux 全介绍

CIRCOS系列

R统计和作图

NGS基础和软件应用

生信宝典之傻瓜式

Python

Cytoscape网络图

分子对接

文献精读

精选文章推荐

科研经验

软件和数据库

扩增子分析

宏基因组分析

实验设计与技术

文献精读

科普视频*寓教于乐

系列宣传

永久链接

回复 支持 反对

使用道具 举报

发表于 2024-9-25 21:13 | 显示全部楼层
作为一名生信相关行业的非资深从业人员
我来给题主一点非主流意见
各位大大轻拍

我们是搞云计算的
大家都知道
我们云计算属于特殊行业(?)
特殊在哪里呢?
别的猪都是被吹上天的
我们这些猪(划掉)天生就在天上

尤其是在新冠疫情爆发后
云计算的落地速度可以说是飞快快快快快

生信的现状跟云计算就有点类似
毕竟国外的疫情一波未平一波又起又起又起又起又起又起……
有钱的没钱的大的小的国家都在争先恐后地爆发
这就倒逼全球都在不计成本地开发疫苗或者特效药

不计成本是啥意思呢?
换句话说就是——
老子有的是钱!!!

想象一下你正在实验室里精打细算地规划资源
你的老板突然冲进来
告诉老子有的是钱
现在立刻马上
研发费用加一个……
不……加上一串零
麻溜滚去干活!!!!!!!!

有钱了
你该如何表演?
拿生信来说
有一步叫虚拟筛选
当前能够用于药物发现的有机分子总数已经超过了10的60次方
而我们通常只虚筛百万到千万个分子
为啥?
没钱啊……

但是老板刚才说啥?
老子有的是钱!!!

于是思路瞬间就开阔了很多
比如2020年3月
哈佛大学医学院就在《Nature》上了发了篇论文
说他们有钱了(划掉)
于是搞了一个开源药物发现平台
该平台可以从云端整合海量CPU
对超大规模化合物库进行基于结构的虚拟筛选

用人话说
就是原本他们在1个CPU上筛选1种化合物大约需要15秒
筛选完10亿种化合物大概要475年
而现在他们用这个平台
在云端调用16万个CPU对接10亿分子只用了15小时


而且这个开源药物发现平台还能够线性扩展
也就是说处理器增加多少,筛选能力就增加多少

关于该平台的详情可戳:
速石科技 fastone:15小时虚拟筛选10亿分子,《Nature》+HMS验证云端新药研发未来所以,作为云计算的从业人士
我们是真的觉得未来充满了光明

哎哎???
不好意思串词了
重来——
我们是真的真的真的真的觉得生信的未来充满光明!!!!

加油!!我们等着你们!!!!在天上!!


码字不易,喜欢请点个赞哦~
回复 支持 反对

使用道具 举报

发表于 2024-9-25 21:13 | 显示全部楼层
20230407更新:
持续了20年的调包游戏结束了,AI下场终结比赛。ChatGPT可以轻松让一个受过科研训练的人,在一天内熟练掌握所谓的生信分析流程,再过几个月可能99%的生信流程都不需要什么“生信工程师”参与了。
我很早就认为生信注定被专业程序员降维打击,但我没想到AI能让这个历史进程走得如此之快,萧瑟秋风今又是,换了人间。
从今往后,那些希望只是出张图的生信分析需求,无脑交给chatGPT就可以了,R Python这种高级语言它能给你玩出花来,代码比实验室里99%没接受过工程训练的菜鸡好的多。
​从今往后,那些以生信分析为职业的人,迅速地转方向吧,开发,测试,运维,总有一款适合你。一个月20美金就能替代你的工作,不优化你优化谁呢?
过几天单独发个测试示例演示一下吧。时代真的变了。
另外打个广告,手上有国内中厂的开发跟测试的校招和社招内推名额,语言偏cpp,北杭成西均有base,有想法可私我
<hr/>
在当前就业形势下:
对于学生而言,学生信的意义不在于学会如何使用生信技能,调包,画图,讲故事,高速发文章,而在于生信是最合情合理的告别简单重复“湿实验”劳动的途径。这意味着一方面你可以理直气壮地获得更多坐在电脑前的“悠闲”时光,另一方面你的大脑也会在长期的抽象训练中逐步告别简单重复的思维模式——你不再愿意“搬砖”了。可以这么说,学生信是生物类学科转码的最佳、也几乎是唯一途径。它的绝大多数技术在互联网厂商程序员看来是幼稚而低劣的,但对绝大多数生物类学生来说,它就是帮助攀爬“编程”这一陡峭山峰的缆车。当然了,前提是你依照CS学科的方式进行系统的学习,而不是寄希望于通过杂七杂八的生信课程学会编程。
对于老师而言,学生信的意义也不在于学会如何使用生信技能,调包,画图,讲故事,高速发文章,而在于接受计算机学科生产力的思维方式改造。这样的改造一方面能防止测序公司天花乱坠的“XX组”推销说辞搞得你云里雾里,另一方面又能让你借助交叉学科的技术和模型,快速批量地生产本子。这样的本子,有噱头,又有生产力,在当前多数人用着单一技术“抱残守缺”的大环境下,足以让人耳目一新。多一分关注,就多一分通过的概率。有经费,就有一切。
你说要不要学生信?
<hr/>评论区出现了一个不懂装懂,自以为懂“生信”的典型,张口闭口生物学问题。我一开始以为是我的理解跟他出现了偏差,让他下个定义,无果,这里统一对这类生信分析就是为湿实验和生物问题服务的看法做个回复。
什么是生物学问题?概括起来无非两大类:生物体上自然规律的总结、利用自然规律对生物进行生产力改造。
在当前生物发展历史进程下,对规律的总结远远多于后者。并且由于诸多历史原因,总结出的规律难以跳出百年前博物学思路的窠臼——割裂、独立的单一具体规律。尽管在计算机技术的帮助下,近几十年我们开始逐步向群体网络状的规律总结前进,但时至今日,单一的规律总结仍然是浩瀚文海中最重要、也是数量最多的组成部分。不信的话你随便打开几篇一区SCI看看就知道了。
至于对生物进行生产力改造这一方向,我们连规律都没摸透,系统性改造又从何而来?所以当前只有一种方案:枚举,试错。每一次分子实验的背后,都是一次赌博,谁也不清楚你的碱基序列和蛋白,以及最后的生物系统之间到底发生了什么 ,你只能像淘金的矿工一样,不停地重复挖掘的过程,期望能成为下一个幸运儿。
而计算机技术背后的信息体系则完全不同。对他们来说网状架构司空见惯,而解决简单重复劳动更是基本操作。这样的体系,难道不值得学习吗?借助信息论完善生物规律系统的构建,借助自动化革命传统生物类生产方式就是未来二三十年的趋势。这是美国科学院定下的发展战略[1]
那为什么还会有那么多人说“生物学问题”是首要的?因为发文章需要生物学问题,每一篇文章都必须遵循提出问题——分解问题——解决问题的套路,问题提的好,故事才能新颖,审稿人才愿意看,文章才能发的高。这行为就好比摸了摸象鼻子就说这是大象,抱残守缺说的就是他们
回到就业上来,生产力决定生产规律是基本法则。生产力是就业市场上唯一流通的硬通货,其余的都是筛选生产力的门槛和对生产力的装饰。而在当今环境下,几乎所有的“生物学问题”都不能提供先进生产力,你觉得对就业而言,生物学问题价值几何?
所以各位一定要先从CS导论开始学生信,这样你才能率先接触先进生产力。有生产力,才有一切。
胡乱涂抹,难平胸中抑郁之气。天坑专业已经够苦了,希望后来之人能把握住每一分希望。
回复 支持 反对

使用道具 举报

发表于 2024-9-25 21:13 | 显示全部楼层
这不是一篇鼓励大家转行生信的回答!甚至有点劝退
很多人都是不假思索的来学生信,都认为转行到生信是实现了自我的救赎。都认为生信是生物行业中最具潜力最有前景的一个专业。我要给大家泼个冷水!
生信已经过了野蛮生长的阶段!不再是那种薪资远高于湿实验的时代。
如题主所言:

  • 大部分生信岗位的薪资并不会比纯生物做湿实验多太多(平均2-3K吧)
  • 生信岗位集中在一线城市,少部分在二线城市
如果你认为可以轻轻松松通过学习生信而改变什么,那么我建议转行到更有前景的专业,否则可能是用青春换黄土。
生信并非没有高薪的机会,但相比而言的确不多。因为目前国内的生信8成以上都是在跑流程,会点linux、R和python,作为湿实验的辅助。近几年生信人员井喷式的增多和技术的革新也让跑流程这件事的壁垒大大减小。这类生信的薪资虽然不亏,但绝对不是非常赚!
你会发现今天的生信流程和二十年前的提质粒本质上没有太大区别。
如果你仅限于此,那么这样做生信可能并不会因为你的转行、因为你所付出的巨大辛劳而收货更多。(从性价比来讲不够高)
生信人的竞争力在哪里
生信人就没有机会了嘛?并不,既然你已经付出了这么多,那为什么不再多付出些,获得更多。你会发现生信中总有一些岗位的薪资散发着诱惑。在新的时代,生信学习应该有新的任务,我一直认为生信人的核心能力不在于能够自己跑通一个流程,出几张图,更多的是以下几点。

  • 所在领域生物学知识的精通
  • 强大的数理基础
  • 极强的统计学基础
  • 数据分析、数据挖掘思维
  • 对于算法的深刻理解
  • 一定的编程思维,超强的代码能力
以上六点是从硬实力来分析生信高薪人才应该具备的能力。具体的上限更多靠的是个人的软实力。这样的生信人不仅仅在工业界在科研领域也是备受推崇的。
总结:因此如果你追求的是第一种生信那么其实可能大概率会远低于你的预期,如果有更好的选择,建议不要盲目的来学习生信。如果你追求的是后面我谈及的具备上述六点能力的生信人,那生信一定是生物行业中很有前景的专业。
回复 支持 反对

使用道具 举报

发表于 2024-9-25 21:14 | 显示全部楼层
据我观察,生物信息与其他生物类方向的毕业生的差异,主要在于:

  • 做生物信息的研究生,主要习得“生物信息分析”技能;
  • 其他生物类方向,主要习得“分子生物学实验”技能。
为了回答这个问题,我专门去猎聘网注册了一个账号,使用这两个关键词来检索。由于得到的结果较多,我使用了两个条件来筛选:

  • 城市:广州
  • 行业:制药/生物工程
两者均得到了100+个检索结果。
为了比较两者薪资的差异,我用python脚本提取了检索结果的前5页,统计两种岗位的薪酬平均值和标准误,得到的结果为:

  • bioinfo: 10.96±0.41(单位:千元)
  • molecular: 7.66±0.26(单位:千元)
结果表明,两者的岗位数相当,生信岗比分子生物岗的月薪多出约3k/月。

代码:
import re
import numpy as np

# 每个检索结果的前五页,手动另存为html文件。
# 生物信息:生信/{page}.html
# 分子生物学:分子生物学/【广州招聘信息_广州人才网招聘信息】-广州猎聘{page}.html

job_list = []
job_list2 = []
for page in '12345':
    print('page', page)
    a = open(f'生信/{page}.html', encoding="UTF-8").read()
    jobs = re.findall(r'<div class="job-info">.*?</div>', a, re.S)

    for i in jobs:
        position = re.search(r'<h3 .*?<a .*?>(.*?)</a>.*?</h3>', i, re.S).group(1).strip()
        try:
            salary = re.search(r'<p class="condition clearfix" title="(\d+)-.*?">', i).group(1)
        except(AttributeError):
            print(i)
        job_list.append((position, salary))

for page in [''] + [f'-第{i}页' for i in range(2,6)]:
    print('page', page)
    a = open(f'分子生物学/【广州招聘信息_广州人才网招聘信息】-广州猎聘{page}.html', encoding="UTF-8").read()
    jobs = re.findall(r'<div class="job-info">.*?</div>', a, re.S)

    for i in jobs:
        position = re.search(r'<h3 .*?<a .*?>(.*?)</a>.*?</h3>', i, re.S).group(1).strip()
        try:
            salary = re.search(r'<p class="condition clearfix" title="(\d+)-.*?">', i).group(1)
        except(AttributeError):
            print(i)
        job_list2.append((position, salary))

bioinfo = [int(i[1]) for i in job_list]
bioinfo_mean = np.mean(bioinfo)
bioinfo_stderr = np.std(bioinfo, ddof=1)/np.sqrt(len(bioinfo))

molecular = [int(i[1]) for i in job_list2]
molecular_mean = np.mean(molecular)
molecular_stderr = np.std(molecular, ddof=1)/np.sqrt(len(molecular))
print(f'bioinfo: {bioinfo_mean:.2f}±{bioinfo_stderr:.2f}')
print(f'molecular: {molecular_mean:.2f}±{molecular_stderr:.2f}')
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表