立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 2642|回复: 5

[分享] 请问生物信息学如何?

[复制链接]
发表于 2024-9-26 15:12 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2024-9-26 15:12 | 显示全部楼层
简单来说,生物信息学可以概括为一门混合科学——介于计算机科学和生物学之间。但是,想必诸君并不会满意这个简单的答案。


生物信息学的实践可以追溯到 1960 年代。此时,被称为生物信息学之母玛格丽特·奥克利·戴霍夫 (Margaret Oakley Dayhoff)开发了一个计算机程序来帮助确定蛋白质序列 (1)。Dayhoff 博士开发了单字母氨基酸代码,使序列更容易使用打孔卡输入计算机。她的单字母代码至今仍在使用,这让生物化学专业的学生非常懊恼,他们已经记得够多了!
术语至少 1970 年就已经存在,当时 Ben Hesper 用它来描述“生物系统中信息过程的研究”(2)。然而,从那时到 80 年代,生物信息学的概念从一般描述生化网络转变为使用算法比较数据的序列分析的同义词。在这一阶段,两个最重要的贡献者是 Elvin Kabat 和 Tai Te Wu。他们收集并比对了人类和小鼠的氨基酸序列,并使用一个简单的数学公式来计算每个位置的各种氨基酸替换,并预测 [蛋白质] 片段的精确位置”(3)。他们的数据库在整个 70 年代末和 80 年代以印刷形式发布。
到 90 年代末,生物信息学被称为在生物学中使用计算方法进行比较分析这更符合今天的定义,但在 90 年代,序列分析仍然是焦点,因生物信息学在人类基因组计划 (HGP)期间获得了公众关注 (4)。可以说人类基因组计划是生物信息学的跳板,因为这项研究已成为一场戏剧性的科学竞赛。HGP 于 1990 年作为一项公共资助项目启动。以当时的技术,对人类基因组中的全部 30 亿个碱基对进行测序是一项巨大的挑战!科学家们必须绘制一个基因图谱,将其分成小片段进行排序,然后使用该图谱将序列重建为一个整体。可以说,这是一个缓慢的过程!98 年,一家名为 Celera 的私营公司应运而生,与公共项目展开竞争。由 J. Craig Venter 博士领导,Celera 是一家生物技术公司,使用计算方法自动匹配序列的重叠部分(5)而不再需要映射或缓慢、费力的人工组装。这就是生物信息学的全部内容!
在 HGP 完成后的几年里,计算机在生物研究中的使用有增无减。生物信息学已经涵盖各种各样的领域,从免疫学到心脏病学再到神经科学等等。在所有这些领域工作的人们每天都在使用计算机科学来增进我们对生命科学的理解!随着生物信息学家努力将生物化学和医学的进步与计算机处理能力的快速进步联系起来,我们已经开始接近一个医学科学与摩尔定律同步进步的世界。
至此,我们得出了答案,至少按照今天的理解:生物信息学是使用数学和计算技术创建、改进和理解大量数据,以提高新发现的质量和速度。谁知道这个定义在未来几十年会发生怎样的变化?
参考资料:
https://macromoltek.medium.com/what-is-bioinformatics-anyway-62e4ef912093www.computer.org/csdl/proceedings/afips/1962/5061/00/50610262.pdf http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3068925 Lo, Benny K.C., Antibody Engineering: Methods and Protocols. Humana Press, 2004. http://www.genome.gov/12011238/an-overview-of-the-human-genome-project http://www.nature.com/scitable/topicpage/dna-sequencing-technologies-key-to-the-human-828
回复 支持 反对

使用道具 举报

发表于 2024-9-26 15:13 | 显示全部楼层
看了一下前面的回答,同意如果只是粗略地学一下,建议别碰,不仅生物信息学别碰,任何学术相关的专业方向也最好别碰,学术是有它的严谨性在的。也看了很多其他回答,来自很多其他专业或者生信本科出来吐槽这个专业是三无专业的。先说我本人不是学生信出身的,由于这段时间做的是谱系,需要用到组学的分析也就是生信,因此接触了一点生信的方法和一些从事生信研究的学生和大牛,以及可能因为是个大课题,其中一环涉及生信较多,或许比一些学习或者从事生信基础工作的同学更了解生信在现在生物项目中的作用。
首先我得给生信平反一下,这个专业的门槛绝对高,逼格也有,一般搞生物的看不懂,一般搞信息学的也看不懂,可是两边的他都得懂哇。在知乎似乎一沾上生物便要被骂了,就连我一个药学出身,没有进临床,反倒去从事基础研究的都想骂自己,无外乎是由于国内环境对此的付出和回报不成正比,每年荣居没前途没钱途的专业榜首,一边高喊谁规定搞科研就必须安贫乐道,一边又害怕劈头被喷又当又立,混不好的骂环境形势大流,混得出名点的须得夹缝中做人,一不留心晚节不保。说偏了,言归正传,宽泛地讲,如果把生物信息学(生信)和生物学、信息学放到一起比较的话,确实生信的人羡慕搞信息学的,而学生物的人现在基本上都仰慕搞生信的。信息学的人,知乎把你们放在生物链顶端,有没有觉得自己很牛?也没有对不对,学信息的人千千万,也不就是底薪比别人高了点对不对。(欠扁)
首先说为什么学生物的觉得生信厉害呢,生物是一门实验与观察的科学,从列文虎克拿起显微镜观察到一个个小室一样的细胞,给它取名为cell开始,生物学开始进入高速发展。从个体到细胞,从细胞到分子,生物学随着科技一步一步发展,到了近年,生物学的研究观察对象已经从单个到多个,多个到无数个,从二维到三维,三维到n维。我们人类是个三维动物,无法理解多维的事物,也无法同时对比无数个对象,但是计算机就可以,还能把多维的数据化成图像,再把图像可视化为二维、三维我们可以理解的画面。生信专业的人的工作就是如何使用编程来处理这些大数据,以及看懂这些数据和图像所代表的意义。对于学生物的人来说,或者说对于没有任何计算机基础的人来说,如何使用各种计算机语言是一件非常棘手的事情,更别说自己编写各种算法了,感觉那都是天才干的。
国内读生物的孩子都知道现在生信很火,就连我现在老板想招生都得让他手下的几个博后轮流给上试听课好吸引多点生源。(看,现在的孩子多有前途,当年我啥也不懂就入了基础研究的大坑)但是呢,我了解的越多,越发现国内的生信专业是个paradox。从何说起呢,前面有回答的人说过了,搞生信不仅要学生物、医药学等等专业课,还得苦学各种计算机编程语言,苦逼是相当苦逼的,可是工资和计算机的相比,还差了一大截,勉强就跟生物端平。现实状况确实是这样,而且,论深造的前景,首先生信的硕士往往无法单独完成一个课题,他们不做实验啊,也就说鲜少有人能单独发一篇一作的。这样的后果就是,读生信硕士的人很难申博继续深造,而基础生物硕士的人,博士想转到生信,又因为本硕没有生信基础望而却步。而且,搞生信一项是编写程序,难度高,且变现能力远没有其他类似于编游戏、网站、系统等等来得快、强;还有一项就是数据的处理和分析,生物信息,拿我们人体某个细胞为例,想象DNA、RNA、蛋白质等数量可以有多大,光是单个细胞,生物数据多大多复杂,生物数据分析好了,其他分析也就湿湿碎了,就我所知的有好几个搞生信分析特顶尖的师兄,都转行去投行了。
曾经的我硕士毕业后也纠结过要不要申生信的博,现今生物已经很少是单一方向的研究,越来越向组学(通俗点来说就是基因组、转录组、蛋白组等等等组的组合)发展了,一旦涉及组学层面,毕竟实验做得再好,结果还得交给生信来做分析。我也遇到的困窘就是,一把年纪了深感自己无法从头开始学计算机了,学不动了,也很难有更多的精力去让我尝试一下可能。最终工作让我不得不接触生信,学了一点开始即便我不懂编写算法,但是资源丰富啊,有非常多大神写下的包,可以直接拿来用,我可以不懂编程,但我只要看懂图就行。可是当我学会了方法,我就发现自己根本不懂这些数据背后的统计学意义,完全不明白这样筛选、处理的数据代表什么。这也许也就是生信入门的困窘,开始学会一点马上发现更多的无知,只能一点一点去攻克、深耕,每行每业都一样吧。
总的来说,我觉得生信是一把利器,因为没有生信的分析,就无法破解现在前沿的研究中人脑无法处理数据图像,但毕竟是把器皿,终究为人所用。这点我想给所有搞基础生物学的人一点信心。
回复 支持 反对

使用道具 举报

发表于 2024-9-26 15:13 | 显示全部楼层
好多劝退的哈,作为一个云计算行业资深(划掉)从业人员,我来加把火(再次划掉)打点鸡血,各位轻拍。
看一个学科怎么样,要观察其关联学科的发展。
特别是生物信息这种交叉学科,随着计算机科学特别是近年来云计算的发展,它的未来还是有很大潜力滴。
特别是在今年Covid-19疫情大爆发的背景下,大家都不计成本地寻找疫苗或特效药。
不计成本的意思是钱管够,在这个前提下,很多原先很难办到的事情都有了点眉目。
比如我们都知道,云计算的一大特点是可以提供难以想象的超级算力
而如今的生物信息很缺算力。
比如在新药研发领域,当前虚拟筛选通常采样百万到千万个分子,而事实上,现阶段可用于药物发现的有机分子已经超过了10的60次方
我们不过是从大海中捞了一滴海水来做虚拟筛选。
但是以前没有钱,只能望着汪洋大海流泪。
刚才我说啥来着?
钱管够!!!
本地资源不够,就花钱上云进行虚筛。
效率能提升多少呢?
正好有一个活生生的案例:
今年3月,哈佛大学医学院(HMS)的研究人员在《Nature》杂志发表了论文《An open-source drug discovery platform enables ultra-large virtual screens》,描述了一个叫做VirtualFlow的开源药物发现平台,能通过云端整合海量的CPU对超大规模化合物库进行基于结构的虚拟筛选,提高药物发现效率。
论文作者Christoph Gorgulla称,在一个CPU上筛选10亿种化合物,每个配体的平均对接时间为15秒,全部筛完大概需要475年,而HMS利用VirtualFlow的平台,调用160000个CPU对接10亿个分子仅耗时约15小时,10000个CPU则需要两周。
而且根据观察,该平台是可以线性扩展的,也就是说处理器数量增加多少倍,筛选能力也会随之增加多少倍。
关于这个平台的详情可戳:
速石科技 fastone:15小时虚拟筛选10亿分子,《Nature》+HMS验证云端新药研发未来所以,作为云计算行业从业人士,我们是真的觉得云的未来充满光明。
哎哎???不好意思串台了,重来——

我们是真的觉得生信的未来充满光明!!!

码字不易,喜欢请点个赞哦~
回复 支持 反对

使用道具 举报

发表于 2024-9-26 15:13 | 显示全部楼层
生物狗跨行生信,给一些大概感想。
生信其实算热门研究领域,研究方向很多。但是如果不考虑读研,建议别碰。专业说起来不三不四,交叉行业最后出去工作的尴尬是搞算法不如计算机行业,搞生物不如湿实验的,可怜的一批。最近流行湿实验室直接和计算机系的人合作搞研究,效率还很高,导致生信行业未来堪忧。而且如果关注生信领域研究的人应该大概能发现,现在生信文章大部分算法文章都是计算机系和统计学系的人在发,生信的人一般都是结合湿实验,所以你懂的!
其实生信就是利用计算机和数学方法来分析生物数据,如果中间生物知识的障碍因为合作消除,为什么不直接请计算机大牛来分析???
Reasons Not to Study Life Science or Anything Related说到底,就是不赚钱。别人计算机本科985硕士出去一线城市996就30w起步,你博士出去还不一定30w,最后还是只能回来学校混。。
<hr/>限于学识,仅供参考!
回复 支持 反对

使用道具 举报

发表于 2024-9-26 15:14 | 显示全部楼层
个人某985生物信息学今年本科毕业,本校的生物信息学针对的是医学向,整个本科期间累到死!!!!每天都在上课!!!学医学,学计算机还有一些奇怪的知识等等到最后都不知道学了什么,大一来的时候斗志昂扬,到大三基本上每个人都蔫了,都不用社会毒打,自己已经丧失信心了,大三暑假参加夏令营,见过其他一些学校这个专业的同学,针对农业向的到可以接受,但有人竟然表示从没有学过计算机,还有人说是针对物理方向,化学方向的生物信息学,听了也是醉了,我们学校的医学院是全国都很知名的医学院(就不透露了,已经有百年历史了)去年10月份有一次来了300家医院和医疗机构招员工,当然也有可能是主要招医生的原因,其中三甲医院有200多家,具体不是很清楚了,但一共就不到5家招收生物信息学专业,有一家还要求硕士,除华大基因给出的工资是8000加,还有一个杭州的机构给出1万加,医院只给3000到5000这个样子,当然自己主动去外面找可能会有比较高的,但是大多数都要求硕士甚至博士学历,所以本人现在在读研,换了专业名称,但还是在做生信,其他的本科同学基本上换了别的专业读研或者工作出国,想挣钱的话就跨考计算机去了,仅个人经历给你参考,有人说本科并没有真正读生信,我研究生阶段才是彻底开始学生信了,所以不好妄言评价,但就目前来看,个人认为生信最后以后做个大学老师,或者做做研究员之类的是相对比较好的工作,去企业的话,不比做程序员的轻松,而且工资也比程序员低很多
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表