生物信息怎样？

乔帮主 · 发表于 2024-9-16 07:15

登陆有奖并可浏览互动！

您需要登录才可以下载或查看，没有账号？立即注册

×

本科生物技术，大二，想考生物信息方面，不知道前景怎样？还有如何学习生物信息？希望各位大神给点建议。十分感谢！

原文地址：https://www.zhihu.com/question/447008988

检验医师 · 发表于 2024-9-16 07:16

现在积累的生命科学数据，已经达到百万TB级别，DNA测序，蛋白测序，代谢组数据等等，未来还需要强大的分析和存储系统，但是最重要的是，需要能够调动这些数据的人。生物信息学是跨界高维打低维的唯一方式。没有之一。

卡卡 · 发表于 2024-9-16 07:16

我和题主一样，本科也是生物技术，有段时间对专业的前景很担忧，不知道毕业之后所学的这点生物知识能做些什么，况且知乎上关于生化环材“四大天坑”的论调不绝于耳，更是让我焦虑不已。后来，我接触到了生物信息学，发现居然不用做实验也能发论文，而且又是和计算机有着很大的关联，知乎上普遍说法都是“生信是生物专业的天花板”。
这个说法有一定的道理，毕竟会做实验的人不少，但是懂生信的人就少了，国内很多大学都没有开设这个专业，许多人都是靠自学，研究生再转向生信的，所以题主如果对生物实验不是特别热爱的话，可以考虑从现在开始转向生信的学习，少去实验室，多敲代码。
那么该如何学习生信呢，我个人认为，可以先从一门编程语言入手，比如Python或R，不需要精通，但至少要达到能解决各种报错的水平，也就是遇到问题，能自行上网搜索解决，而非是一头雾水，不知所以。再往后就要学习Linux系统了，这是很漫长的一个学习过程，不要想着短时间内就能了解清楚，而是要循序渐进，先从基本的命令开始，一个个去记，比如怎么复制、删除、移动文件，怎么在上面安装各种包。
再往后，就看导师的研究方向和个人兴趣了，是想做组学分析还是算法开发抑或其他，根据实际情况来学习，毕竟生信虽然还是一个小众的领域，但是其涵盖的内容可一点不少。一边是要掌握编程，另一边又要学习生物学，更要有统计学的思维，唯有如此，才能算是一个合格的生物信息学习者。
先写到这，之后再补充，欢迎大家关注我的vx公众号&#39;生物信息技术&#39;。

感恩由您 · 发表于 2024-9-16 07:17

在你对生物信息学这个专业有了全面的了解之后，相信你会对这个专业抱有希望。
什么是生物信息学？

生物信息学是应用计算技术来处理与分子生物学相关的快速增长的信息库。生物信息学结合了不同的研究领域，包括计算机科学、分子生物学、生物技术、统计学和工程学。它对于管理和分析大型数据集特别有用，例如由基因组学和蛋白质组学领域生成的数据集。
生物信息学的发展

生物信息学领域已经存在了几十年，但是由于人类基因计划，生物信息学在2000年得到快速发展，人类基因计划是一个具有里程碑意义的国际科学研究项目，于 2003 年 4 月完成，首次提供了一个完整的基因蓝图。
生物信息学在越来越多的领域得到应用，例如基因测序、基因表达研究和药物发现。例如，在医学中，生物信息学可用于识别特定疾病与导致疾病的基因序列之间的联系。药物基因组学领域使用生物信息学数据，根据患者的 DNA，为接受治疗的患者量身定制治疗方案。2通过开发新的、更强的抗体，生物信息学也可用于开发更有效的疫苗。
生物信息学的目标

生物信息学领域有三个主要目标：

以有效的方式组织大量的分子生物学数据
开发有助于分析此类数据的工具
准确而有意义地解释结果

生物信息学的出现和迅速崛起是由于计算能力和实验室技术的大幅增长。这些进步使处理和分析生命本身核心的数字信息（DNA、基因和基因组）成为可能。由于生物信息学可用于任何可以以数字方式表示信息的系统，因此它可以应用于整个生物体范围，从单细胞到复杂的生态系统。
生物信息学能够做什么的例子

生物信息学要处理的数量惊人的数据和信息，考虑人类基因组。基因组是生物体的完整 DNA 集。
DNA 分子由两条扭曲的、成对的链组成，每条链由核苷酸碱基组成，包括以下内容：

腺嘌呤 (A)
胸腺嘧啶 (T)
鸟嘌呤 (G)
胞嘧啶 (C)

人类基因组包含大约 30 亿个这样的碱基对。基因组测序涉及找出所有 30 亿个这些 DNA 核苷酸的确切顺序，如果没有大量的计算能力，这是不可能实现的壮举。
科学家们已经解码了数千种生物的 DNA，创建了一个庞大的遗传数据库。这已经创建了许多以不同方式使用这些数据的子字段。一个例子是计算进化生物学。该研究领域着眼于一个物种的 DNA 如何随时间变化，提供比物理比较所能提供的更详细的信息。
参考资料：https://www.investopedia.com/terms/b/bioinformatics.asp

感恩由您 · 发表于 2024-9-16 07:18

作为一名生物信息关联行业资深（划掉）从业人员
我来给题主提供一些其他视角的意见
各位轻拍

我是搞云计算的
大家都知道（并不）我们这个行业属于特殊行业（？？？？）

哪里特殊呢？？
别的行业都是被吹上天的
而我们云计算自打出生那天起就一直在天上（再次划掉）。

尤其是在新冠疫情爆发后
云计算的实际应用加快了不少

现在生信的情况就跟云计算有点类似
毕竟国外的疫情一波接着一波
逼着全球都在不计成本地开发疫苗或者特效药

不计成本的意思就是——
老子有钱！！！

这句话不仅很有气势
还很有用
比如特别费钱的新药开发
动不动就是几十亿美刀下去
还不一定有什么水花

现在好了
一句老子有钱
研发费用加一个……啊不……加一串零
麻溜滚去干活！！！

有了钱
下面就是SHOWTIME

比如生信在药物研发中十分重要的一步——虚拟筛选
当前能够用于药物发现的有机分子总数已经超过了10的60次方
而我们通常只采样百万到千万个分子
为啥？
没钱啊……
但刚才我说啥？
老子有钱！！！
真·梦想照进现实

2020年3月
哈佛大学医学院在《Nature》上了发了篇论文
说他们搞了一个VirtualFlow开源药物发现平台
能在云端整合海量CPU对超大规模化合物库进行基于结构的虚拟筛选
从而提高药物发现效率

作者称依据他们选定的条件
在1个CPU上筛选1种化合物需要15秒
那么筛选完10亿种化合物则大约需要475年
而他们利用这个平台调用16万个CPU对接10亿个分子只用了约15小时
1万个CPU则需要两周

以前也不是没有这么尝试过这种思路
但这一切都基于现在的这句——
老子有钱！！！

而且该平台还可以线性扩展
也就是说处理器数量增加多少倍
筛选能力也会增加多少倍

当然前路还很漫长的
从10亿到10的60次方还有很多很多0
但起码我们看了一种新的可能性不是吗？

关于这个平台的详情可戳：
速石科技 fastone：15小时虚拟筛选10亿分子，《Nature》+HMS验证云端新药研发未来因此，作为云计算行业从业人士
我们是真的觉得云计算的未来充满光明

哎哎？？？不好意思串台了，重来——
我们是真的觉得生信的未来充满光明！！！!

加油！！我们在天上等着你们！！！！

码字不易，喜欢请点个赞哦~

继续前进 · 发表于 2024-9-16 07:18

建议就是：生物背景的、对生物没爱只奔着容易转行来学的人，别学生信专业。
生物转分析生信还算简单，但是分析生信也不需要读研专门学，概率统计学的好加上会Linux、Python和R就行，而且这些工作大多在干湿结合的生物实验室里。
而要是转算法生信，那对生物背景的来说转的难度和学习过程的痛苦程度不亚于直接转cs/ml，那还不如直接转cs。
但强转cs也不合适，因为cs读研及以上都是些屠龙术，现在ml/dl都这么卷了，还不如本科毕业之后自学一年Java、计网/系统、刷leetcode直接去小公司当开发。
挤什么算法啊。
——分割线——
如果你吃定了生信，怎么学可以看这儿：https://www.zhihu.com/question/438674102/answer/1670016558

图文播报

[分享] 生物信息怎样？

登陆有奖并可浏览互动！

发表回复

官方推荐 /3

个人中心