立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 81|回复: 5

[分享] 研究生想要学习生物信息学方向,基本零基础,有什么推荐的学习材料吗?

[复制链接]
发表于 2025-5-10 15:40 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
目前大三,已经确认读研的去向了,接下来一年都比较空,想学一些生物信息方面的内容,目前只有大一期间学过简单的Python,还有学校开的生物信息课,基本只交了我们用一些网站之类的工具。其实对生物信息还是没有一个深刻的了解,想学一些这方面的知识,应该先从Python开始学起吗,还是直接入手生物信息学?

原文地址:https://www.zhihu.com/question/614794082
楼主热帖
回复

使用道具 举报

发表于 2025-5-10 15:41 | 显示全部楼层
本人华中农业大学本科生信专业毕业,算一算已经在生信行业工作了7年了。
首先回答你的问题:
直接入手生物信息学而不是从Python学起。
Python是编程语言,它是工具,它可以做任何事情,而不仅仅是生物信息学。从Python学起到头来还是不能解决你的问题------“对生物信息还是没有一个深刻的了解”。所以建议还是把重心放到生物信息学本身上。
然后
学生物信息学本身是学个啥,怎么学。我感觉这话题就大了,不是简单几句说的清楚的。
结合你是准研究生,而且大概率是生物方向的研究生,我觉得你还是从看一篇基础的转录组分析的文章开始吧。这种转录组的资料网上真的一大把,无论是视频还是博文,如果说不知道怎么找,我觉得吧,还是放弃自学比较好。手动狗头。
看这种资料刚开始肯定有大量的术语,大量的问号。但这就对了,从一篇文章开始,了解这些术语是啥,然后文章讲的是啥,分析的过程是怎么样的。就当是看个故事,一点点的了解,不懂就百度。等到弄懂了基础的转录组分析文章,也大概对生物信息学有个认识了。
接着
复现流程,也就是生信的实操。安装linux,学习shell,安装该死的生信软件,学习R或者python,等等,这些都是在你对生信分析做了些什么有个大概的认知之后再去尝试。过程绝对是艰难的,但自学嘛,本来就不会容易。
最后
能把流程基本跑通,再去深挖细节,数据的理解,软件参数的应用等等吧。做到这些应该就能应付你研究生的生信工作了。
*这些都是基础的流程,生信的内容很多,等到把这些弄明白了,再去结合研究生方向具体学习更深的内容会比较好*

祝研究生生涯顺利
回复 支持 反对

使用道具 举报

发表于 2025-5-10 15:41 | 显示全部楼层


二十一世纪是生物的世纪,该观点已提出多年。
甚至有人提出,这句话的真正含义应该是“二十一世纪在各行各业都能找到曾经学生物的人”。
对此,我们不再做进一步推敲。
但可以看出的是,越来越多人已经投身于生物相关研究了。
还不问问自己,是不是快成了那个掉队宝宝啦?

生物信息学分析入门



生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,以信息技术及其相关的手段对生物问题进行探索研究。
生物信息学,信息是手段,生物是核心。
生物信息学分析,目前主要用于肿瘤类疾病的研究。
想尽快领悟生信分析领域,需要从2方面着手准备:文章套路、数据复现。
所谓文章套路,即解读文章时应从宏观思维出发,能理解文章的逻辑思维。
而数据复现,则是对文章结构有所了解后,能进行模块化拆解还原,即可以复现出所有模块的数据。
理解了文章套路,复现出文章数据,才在一定程度上掌握了文章的技能。





▽  生信研究四大模块


生信分析研究最主要的思想可概括为:挑、圈、联、靠。

挑(分子):筛选出和疾病相关的差异表达分子。

圈(功能):对筛出的差异表达分子进行标签化、归纳和分类,如GO及KEGG分析。

联(关系):进行分子与分子间、或信号通路和信号通路之间的连接,如PPI分析。

靠(临床):是否与临床表征有明确的关联,如PFS、OS等。


生信分析主要模块内容及相关分析工具如下所示。



以上只是给出了生信分析的主要关键点,并非一成不变。
在具体的生信分析中,需要根据实际情况做相关的逻辑组织哦。


▽  生信分析实例


看到这儿,大家肯定还是有点迷茫。
接下来,SAM给出一个生信分析的具体实例,看完大致就可知道生信分析在做什么啦。

01.挑分子



上图是国内学者2021年发表于期刊OncoTargets and Therapy的生信相关文献。

题名:Identification of HOXD10 as a Marker of Poor Prognosis in Glioblastoma Multiforme (HOXD10为多形性胶质母细胞瘤预后不良的标志物)

需要注意的是,在开始具体分析之前,此论文作者已通过前期筛选,得到了一个与母细胞瘤疾病发展相关的关键分子(HOXD10),即已完成了生信分析的第一步:挑分子。

02.靠临床


针对该研究,作者首先证明,HOXD10在肿瘤组织中的表达高于正常组织(A)


随后作者利用不同来源(TCGA、CGGA、GEO)的数据,通过生存分析证明了HOXD10表达水平影响患者的生存时间。

该部分通过表达分析和预后分析,阐明了HOXD10与肿瘤的发生发展相关。

作者首先证明,研究的分子具有临床意义,是具有解决临床问题的潜在价值的,值得后续做更深层次的研究。

这部分,实现了“靠临床”。


随后作者又通过单因素COX回归分析,探索了不同临床特征下(是否全切除、是否TMZ治疗、是否放疗、IDH1状态、HOXD10状态),HOXD10对预后的影响(A-E)。

又通过多因素COX回归分析,探索了影响患者生存的独立预后因子(表2)。

此部分,作者仍然是做“靠临床”的分析。


03.圈功能

前面通过各种分析论证了HOXD10影响疾病发展,接下来作者探讨了HOXD10参与肿瘤发生发展可能的作用机制。




作者先筛选出母细胞瘤中与HOXD10表达模式相似的一群差异基因(A)。

随后通过富集分析探索了这群基因可能参与的生物学过程、发挥的分子功能(B),及其涉及的信号通路(C)。

可以看到,这群基因主要与细胞因子-细胞因子受体相互作用通路相关。

该部分,作者进行了“圈功能”的分析。

04.联关系



最后,作者通过蛋白-蛋白互作(PPI)网络,呈现了这群分子之间的相互作用形式。

该部分,作者进行了“联关系”的分析。

作者虽然不是完全按照“挑、圈、联、靠”的过程进行内容整合,但生信分析的精髓可是面面俱到啊。
这也充分说明了生信分析的灵活性,给足了我们自由发挥的空间,说“一千个人一千个哈姆雷特”也不为过。




在这里喵学姐只呈现了部分简单结果,主要展示了生信分析的4大节点。
该研究还有很多其他精彩的部分在此不再做过多分析,感兴趣的小伙伴可以自行阅读深究哦。
相信现在的你,心里又有一个不解之谜了。那就是:这个分子是怎么找到的?是不是觉得,有了这个分子,世界皆在我脚下!!

这真是应了“万事开头难”,我要是有这个分子,我也会生存分析、COX回归对不对?




可是问题又来啦,即使找到了这个分子,可是要分析,那数据又从何而来呢?
这真是,一波掀起千层浪啊。
既然看明白了文章套路,就需要研究如何找分子、数据从何下载、如何下载、数据如何处理、用什么统计分析方法、如何分析等问题啦,这就进阶到了数据复现。

若有疑问,或想要了解某个方面的信息,都可以给我留言,或者联系我哦。




让你的心我的心串一串…生信相关分析,欢迎共同探讨
回复 支持 反对

使用道具 举报

发表于 2025-5-10 15:41 | 显示全部楼层
答:
1)计划当个回程工程师,随便学都可以,因为最后场景只需要你跑流程
2)计划搞生信应用,那可以先简单学编程,关键还是刷一些生信分析应用相关paper,你需要脑洞,新 idea 才能想出来更好的应用。这一块需要你有湿实验的经验,对生产也有了解。也是目前大部分人口中的生物信息应用
3)你正好就像搞生物信息,其实到底还是数学、统计....折腾一下机器学习....(PS:目前我正在补充这个)
回复 支持 反对

使用道具 举报

发表于 2025-5-10 15:42 | 显示全部楼层
生物信息学的内容是相当广泛的,包含多组学内容,机器学习方面,和药物设计方面。要入门的话,首先是必须有生物学基础知识,了解基本的生物学概念和生物分子的结构功能是学习的基础。
然后就是编程技能,建议先学Python编程语言,它在生物信息学领悟应用广泛且易上手。
如果确实没有方向感,可以观看这篇文章,或许能从中找到一些自己需要的内容,参加学习对生物信息学可以有更深层次的理解并直接应用到科研领域
《自然》杂志热点:人工智能在多组学和药物发现中的应用
回复 支持 反对

使用道具 举报

发表于 2025-5-10 15:42 | 显示全部楼层
看你未来想做生信的什么方向。但是国内大抵是先从组学开始,可以自学一点统计和R语言。做一些小的项目。可以参考我的以下回答~
如何自学生物信息学?
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表