立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 295|回复: 5

[分享] 如何给一个学计算机的人讲懂什么是质谱分析?

[复制链接]
发表于 2025-3-10 17:13 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2025-3-10 17:13 | 显示全部楼层
不请自来,做了五年质谱的人来答一发……
首先,针对你的问题,如果想让同学对质谱有个基本的了解,推荐清华大学李艳梅老师有机分析公开课绪论的现代仪器分析一章(B站上就能搜到),质谱一共就讲了10多分钟,但比较深入浅出,应该对你同学有所帮助,之后再让他看一些波谱分析的教材,上面也一定会对质谱构成及气质的解谱有比较详细的介绍
然而,对于你同学的研究课题,我觉得还是比较难做的。因为目前对质谱的裂解原理研究尚有很多不清楚的地方(尤其是液质),因此计算机不是靠建立算法,而靠着标准谱对比来定性的。简单来说,在技术已经很成熟的EI源中,碰撞能量等条件完全一致的情况下,同一化合物的质谱离子碎片和丰度应该是基本一致的,计算机据此来匹配化合物。目前NIST数据库已经涵盖了大部分已知化合物的EI源的质谱图,核磁和红外谱图(可搜索官网),各大仪器公司也有成熟的补充商业数据库可供选择。而液质ESI源由于目前仪器的制造技术不成熟,二级质谱图在不同的仪器上在丰度上尚不具有可重复性,往往只能一台专机一个库,因此还没有大规模的通用商业数据库。
此外,目前市面上根据分子结构通过已知裂解规律来拟合碎片结构的软件也已经出现,我个人接触过的就有赛默飞、ACD和安捷伦家的软件,但是做得都不是特别好,拟合出来的结果涵盖了所有可能的裂解途径,会生成很多冗余的数据,同时还会出现明显错误的结构,因此目前我们对于未知化合物的解谱基本还是靠人力⊙∀⊙……如果你的同学有心,可以在深入了解质谱解析的情况下,尝试改进这方面的算法。
回复 支持 反对

使用道具 举报

发表于 2025-3-10 17:13 | 显示全部楼层
非串联的质谱是一个函数,可以将两个M维空间向量M1...MM,M1...MM'转化为两个N维空间向量N1..NN,N1..NN'。
其中M为被测物质量,N为m/z值,两个'向量中第二个是各自的概率(强度),满足归一化,对于每一个被测物,除了它的M,还有一个固有属性K1...KK为正整数序列,K1‘到KK’为概率分布,代表由被测物化学性质决定的电荷分布
函数本体是
Foreach M in M1 to MM
Foreach N in N1 to NN
Foreach K in K1 to KK
If (N等于M/K+madduct(质子,钠等等charge carrier的质量))
    N'加等于M'× K'
以及AI做这个目前来说不怎么好做,数据产量太小,你能ML的出来的东西都有算法给你yes or no answe,没有算法给你准数的东西想养出来一个靠谱的算法我之前随手估计需要上万instrument hour做supervised learning,别跳坑……
回复 支持 反对

使用道具 举报

发表于 2025-3-10 17:14 | 显示全部楼层
这句话"我在想怎么去给他清楚质谱图?"是什么意思?求解释。
用计算机的思维去理解质谱图,用人工智能做智能识别,可以这样考虑。质谱图是一个字典(Dictionary)。字典的键(Key)是分子量,键对应的值(Value)是这个分子量的信号强度。
做人工智能的话,需要首先对原始数据做预处理,整合成为样本-特征的形式。每一个质量数是一个特征,质量数对应的强度是特征值,这是一种最直观的办法。一个质谱图就是一个观测样本。
需要前处理的是很多质谱图在出峰的地方采样间隔小,不出峰的地方采样间隔大。这样的数据文件既可以保证研究人员关注的出峰信息的准确,又可以保持数据文件容量较小。我看过很多质谱都是这样。如果是这样,就需要插值一下保证每一个样本都有相同的质量数,也就是每个样本的特征是相同的。
还有其他的方法。总而言之,一张质谱图就是对样品的一次观测,做数据处理就是一个sample或者一个observation。这个数据呢就是一个上面说的字典。至于你从这个字典里面提取什么样的特征(features),那就是看你们具体做的事情了。
这个问题最对我胃口,我就是化学硕士,做数据分析和算法。
回复 支持 反对

使用道具 举报

发表于 2025-3-10 17:14 | 显示全部楼层
按我的粗浅理解,类似于:
把一台不知道里面装了什么硬件的电脑主机箱一锤子砸碎(电离),然后按碎片跌落的距离(质荷比)大致判断都有哪些零件。
比较轻的、飞的远的大概是内存条;其次是硬盘;再近点是显卡………最后是主板。
┐(´-`)┌
回复 支持 反对

使用道具 举报

发表于 2025-3-10 17:15 | 显示全部楼层
这个问题有点难度了,如果是综艺节目答题抢分,我会说:过过过!
有的时候做质谱也是算是一门艺术,需要有点灵感和天分的,老衲曾经合成过一个环烷烃,四十几个碳,分析小哥和我说老难为他了,没有活性官能团,能量小了电荷粘不上,能量大了打碎了。
以上是废话,以下是我的看法:
1.最大分子离子峰是结构确认的必要条件而非充分条件;
2.结构确认还需结合分子裂分的机理去推断;
3.裂分要从基础四大化学学起。
结论:
1.学计算机的人学不会,讲不清,听不懂,别费力气了;
2.做软件可以仪器分析与编程分开做,编程做逻辑,仪器分析做条件。

另外这个活已经有人做了大部分,如下:
1.有化合物数据库和图谱库,可以买来进行数据比对,直接得出结论;
2.有个化学界非著名软件Chembiooffice,CambridgeSoft软件出的,有很多牛人,对分子裂分的机理进行编程,可以输入分子式,直接模拟质谱分子离子峰图谱。

用现在流行语说话:这是个大数据大买卖!
兄弟请多珍重。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表