立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 605|回复: 5

[讨论] 在技术上如何把一首歌里的不同乐器,人声分开?可行么?

[复制链接]
发表于 2024-12-29 14:28 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2024-12-29 14:29 | 显示全部楼层
本人两年前就有过一个想法,就是将一段音乐不同乐器的声音分离。目前尝试过的想法是利用PCA或者ICA算法分离,但无奈本人也不是信号处理专业人员,精力有限、水平有限,出现各种问题,也没有实现功能。哎......
回复 支持 反对

使用道具 举报

发表于 2024-12-29 14:30 | 显示全部楼层
相关学科叫MIR,
Music information retrieval
把乐器分离是信号处理的一个难点,要完美达到非常难。现在用的一些方法都是从频域上分析相关音色来分离,比如用FMCC算法。但是说要完美分离还有很大距离。
另外一个思路是,比如用两个距离不同的麦克风拾取两个扬声器的声音,可以从算法角度分离出两个声音,但是现实中的乐器通常远大于录音的轨道数,而且乐器声学的各向异性比扬声器大而复杂得多,所以从商业作品里分离出指定的声音,可以做到,但是质量不能很好。
回复 支持 反对

使用道具 举报

发表于 2024-12-29 14:30 | 显示全部楼层
这是作为录音师经常被问道的一个问题,现在的分离技术主要技术来自于频率和相位。正好最近比较新的分离软件ROLAND 的R-MIX是我做的评测,所以可以稍微说一下,评测原文——
ROLAND R-MIX――用眼睛做音乐
先说说技术部分
频率分离,现在一般作为一种辅助手段,因为乐音的泛音列一般都比较丰富,强度上也不差,即便是一个DOUBLE BASS高频延伸到6kHz到10kHz有明确的能量也很正常,彻底在频谱角度清楚不大现实。所以通过频率分离更多的只能针对BASS,BELL这些本身能量集中的乐器,而且还是只能清除掉能量集中的部分,一些泛音会漏网,然后比如用于REMIX的话,就用别的声音把清不干净的盖上,比如洞次洞次…………
相位分离,就是我们平时说的消声版的来源,其实是因为人声一般在混音的时候放在正中,双声道立体声的概念里中间声像意味着左右扬声器拥有相同的信号,那么把一侧反向叠加另一侧就出现了波峰对波谷彻底抵消的结果,当然这是理想状态,只要你加了任意的一个立体声混响,左右声道的混响是有随机算法的,也就是说混响的左右信号是不同的,于是人声的混响有一部分就消不掉了,如果喜欢用DOUBLE的各种方式处理成带有一定宽度的人声,那么能通过抵消消掉的会更少,所以这个手法现在对于大部分成品音乐都是差强人意。MS的提取方式也近似,就是先重新编码立体声文件,左右声道相同的部分成为M,不同的为S再做调整。通常细致些的消声版消除人生后可能要重做补充一些中间声部让伴奏听上去更健康一些。
现在用的方式基本都是两个手法联动作业,比如先进行频率阶段的滤波,在某些频率上再使用相位抵消,上边的评测用的就是这样的技术,可以把图示看做光学频谱仪,而鼠标圈的位置就是在整个立体声呈像上的位置。原理上比如说要提取人声就先做MS编码,M声部滤掉低频去除同样在中间声部的BASS,但是跟人声重合频率过多的军鼓一般就很难分离了,虽然音色不同(泛音列构成)但是在现有技术上的频率和相位上确实基本相同的。
回复 支持 反对

使用道具 举报

发表于 2024-12-29 14:30 | 显示全部楼层
泻药,药药切克闹
貌似很难做到让人满意,分轨的工程文件另当别论。
还有一个办法就是花钱找音乐学院的孩子们给扒个midi出来,好的音源可以做到很高的近似度,也不很贵。
回复 支持 反对

使用道具 举报

发表于 2024-12-29 14:31 | 显示全部楼层
看你怎么定义“一首歌”,如果是工程文件就可以。
如果是双声道的mp3或者wav,那么分离人声和配乐没有问题。
但如果单音轨的话很难,原来试过一些声称能自动扒某乐器音轨的效果都很差,无非就是些模式识别和过滤的技术。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表