关于 python 对语音处理的问题

2016-07-10 14:27:43 +08:00
 pangpang

近期想用 python 对语音处理,去除里面的人声,然后对背景声音进行分析,来初略判断所处环境。(别问为什么,都是有苦衷的) 但是本人对语音处理不是很熟悉不知道有什么好的开源项目学习一下或者现成的库

4586 次点击
所在节点    Python
22 条回复
SeanChense
2016-07-10 15:44:49 +08:00
这怕是不是简单一两个库就能解决的,而且有没有这种库都还是问题。

你自己要做的就是把信号源中把人的声音剥离出来,那么就要定义什么是人的声音。在时域是什么样的,在频域是什么样的,各自特征值是什么。然后设计一个滤波器,把不要的噪声剔除。
完成了以上工作,我猜发个 SCI 可能问题不大。
SeanChense
2016-07-10 15:46:40 +08:00
或许已经有类似的研究了,楼主需要了解的是数字信号处理。查查看一些期刊论文。
kamikat
2016-07-10 16:12:23 +08:00
pangpang
2016-07-10 16:37:21 +08:00
@SeanChense 谢谢,我近期学习一下,本行是无线网络方向的,对数字信号确实不了解
pangpang
2016-07-10 16:38:36 +08:00
@kamikat 谢谢啦
TaMud
2016-07-10 17:19:50 +08:00
TaMud
2016-07-10 17:20:14 +08:00
如果你能搞出来,直接投简历 google,ms 都可以
264768502
2016-07-10 18:16:49 +08:00
pangpang
2016-07-10 19:48:14 +08:00
@TaMud 看来要达成这个目标需要付出挺多精力了
pangpang
2016-07-10 19:48:33 +08:00
@264768502 谢谢
pangpang
2016-07-10 19:50:02 +08:00
@SeanChense 其实我的目的只是某个人的声音特征就够了,别人的我也不关心。这样想的话好像还能变简单一点了
shakespaces
2016-07-10 20:07:22 +08:00
这的确是个大项目,应该是单独拿出来都能立项的
JhZ7z587cYROBgVQ
2016-07-10 20:59:13 +08:00
结合楼主的描述和回复,我已经脑补了各种剧情 = =
TaMud
2016-07-10 21:09:08 +08:00
中科讯飞,百度,微软, google ,都想解决这个问题
pangpang
2016-07-10 21:37:55 +08:00
@jason0916 别这样,我已经够可怜了
HFcbyqP0iVO5KM05
2016-07-11 06:37:37 +08:00
去人声的没有,去噪声可以用 Adobe Audition 。 或者可以反着来去噪了再和原声对比求差?
qcts33
2016-07-11 10:34:48 +08:00
本行无线网络,没学过数字信号处理?我读书少,你不要骗我……
本来想说 python 不适合这种信号处理任务,但发现 scipy 里面基本的滤波器设计都有
不过这种任务确实体现不出 python 的优势,我觉得还是 MATLAB 实在,至少设计滤波器这种事情就没有必要反复敲代码了
puyaraimondii
2016-07-11 11:47:43 +08:00
前期去噪,预处理方法可以,根据你的数据选择合适的方案
去除人声可以根据声音频率特征,找一个或几个合适的 window function 就行
背景声音分析我只知道你在有了足够的背景声音库的基础上采用的方法,例如 DTW,HMM,ANN 等等,或者 Machine Learning 也有一堆,其他的方案不了解
万方,知网那一堆数据库搜搜的话其实挺多可以参考的
暂时只想到这些,同在学习
pangpang
2016-07-11 15:03:49 +08:00
@qcts33 ^_^不能说没学过,只是不是强项。遇到数字信号方面,请教都是实验室的其他人
pangpang
2016-07-11 15:04:04 +08:00
@puyaraimondii 谢谢啦

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/291489

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX