【发布时间】:2012-08-23 02:26:43
【问题描述】:
我可以使用 fft 来获取加载的 1 秒音频文件的频率、相位和幅度,然后重新创建它。 我现在要做的是找出每个频率在 1 秒音频文件中的开始位置和结束位置,并将数据放入数组中
示例:100hz 从 0.23 秒到 0.34 秒开始, 104.34hz 开始于 0.35 秒,结束于 0.37 秒。
fft 可以做到这一点,还是我需要改变整个程序以使用小波?还有八度音程中的小波示例可以显示如何做我想要完成的事情吗?
我正在使用来自 repo 的 Ubuntu Linux 12.04 和 Octave 3.2.4
谢谢 瑞克
【问题讨论】:
-
对于人声,FFT 或小波都不适合。改为研究音高检测/估计算法,这与峰值频谱频率测量不同。