【发布时间】:2021-11-21 12:52:09
【问题描述】:
我对音频信号处理非常陌生,但是我有这个任务,但我遇到了困难。
我想要实现的是,假设我已经使用 Mel Spectrogram 对语音音频进行了特征提取,频率范围为 Mel 标度(300Hz、3400Hz)。 例如,我如何进一步将其拆分为 5 个不重叠的子带
频段 1:[300Hz,627Hz]
频段 2:[628Hz、1060Hz]
频段 3:[1061Hz, 1633Hz]
频段 4:[1634Hz, 2393Hz]
频段 5:[2394Hz,3400Hz]
我一直在尝试到处寻找实际实现的示例,但找不到。
如果有人能给我一些建议或指导我正确的方向,我将不胜感激。
【问题讨论】:
标签: python signal-processing librosa audio-processing