【发布时间】:2021-10-22 10:35:39
【问题描述】:
因此,我使用 Python 中的 Librosa 库提取了带有 MFCC 的音频文件功能。这是代码的样子:
signal, sample_rate = librosa.load('../audio_train/down/00176480_nohash_0.wav', sr=22050)
mfcc = librosa.feature.mfcc(signal, sr=sample_rate, n_mfcc=13)
np.mean(mfcc.T, axis=0)
我的问题是,为什么我们必须转置并获得 MFCC 的平均值?
【问题讨论】:
-
这完全取决于您的用例。这可能是dsp.stackexchange.com 的问题,但即便如此,它也需要更多详细信息
标签: python audio feature-extraction librosa mfcc