【问题标题】:Match MFCC to video frames将 MFCC 与视频帧匹配
【发布时间】:2021-07-19 07:02:17
【问题描述】:

我从视频中提取了视频帧和 mfcc。我得到 (524, 64, 64) 视频帧和 (80, 525) mfcc 的形状。数据匹配但维度相反的帧数。如何将 mfcc 对齐为 (525, 80)。

通过排列维度,它会扭曲音频信息吗?

【问题讨论】:

  • 您可能应该将 MFCC 的数量减少到 40、20 或 13 - 最高的 MFCC 值基本上只会有噪音。
  • 谢谢 - 我是音频处理新手

标签: list audio librosa mfcc


【解决方案1】:

交换多维数组的维度根本不会改变值,只会改变它们的位置。

要交换以使时间轴成为 MFCC 中的第一个,请使用 .T(用于转置)numpy 属性。

mfcc_timefirst = mfcc.T

【讨论】:

    猜你喜欢
    • 2011-09-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-12-18
    • 2021-03-25
    • 2018-05-17
    相关资源
    最近更新 更多