【发布时间】:2021-07-19 07:02:17
【问题描述】:
我从视频中提取了视频帧和 mfcc。我得到 (524, 64, 64) 视频帧和 (80, 525) mfcc 的形状。数据匹配但维度相反的帧数。如何将 mfcc 对齐为 (525, 80)。
通过排列维度,它会扭曲音频信息吗?
【问题讨论】:
-
您可能应该将 MFCC 的数量减少到 40、20 或 13 - 最高的 MFCC 值基本上只会有噪音。
-
谢谢 - 我是音频处理新手