【发布时间】:2011-03-18 07:19:14
【问题描述】:
如何为 FFT 表示立体声(2 声道)音频数据?你呢
A.取两个通道的平均值,并将其分配给数字的实部,而虚部为 0。
B.将一个通道分配给实分量,将另一个通道分配给图像分量。
有理由做其中一个吗?我搜索了网络,但找不到任何明确的答案。
我正在做一些简单的频谱分析,不知道更好,使用了选项 A)。这给了我一个意想不到的结果,而选项 B)按预期进行。以下是更多细节:
我有一个钢琴“middle-C”的WAV文件。根据定义,中间 C 为 260Hz,因此我预计峰值频率为 260Hz,谐波峰值更小。我通过音频编辑软件(Sound Forge)查看频谱确认了这一点。但是当我使用选项 A) 自己进行 FFT 时,峰值为 520Hz。对于选项 B),峰值在 260Hz。
我错过了什么吗?到目前为止,我想出的解释是,使用 real 和 imag 组件表示立体声数据意味着这两个通道是独立的,我想它们不是,因此会造成混乱。
【问题讨论】:
标签: fft