【发布时间】:2010-12-27 10:47:25
【问题描述】:
我正在尝试在 AS3 中将 8000hz、16 位 wav 文件上采样到 11025hz。在这一点上,我并不担心应用我知道我最终会需要的低通滤波器。
我一直是referencing this wiki page。
这是我到目前为止所做的:
- 计算出最小公倍数为 3528000
- 计算出的 L 为 441
- 计算出的 M 为 320
- 在样本之间添加了 440 个零
- 每 320 个样本写入一个新的字节数组
但是,当我去播放新的 wav 时,它是无法区分的噪音。这是我的代码:
const sourceRate:uint = 8000;
const targetRate:uint = 11025;
var lcm:uint = lcm(targetRate, sourceRate); // = 3528000
var l:uint = lcm / sourceRate; // = 441
var m:uint = lcm / targetRate; // = 320
// upsample by factor of l
var upsampleData:ByteArray = new ByteArray();
upsampleData.endian = Endian.LITTLE_ENDIAN;
// originalWavData is a ByteArray of the source wav data
// fill is a ByteArray that contains 440 zeroes, written using writeShort(0x0)
while(originalWavData.bytesAvailable > 1) {
upsampleData.writeBytes(fill);
upsampleData.writeShort(originalWavData.readShort());
}
// downsample by factor of m
var downsampleData:ByteArray = new ByteArray();
downsampleData.endian = Endian.LITTLE_ENDIAN;
upsampleData.position = 0;
for(var k:uint=0; k<upsampleData.length; k++) {
upsampleData.position = k * m;
if(upsampleData.bytesAvailable < 2) break;
downsampleData.writeShort(upsampleData.readShort());
}
谁能告诉我我在代码中做错了什么?这是我的第一个问题帖子,所以如果我忘记了什么,或者需要提供更多信息,请告诉我。
谢谢!
更新:
我简化了 Aric 的答案,现在使用以下代码成功地进行了上采样:
/**
* Generates a ByteArray containing numSamples of
* data using linear interpolation between points
* y0 and y1.
*/
function interpolate(y0:int, y1:int, numSamples:uint):ByteArray {
var b:ByteArray = new ByteArray();
b.endian = Endian.LITTLE_ENDIAN;
var m:Number = Math.round((y1-y0)/numSamples);
for(var i:uint=0; i<numSamples; i++) {
var n:int = m * i + y0;
b.writeShort(n);
}
b.position = 0;
return 0;
}
// upsample by factor of l
var n1:int = 0;
while(originalWavData.bytesAvailable > 1) {
var sample:int = originalWavData.readShort();
upsampleData.writeBytes(interpolate(n1, sample, (l-1)));
n1 = sample;
}
// downsample by factor of m
while(upsampleData.bytesAvailable > 1) {
downsampleData.writeShort(upsampleData.readShort());
upsampleData.position += ((m-1)*2);
}
关于此解决方案的几点注意事项:我正在对音频验证码进行上采样,因此音质并不是非常重要。此外,第一个样本只是静音,所以我不需要计算第一个样本左侧的值。这就是为什么 n1 最初等于 0 的原因。此外,我没有在我的下采样中对生成的样本进行平均,而是抓住了每个第 M 个样本,这听起来对我的目的来说很好。
我确信有 1000 种更好的方法可以做到这一点,但对于我需要的,它确实有效。再次感谢 Aric 的回答。
【问题讨论】:
-
添加零无疑会产生错误的数据。试着把它看成一个图像,想象一下如果你被告知将图像的水平分辨率提高四倍,然后在每个正常像素之间添加 3 个黑色像素,会发生什么情况?您需要查看插值。我读过的一种更好的方法是将声音文件转换为其频域,然后以更高的分辨率将其转换回来。
-
感谢您的信息。我读过同样的东西。不幸的是,我对数字信号处理一无所知,在这里阅读 FFT (en.wikipedia.org/wiki/Fast_Fourier_transform) 让我更加困惑。您是否有任何示例/资源可以让我学习 DFT 的基础知识?我理解转换到频域的概念,但我无法掌握如何以更高分辨率转换回来。任何信息都非常感谢。谢谢!
-
当您尝试在 Wikipedia 中执行该方法时,您是否通过低通滤波器运行上采样数据?我现在正在使用 Aric 的方法,但我对 add-zeroes-then-filter 方法很好奇。
标签: actionscript-3 audio wav