【问题标题】:Python frequency detectionPython频率检测
【发布时间】:2011-02-08 12:59:38
【问题描述】:

好吧,我想做的是一种音频处理软件,它可以检测流行频率,如果该频率播放时间足够长(几毫秒),我知道我得到了肯定的匹配。我知道我需要使用 FFT 或类似的东西,但在这个数学领域我很烂,我确实搜索了互联网,但没有找到只能做到这一点的代码。

我试图实现的目标是让自己成为一个自定义协议来通过声音发送数据,需要非常低的每秒比特率(5-10bps),但我在传输端也非常有限,因此接收软件需要能够自定义(不能使用实际的硬件/软件调制解调器)我也希望这只是软件(除了声卡没有额外的硬件)

非常感谢您的帮助。

【问题讨论】:

标签: python audio fft frequency


【解决方案1】:

aubio 库已使用 SWIG 进行包装,因此可供 Python 使用。它们的众多功能包括几种音高检测/估计方法,包括YIN 算法和一些谐波梳算法。

但是,如果你想要更简单的东西,我前段时间写了一些用于音高估计的代码,你可以接受或放弃它。它不会像使用 aubio 中的算法那样准确,但它可能足以满足您的需求。我基本上只是将数据的 FFT 乘以一个窗口(在这种情况下为 Blackman 窗口),对 FFT 值进行平方,找到具有最高值的 bin,并使用最大值的对数在峰值周围使用二次插值及其两个相邻值以找到基频。我从我找到的一些论文中得到的二次插值。

它在测试音调上工作得相当好,但它不会像上面提到的其他方法那样健壮或准确。可以通过增加块大小来提高准确性(或通过减小它来降低)。块大小应为 2 的倍数以充分利用 FFT。另外,我只确定每个块的基本音高,没有重叠。我使用 PyAudio 播放声音,同时写出估计的音高。

源代码:

# Read in a WAV and find the freq's
import pyaudio
import wave
import numpy as np

chunk = 2048

# open up a wave
wf = wave.open('test-tones/440hz.wav', 'rb')
swidth = wf.getsampwidth()
RATE = wf.getframerate()
# use a Blackman window
window = np.blackman(chunk)
# open stream
p = pyaudio.PyAudio()
stream = p.open(format =
                p.get_format_from_width(wf.getsampwidth()),
                channels = wf.getnchannels(),
                rate = RATE,
                output = True)

# read some data
data = wf.readframes(chunk)
# play stream and find the frequency of each chunk
while len(data) == chunk*swidth:
    # write data out to the audio stream
    stream.write(data)
    # unpack the data and times by the hamming window
    indata = np.array(wave.struct.unpack("%dh"%(len(data)/swidth),\
                                         data))*window
    # Take the fft and square each value
    fftData=abs(np.fft.rfft(indata))**2
    # find the maximum
    which = fftData[1:].argmax() + 1
    # use quadratic interpolation around the max
    if which != len(fftData)-1:
        y0,y1,y2 = np.log(fftData[which-1:which+2:])
        x1 = (y2 - y0) * .5 / (2 * y1 - y2 - y0)
        # find the frequency and output it
        thefreq = (which+x1)*RATE/chunk
        print "The freq is %f Hz." % (thefreq)
    else:
        thefreq = which*RATE/chunk
        print "The freq is %f Hz." % (thefreq)
    # read some more data
    data = wf.readframes(chunk)
if data:
    stream.write(data)
stream.close()
p.terminate()

【讨论】:

  • 哇,非常感谢,现在看来可以了,我只知道如何从 auido 输入(麦克风)实时读取音频
  • 访问 PyAudio 站点 people.csail.mit.edu/hubert/pyaudio 并向下滚动页面到示例。您会看到一些从麦克风获取输入的内容。
  • 嗯,你能帮我弄清楚为什么会发生这个错误:“需要超过 0 个值来解包”在以下行“y0,y1,y2 = np.log(fftData[which-1:其中+2:])"
  • 是的,那里有点马车。我已经修好了。问题是如果 which = 0 或 fftData 的最后一个值,那么它不会在那里返回 3 个值。无论如何,我们都不想要 fftData 的 0 bin 中的值(它是 DC 偏移量)。
  • 为什么我的数据长度总是块*样本宽度的两倍?我无法进入循环。
【解决方案2】:

如果您打算使用FSK (frequency shift keying) 对数据进行编码,您最好使用Goertzel algorithm,这样您就可以只检查所需的频率,而不是完整的 DFT/FFT。

【讨论】:

    【解决方案3】:

    您可以从 here 找到声音上滑动窗口的频谱,然后通过从 here 找到该频段的频谱曲线下的区域来检查流行频段的存在。

    import numpy as np
    import matplotlib.pyplot as plt
    from sklearn.metrics import auc
    np.random.seed(0)
    
    # Sine sample with a frequency of 5hz and add some noise
    sr = 32  # sampling rate
    y = np.linspace(0, 5 * 2*np.pi, sr)
    y = np.tile(np.sin(y), 5)
    y += np.random.normal(0, 1, y.shape)
    t = np.arange(len(y)) / float(sr)
    
    # Generate frquency spectrum
    spectrum, freqs, _ = plt.magnitude_spectrum(y, sr)
    
    # Calculate percentage for a frequency range 
    lower_frq, upper_frq = 4, 6
    ind_band = np.where((freqs > lower_frq) & (freqs < upper_frq))
    plt.fill_between(freqs[ind_band], spectrum[ind_band], color='red', alpha=0.6)
    frq_band_perc = auc(freqs[ind_band], spectrum[ind_band]) / auc(freqs, spectrum)
    print('{:.1%}'.format(frq_band_perc))
    # 19.8%
    

    【讨论】:

      【解决方案4】:

      虽然我之前没有尝试过使用 Python 进行音频处理,但也许您可以基于 SciPy(或其子项目 NumPy)构建一些东西,这是一个用于高效科学/工程数值计算的框架?您可以先查看 scipy.fftpack 的 FFT。

      【讨论】:

      • 好的,我找到了这个swharden.com/blog/…,现在我想知道如何找到最高的频率范围(SciPy 也帮助了一点,谢谢
      • 那么你知道怎么做吗?
      猜你喜欢
      • 1970-01-01
      • 2011-07-11
      • 2016-09-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多