【发布时间】:2012-03-13 01:31:26
【问题描述】:
我想在 wav 文件中的每一刻都获得最大功率的频率。 所以我使用来自 scipy 的 fft 在 Python 中编写了 STFT。我使用了 scipy 的 kaiser 窗口函数。一切看起来都很棒,但我的输出看起来很奇怪。它有一些非常小的数字和一些非常高的数字。
这是一个 wav 文件的输出:http://pastebin.com/5Ryd2uXj 这是python中的代码:
import scipy, pylab
import wave
import struct
import sys
def stft(data, cp, do, hop):
dos = int(do*cp)
w = scipy.kaiser(dos,12) //12 is very high for kaiser window
temp=[]
wyn=[]
for i in range(0, len(data)-dos, hop):
temp=scipy.fft(w*data[i:i+dos])
max=-1
for j in range(0, len(temp),1):
licz=temp[j].real**2+temp[j].imag**2
if( licz>max ):
max = licz
maxj = j
wyn.append(maxj)
#wyn = scipy.array([scipy.fft(w*data[i:i+dos])
#for i in range(0, len(data)-dos, 1)])
return wyn
file = wave.open(sys.argv[1])
bity = file.readframes(file.getnframes())
data=struct.unpack('{n}h'.format(n=file.getnframes()), bity)
file.close()
cp=44100 #sampling frequency
do=0.05 #window size
hop = 5
wyn=stft(data,cp,do,hop)
print len(wyn)
for i in range(0, len(wyn), 1):
print wyn[i]
【问题讨论】:
-
您是否尝试针对已知波形(如正弦波)对其进行测试,看看您是否获得了预期的输出?
-
我刚刚发现了这个:stackoverflow.com/questions/2459295/stft-and-istft-in-python 它看起来很相似,我看到在窦图中是 2 条线,而不是 1 条。我的窦输出中有相同的。我不知道为什么...