【发布时间】:2018-09-13 15:54:48
【问题描述】:
我想使用神经网络识别声音,为此我需要首先为神经网络获得良好的输入,但仅将录音作为输入我认为它不会起作用,因为它基于频率和时间。所以我找到了傅里叶变换,现在我正在尝试用傅里叶变换我的音频文件并绘制它。
我的问题是:
如何在 python 中绘制带有音频输入的傅立叶变换?
如果这样可行,我如何在神经网络中输入傅里叶变换(我想也许给每个神经元一个 y 值,神经元作为对应的 x 值)
我尝试了类似的东西(我在互联网上找到的东西的组合:
import matplotlib.pyplot as plt
from scipy.io import wavfile as wav
from scipy.fftpack import fft
import numpy as np
import wave
import sys
spf = wave.open('AAA.wav','r')
#Extract Raw Audio from Wav File
signal = spf.readframes(-1)
signal = np.fromstring(signal, 'Int16')
fs = spf.getframerate()
fft_out = fft(signal)
Time=np.linspace(0, len(signal)/fs, num=len(signal))
plt.figure(1)
plt.title('Signal Wave...')
plt.plot(Time,fft_out)
plt.show()
但考虑到我在麦克风中的输入是“aaaaaa”,这似乎不对。
【问题讨论】:
标签: python neural-network fft