【发布时间】:2021-10-30 12:20:40
【问题描述】:
我正在尝试实现一个 github repo specAugment (https://github.com/DemisEom/SpecAugment)
使用 librosa 加载 wav 文件后,我相信它使用 numPy reshape 函数来重塑 melspectrogram 数组,使用 power_to_db 函数获取 Log scale melspectrogram 并应用数据增强。
我的问题是,是否可以获得增强数据的 wav 文件?如果是这样,如何?我将不胜感激任何指针,甚至只是将结果转换回 wav 文件所需的步骤。
我尝试了 librosa 的 inverse.mel_to_audio() 函数,但无济于事。我也试过 scipy.io.wavfile.write()
【问题讨论】:
标签: python tensorflow librosa data-augmentation