如何输入音频？ [关闭]答案

【问题标题】：How can I input audio? [closed]如何输入音频？ [关闭]
【发布时间】：2018-06-11 05:30:15
【问题描述】：

TL;DR：我已将 1,000 个 mp3 文件合并为一个大的 mp3 文件，但无法通过 Torch 框架传递此文件。

我已经能够使用 Torch 成功地从莎士比亚样本中生成独特的输出。现在，我想更进一步，输入音频文件而不是文本文件。

bash$ audio.load(/path/to/fullyMerged.mp3)
-bash: syntax error near unexpected token `/path/to/fullyMerged.mp3'

我尝试按照torch 文档here 中的建议使用audio.load(path)，但出现意外的令牌错误。

编辑：这是我尝试过的一些事情，但失败了

试过直接输入mp3，但是mp3输入无效：python scripts/preprocess.py --input_mp3 data/fullyMerged.mp3 --output_h5 data/fullyMerged.h5 --output_json data/fullyMerged.json
尝试将 .mp3 扩展名重命名为 .txt 并将其输入到 Torch，但是，这会返回 UnicodeDecodeError，因为音频无法表示为文本
尝试将我的 .mp3 文件转换为 .raw 格式、.wav 格式以及许多其他格式，但是 Torch 无法处理任何音频格式。
还尝试将这些转换后的.raw 和.wav 文件的扩展名重命名为.txt，但这仍然给了我UnicodeDecodeError

我花了无数个小时试图让 Torch 处理音频，但我做不到！任何反馈都将不胜感激。

【问题讨论】：

合并后的 mp3 文件可以用普通的 mp3 播放器播放吗？可能文件已损坏
@ScottStensland 该文件可以播放并且绝对没有损坏。是不是我忘记了加载 mp3 文件的命令之类的？
另一种方法是将每个 mp3 转换为 .wav，然后从 wav 中提取有效负载（忽略前面的标头字节），然后将所有有效负载组合成一个 .wav ...确保其可播放然后将其转换为 mp3 ...torch 有 mp3 解码器吗？删除 .wav 标头将有效负载保留为 PCM 格式的时间序列曲线，也许 Torch 可以比 mp3 更好地处理 PCM 数据
@ScottStensland 我能够听取您的建议并将我的文件转换为 PCM，但我不知道如何将其转换回文本
这个简单的问题两天没有得到回答的事实应该可以非常有效和激烈地说明为什么not to post code or error messages as images.

【解决方案1】：

audio.load 不是有效的 Bash 命令。错误消息有点令人困惑，因为括号也是无效的；甚至在 Bash 尝试执行任何操作之前触发解析错误。

要启动交互式 Python 会话，请在 Bash 提示符下键入 python。在 Python 接受 audio.load 作为函数名之前，您仍然需要 import。

也许您应该花一些时间熟悉 Python，然后再尝试将它用于重要的新开发工作。

... 除了看起来您要链接的库是 Lua 库，而不是 Python 库。我对 Lua 不熟悉，但这个答案的其余部分仍然有效。可能从the Lua-Audio project's README 末尾附近的用法示例开始，然后将其复制/粘贴到文本文件中，然后弄清楚如何使用 Lua 运行它。

【讨论】：

【解决方案2】：

你应该给audio.load一个字符串而不是/Users/.../fullyMerged.mp3

你应该替换

audio.load(/Users/.../fullyMerged.mp3)

与

audio.load('/Users/.../fullyMerged.mp3')

【讨论】：

这也是，一旦你真正开始运行 Python。
... 等等，不是 Python；卢阿！？
如果他从 bash 中运行 lua 命令，那肯定不行……
确实如此；他发布的图片显示错误消息来自 Bash，尽管非常不清楚他后来如何设法在某些东西上运行 Python 并以某种方式获得 UnicodeDecodeError。