【发布时间】:2018-06-11 05:30:15
【问题描述】:
TL;DR:我已将 1,000 个
mp3文件合并为一个大的mp3文件,但无法通过 Torch 框架传递此文件。
我已经能够使用 Torch 成功地从莎士比亚样本中生成独特的输出。现在,我想更进一步,输入音频文件而不是文本文件。
bash$ audio.load(/path/to/fullyMerged.mp3)
-bash: syntax error near unexpected token `/path/to/fullyMerged.mp3'
我尝试按照torch 文档here 中的建议使用audio.load(path),但出现意外的令牌错误。
编辑:这是我尝试过的一些事情,但失败了
试过直接输入mp3,但是mp3输入无效:
python scripts/preprocess.py --input_mp3 data/fullyMerged.mp3 --output_h5 data/fullyMerged.h5 --output_json data/fullyMerged.json尝试将
.mp3扩展名重命名为.txt并将其输入到 Torch,但是,这会返回 UnicodeDecodeError,因为音频无法表示为文本尝试将我的
.mp3文件转换为.raw格式、.wav格式以及许多其他格式,但是 Torch 无法处理任何音频格式。还尝试将这些转换后的
.raw和.wav文件的扩展名重命名为.txt,但这仍然给了我UnicodeDecodeError
我花了无数个小时试图让 Torch 处理音频,但我做不到!任何反馈都将不胜感激。
【问题讨论】:
-
合并后的 mp3 文件可以用普通的 mp3 播放器播放吗?可能文件已损坏
-
@ScottStensland 该文件可以播放并且绝对没有损坏。是不是我忘记了加载 mp3 文件的命令之类的?
-
另一种方法是将每个 mp3 转换为 .wav,然后从 wav 中提取有效负载(忽略前面的标头字节),然后将所有有效负载组合成一个 .wav ...确保其可播放然后将其转换为 mp3 ...torch 有 mp3 解码器吗?删除 .wav 标头将有效负载保留为 PCM 格式的时间序列曲线,也许 Torch 可以比 mp3 更好地处理 PCM 数据
-
@ScottStensland 我能够听取您的建议并将我的文件转换为 PCM,但我不知道如何将其转换回文本
-
这个简单的问题两天没有得到回答的事实应该可以非常有效和激烈地说明为什么not to post code or error messages as images.
标签: python algorithm machine-learning artificial-intelligence torch