【发布时间】:2016-05-04 05:03:19
【问题描述】:
我正在使用 IBM Watson 的语音到文本服务来为几个电话音频文件 (8kHz) 生成脚本。我已经尝试过相同文件的 wav 和 opus 版本。在使用 opus 格式时,我没有看到成绩单质量有任何重大下降。我正在考虑仅存储文件的 opus 格式以减少存储空间需求并减少文件传输时间。一般来说,使用 wav 格式获得更高质量的成绩单会更好吗?如果我们使用 opus 格式,是否存在已知的转录质量下降?
【问题讨论】:
标签: speech-recognition ibm-cloud speech-to-text ibm-watson