Watson Speech to Text 无法对数据流音频/wav 进行转码答案

【问题标题】：Watson Speech to Text unable to transcode data stream audio/wavWatson Speech to Text 无法对数据流音频/wav 进行转码
【发布时间】：2017-09-06 12:47:45
【问题描述】：

我正在使用 IBM Watson Speech to Text API：

var SpeechToTextV1 = require('watson-developer-cloud/speech-to-text/v1');
var fs = require('fs');
var request = require('request');

var speech_to_text = new SpeechToTextV1({
  "username": "<user name>",
  "password": "<password>"
});

var recognizeStream = speech_to_text.createRecognizeStream();

// request(wavfileURL).pipe(recognizeStream);
// recognizeStream.on('results', function(err, res){
//     console.dir(err)
//     console.dir(res)
//     if (res.results){
//         console.dir(res.results)
//     }
//
// });
request.get(wavfileURL, function (err, res, buffer) {
  var streamer = require('streamifier');
  var params = {
    // From file
    audio: streamer.createReadStream(buffer) ,
    content_type: 'audio/wav; rate=44100'
  };

  speech_to_text.recognize(params, function(err, res) {
    debugger;
    if (err)
      console.log("ERR:",err);
    else {
      console.log("NOT ERR");
      console.log(JSON.stringify(res, null, 2));
      console.dir(res);
    }
  });
});

我用下面的 WAV 文件 https://s3.amazonaws.com/buzzy-audio/adam.ginsburg%40gmail.com/vNixvnC4Xscu8yZ98 调用它

我收到以下错误：

> ERR: { [Error: unable to transcode data stream audio/wav ->
> audio/x-float-array ] I20170411-18:23:40.576(10)?   code: 400,
> I20170411-18:23:40.576(10)?   code_description: 'Bad Request',
> I20170411-18:23:40.577(10)?   error: 'unable to transcode data stream
> audio/wav -> audio/x-float-array ' }

内容类型的采样率似乎正确：

有什么想法吗？

【问题讨论】：

@german 只是检查编辑...只是几个空格...还是我错过了什么？
代码缩进多为
在 api 文档中说，不活动超时可能导致错误 400。“如果在 inactivity_timeout 秒的音频中未检测到语音（未处理），服务器也会关闭连接（响应代码 400） time)；使用 inactivity_timeout 参数更改默认值 30 秒。"
关于你的问题@aginsburg，我会尝试看看我是否可以让它工作，但我 99% 确定它与 s3 返回的content-type 和content-length 有关。我敢打赌，您可以将文件保存在临时文件夹中，然后将其发送到语音到文本。在这种情况下，您需要确保可以覆盖要发送到 STT 的标头，并且它们与 API 的预期相匹配。
我遇到了来自 Twilio 的录音问题，您解决了这个问题吗？

标签： ibm-cloud speech-to-text ibm-watson

【解决方案1】：

这是由于 watson 认为您尝试上传的音频文件不是音频文件，因此为了保护自己免受有害文件的影响，它会引发异常

官方解释：link

损坏的文件：file byte code altered（下载前扫描）

【讨论】：