【问题标题】:Microsoft Speech Recognition Service Factory audio formatMicrosoft 语音识别服务工厂音频格式
【发布时间】:2016-08-11 05:49:15
【问题描述】:

文档中说“音频必须是 PCM、单声道、16 位采样,采样率为 8000 Hz 或 16000 Hz。”

假设我想使用 DataClient,我将音频作为字节获取。我怎样才能把它转换成那个?

【问题讨论】:

    标签: c# speech-recognition bing-api microsoft-cognitive


    【解决方案1】:

    首先,您要将字节数组转换为 InputStream。然后,您使用 AudioSystem 从该 Inputstream 创建一个 AudioInputStream。一旦你有了音频流,你基本上就有了音频,你可以将它写入文件或做任何你喜欢的事情。

    ByteArrayInputStream oInstream = new ByteArrayInputStream(ayAudioData); AudioInputStream oAIS = AudioSystem.getAudioInputStream(oInstream);

    【讨论】:

      猜你喜欢
      • 2011-02-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-08-21
      • 1970-01-01
      相关资源
      最近更新 更多