【问题标题】:How to translate live streaming using google speech api?如何使用谷歌语音 api 翻译实时流媒体?
【发布时间】:2021-01-14 22:42:16
【问题描述】:

这是 Google Speech API 文档:https://cloud.google.com/speech/docs/sync-recognize

我尝试了这个 API 2 周,但仍然无法解决我的主要目的(翻译直播)。

我正在使用 PHP。 (其他语言建议可以,我自己找)

我可以在 2 周内做什么:

  1. 同步语音识别(

  2. 异步语音识别(>1 分钟和 注意:我可以修改它以接受 3 小时视频。

  3. 来自麦克风的实时语音识别:https://www.google.com/intl/en/chrome/demos/speech.html

  4. 更新:执行音频持续时间少于 6 秒的流式 API。

我不能做的是:

  1. 如何翻译直播。例如:无线电流(允许延迟)

  2. 如何在播放视频/音频时进行翻译。 (允许延迟)

更新:

我也在 google github 上问过这个问题。但由于没有答案,我问here

总结:

我可以执行语音流,但只能使用 6 秒的音频。这不像我预期的那样。我的期望是识别无限持续时间(似乎我们不知道无线电流何时结束)。

感谢您的帮助。非常感谢

更新:

批准我不能使用超过 6 秒的视频。所以我写了这个:

我试试这个视频interview.mp4 并使用这个ffmpeg -i interview.mp4 -c:a flac -ar 16000 -ac 1 -sample_fmt s16 interview.flac 用ffmpeg 将它转换为interview.flac

我使用此library 使用此命令转录视频:

php speech.php transcribe --encoding FLAC --language-code en-US --sample-rate 16000 --stream interview.flac

结果是:

  [Google\GAX\ApiException]
  Invalid 'audio_content': too long.

不能太长,因为视频时长只有 48 秒。这是 ffmpeg 结果的元数据:

Output #0, flac, to 'interview.flac':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf57.72.101
    Stream #0:0(und): Audio: flac, 16000 Hz, mono, s16, 128 kb/s (default)
    Metadata:
      handler_name    : SoundHandler
      encoder         : Lavc57.92.100 flac
size=     810kB time=00:00:48.01 bitrate= 138.1kbits/s speed= 108x
video:0kB audio:801kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.019650%

【问题讨论】:

    标签: php speech-recognition speech-to-text google-speech-api


    【解决方案1】:

    您需要使用StreamingRecognize API call。您可以在 PHP here 中找到这样做的示例。

    【讨论】:

    • 谢谢你,我赞成你的帮助。但是,请看我的更新.. 我之前错过了信息。对不起。
    • 我只是不知道如何在真正的流媒体中实现它。我只知道如何将 6 秒的音频发送到语音流 api
    • 流媒体 API 有 60 秒的限制,而不是 6 秒,因此您应该能够流式传输长达 60 秒的音频。您是否在 6 秒后收到错误消息?
    • 看看我的更新。你可以试试我的文件兄弟吗?我放弃。不知道>
    • 修复了链接@Amarja
    猜你喜欢
    • 1970-01-01
    • 2018-08-20
    • 2019-06-01
    • 2016-04-11
    • 1970-01-01
    • 1970-01-01
    • 2017-03-08
    • 1970-01-01
    • 2010-11-11
    相关资源
    最近更新 更多