Google TTS <par> 标签未按预期方式工作答案

【问题标题】：Google TTS <par> tags not working the way as expectedGoogle TTS <par> 标签未按预期方式工作
【发布时间】：2020-02-17 15:16:49
【问题描述】：

我正在研究 Google TTS，发现以下带有 par 标签的示例：

https://cloud.google.com/text-to-speech/docs/ssml#par

在示例中，音频构建正确。背景中有两个句子和一些声音。但是，如果您实际上将其与他们的 API 或控制台一起使用，则它不起作用。你只得到两句话，没有音频播放。链接到 TTS 控制台：

https://cloud.google.com/text-to-speech

这是我使用的 SSML：

<par>
    <media xml:id="question" begin="0.5s">
      <speak>Who invented the Internet?</speak>
    </media>
    <media xml:id="answer" begin="question.end+2.0s">
      <speak>The Internet was invented by cats.</speak>
    </media>
    <media begin="answer.end-0.2s" soundLevel="-6dB">
      <audio
        src="https://actions.google.com/sounds/v1/cartoon/cartoon_boing.ogg"/>
    </media>
    <media repeatCount="3" soundLevel="+2.28dB"
      fadeInDur="2s" fadeOutDur="0.2s">
      <audio
        src="https://actions.google.com/sounds/v1/animals/cat_purr_close.ogg"/>
    </media>
  </par>

我做错了什么？还是 TTS 服务本身有问题？

【问题讨论】：

标签： actions-on-google google-text-to-speech

【解决方案1】：

对于初学者来说，TTS 控制台肯定有些奇怪。如果您查看它说应该使用的 JSON，您会注意到它省略了 <par> 标记。检查网络流量显示同样的事情。我还注意到<speech> 标签需要省略。

如果您尝试将此作为动作模拟器控制台的一部分，则输出确实可以正常工作。您可以通过转到https://console.actions.google.com/，选择要使用的项目，然后转到“测试”选项卡来访问动作模拟器。在模拟器本身中，您可以选择“音频”选项卡，然后可以在编辑器中输入 SSML（包括<speech> 标签），然后按“更新并收听”按钮。

【讨论】：

是的，我不一定会依赖文档中的小部件。我过去曾成功使用带有标记的实际 TTS API。