【问题标题】:Google TTS <par> tags not working the way as expectedGoogle TTS <par> 标签未按预期方式工作
【发布时间】:2020-02-17 15:16:49
【问题描述】:

我正在研究 Google TTS,发现以下带有 par 标签的示例:

https://cloud.google.com/text-to-speech/docs/ssml#par

在示例中,音频构建正确。背景中有两个句子和一些声音。但是,如果您实际上将其与他们的 API 或控制台一起使用,则它不起作用。你只得到两句话,没有音频播放。链接到 TTS 控制台:

https://cloud.google.com/text-to-speech

这是我使用的 SSML:

<par>
    <media xml:id="question" begin="0.5s">
      <speak>Who invented the Internet?</speak>
    </media>
    <media xml:id="answer" begin="question.end+2.0s">
      <speak>The Internet was invented by cats.</speak>
    </media>
    <media begin="answer.end-0.2s" soundLevel="-6dB">
      <audio
        src="https://actions.google.com/sounds/v1/cartoon/cartoon_boing.ogg"/>
    </media>
    <media repeatCount="3" soundLevel="+2.28dB"
      fadeInDur="2s" fadeOutDur="0.2s">
      <audio
        src="https://actions.google.com/sounds/v1/animals/cat_purr_close.ogg"/>
    </media>
  </par>

我做错了什么?还是 TTS 服务本身有问题?

【问题讨论】:

    标签: actions-on-google google-text-to-speech


    【解决方案1】:

    对于初学者来说,TTS 控制台肯定有些奇怪。如果您查看它说应该使用的 JSON,您会注意到它省略了 &lt;par&gt; 标记。检查网络流量显示同样的事情。我还注意到&lt;speech&gt; 标签需要省略。

    如果您尝试将此作为动作模拟器控制台的一部分,则输出确实可以正常工作。您可以通过转到https://console.actions.google.com/,选择要使用的项目,然后转到“测试”选项卡来访问动作模拟器。在模拟器本身中,您可以选择“音频”选项卡,然后可以在编辑器中输入 SSML(包括&lt;speech&gt; 标签),然后按“更新并收听”按钮。

    【讨论】:

    • 是的,我不一定会依赖文档中的小部件。我过去曾成功使用带有 标记的实际 TTS API。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-07-18
    • 2021-03-11
    • 1970-01-01
    • 2012-06-23
    • 1970-01-01
    • 2020-05-03
    • 2017-10-24
    相关资源
    最近更新 更多