【问题标题】:Does Chrome have built-in speech recognition for "x-webkit-speech" input elements?Chrome 是否有针对“x-webkit-speech”输入元素的内置语音识别?
【发布时间】:2011-05-20 16:42:00
【问题描述】:

我想知道如何

<input type="text" x-webkit-speech speech />

Chrome 中是否内置了语音识别功能,或者它是否访问了操作系统中的底层语音识别功能?

【问题讨论】:

标签: html google-chrome webkit speech-recognition


【解决方案1】:

是的,Chrome 通过 Google 的服务器进行语音识别。但是没有理由其他浏览器不能选择以不同的方式实现它(例如使用操作系统中的一些语音识别工具)。

Balu,您的链接实际上有点过时了。可以在此处找到最新的 Google 提案:http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

虽然语音识别已经在 Chrome 开发频道中提供了一段时间,但它还没有发布,我们还不确定它什么时候发布。我们当然希望人们使用 API 并提供反馈,但我们认为它还没有准备好迎接黄金时段。

【讨论】:

  • 这里存在严重的隐私问题。
【解决方案2】:

根据代码,它将音频数据作为 POST 请求发送到:

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3

lm 在代码中是grammarxhwhardware_info,根据注释是可选的。音频似乎是 speex, x-speex-with-header-byte:

// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.

看起来修改 chrome 代码以在您自己的应用程序中使用非常简单。

更新:

您还需要获得speech recognition API key,他们每天限制为 50 个请求。没有办法增加这个限制——即使是通过付费。

【讨论】:

  • 任何人都知道 Google 是否可以接受任何人直接使用此 API,或者是否违反条款和条件?谢谢。
  • 有人知道“lm”(语法)属性是如何工作的吗? W3C 草案规定语法可以是 GRXML 文件的任何 URL,但不会改变任何内容。
【解决方案3】:

speexenc 有一个实验性的分支,可以对 x-speex-with-header-byte MIME 二进制格式进行编码,它在 QXIP Wiki 上引用,在 GitHub 上可用。通过将帧的大小作为数据包的第一个字节来完成这项工作。

【讨论】:

    【解决方案4】:

    他们使用自己的 API 进行语音识别。例如:向那里的服务器发送一个发布请求。

    【讨论】:

      【解决方案5】:

      语音识别是 Google 的一项提议。 https://docs.google.com/View?id=dcfg79pz_5dhnp23f5

      Chrome 8+ 附带该功能,看起来它会将数据发送到谷歌服务器以执行实际识别。

      【讨论】:

        【解决方案6】:

        此功能现在适用于 chrome 11 beta。

        看看这个。。

        http://slides.html5rocks.com/#speech-input

        【讨论】:

          【解决方案7】:

          这可能是有趣的https://github.com/taf2/speech2text ruby​​ 绑定,用于谷歌语音到文本 API

          【讨论】:

            【解决方案8】:

            是的,Chrome 确实通过 WebKit 提供了内置语音支持;只需查看 Google 主页(现在搜索框右侧有一个麦克风)。但是,我想知道 Chrome 团队是否正在开发 Omnibox 语音支持。毕竟,Chrome 是基于 WebKit 的浏览器!

            【讨论】:

              【解决方案9】:

              我刚刚在我的 Chrome Cr-48 上确认了这一点,它可以工作。

              【讨论】:

                【解决方案10】:

                还有一个工作组产生了http://www.w3.org/TR/xhtml+voice/,但我不相信这在除 Opera 之外的任何浏览器中实现。

                【讨论】:

                  猜你喜欢
                  • 1970-01-01
                  • 2014-01-05
                  • 2014-06-05
                  • 2016-10-31
                  • 2018-01-06
                  • 1970-01-01
                  • 1970-01-01
                  • 1970-01-01
                  • 2015-04-05
                  相关资源
                  最近更新 更多