【问题标题】:Algorithm for very simple voice/speech recognition非常简单的语音/语音识别算法
【发布时间】:2023-03-17 18:32:01
【问题描述】:

我正在为 Google Glass 编写游戏,但遗憾的是 SpeechRecognizer API 在 Google Glass GDK 的当前版本中不可用。

所以我一直在考虑实现一种非常简单的语音识别算法。 假设我只想识别:“是”和“否”。
你知道任何示例代码或任何有用的资源来帮助我实现这个吗?
放弃这个想法,转而使用像 CMUSphinx 这样的大型框架有那么难吗?

如何识别:上、下、右、左或从 1 到 10 的数字?

【问题讨论】:

  • 通常,您使用隐马尔可夫模型 (HMM) 训练您的语音识别。

标签: android algorithm speech-recognition google-glass voice-recognition


【解决方案1】:

据我所知,fast Fourier transform (FFT) 经常使用到频域的转换并对其进行分析。还需要一些语音词典来进行频率相关。

请看这个链接:

CMU Sphinx有java实现。

David Wagner有一篇不错的文章和matlab实现。

附:哦,如果您说俄语,为什么不阅读 this 文章 - 非常简单,带有 java 示例。

附言老实说,我从来没有使用过这个框架,但是如果你对语音识别只有肤浅的了解,那么健壮和最简单的方法是使用现有的完整解决方案,如框架或库,否则你需要花时间来具备必要的知识门槛。在这种情况下,您可以阅读this 文章。

【讨论】:

  • 看起来 PocketSphinx(CMU Sphinx 的一部分)是要走的路。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-11-01
  • 2021-07-15
  • 2018-02-23
  • 1970-01-01
  • 2011-05-05
相关资源
最近更新 更多