【问题标题】:Animation like Siri when you speak [closed]说话时像 Siri 这样的动画[关闭]
【发布时间】:2016-09-16 12:15:59
【问题描述】:

我想知道是否有办法在你说话时制作像 Siri 这样的动画。 你能告诉我你是否知道在 C# 中执行此操作的方法。

【问题讨论】:

  • 是的。有办法。如果你有一个研发部门并且要投入几亿美元,请告诉我——这听起来是一个有趣的项目。但是,如果您正在寻找更多、更谦虚的东西,请尝试 Google 教授:google.com/search?q=c-sharp+voice+interaction&ie=&oe= 如果您遇到任何问题,请告诉我们,我们会提供帮助!
  • 我说的是当麦克风捕捉声音时会移动的线条。就像听音乐时的均衡器。我不是说要制作一个新的 Siri。
  • 它一定是整个“像 Siri”的东西让我失望了。如果您只想要一个频谱分析仪,请看这里:google.com/… 我发布的第一个链接分享了当前(非尖端)语音知识。搜索.玩.学习.然后问!祝你好运。
  • 这是我找到的最简单的例子。我忘记了这个东西的名字。好的,我已经知道语音识别是如何工作的。谢谢你的链接
  • 祝你好运!!完成后我是客户!

标签: c# voice siri


【解决方案1】:

显然有办法实现这一点 - 但值得付出努力吗?

您需要:音频输入流。频谱分析仪(类似于此功能:http://www.qsl.net/dl4yhf/spectra1.html - 那里有足够多的信号处理论文)。显示它的消化格式。可以显示此数据的新视图(取决于您选择的 UI)。

这里的问题是多变的,超出了详细讨论的范围(而且您的问题是如此广泛和翔实,以至于我不愿意详细说明)。您会遇到的问题是:音频输入延迟、处理延迟、视口延迟和数据消耗,以及使用标准 MVC 框架足够快地渲染数据时可能会遇到很多问题。

为此,Siris UI 的流畅性是通过在 GPU 上渲染视图并具有适当的音频/数据过滤器来实现的,该过滤器可以消除尖峰。这使得平滑过渡成为可能,并且看起来不像精确频谱图的快速变化那样激进。

【讨论】:

  • 更不用说处理数据并将其与后端功能挂钩的价值数百万美元的大规模专有算法了。因为如果它所做的只是听,那么让计算机听你的所有工作有什么用?
  • 什么?当你说话时,他特别询问了动画 - 不处理数据。但是:如果您想在非常小的范围内分析自然语言模式,那并不是很昂贵。如果你这样做了,那么已经有替代方案了——例如,微软有一项免费服务,可以将自然语言转换为 API 调用(目前没有定价,处于早期阶段。我的头上没有这个名字——但是如果您有兴趣,我可以搜索它。编辑:您可能没有要求,但在这里:luis.ai
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-09-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-09-23
  • 2013-03-07
相关资源
最近更新 更多