【问题标题】:Is there a NAO simulation with Speech Recognition?是否有带有语音识别的 NAO 模拟?
【发布时间】:2020-08-18 20:22:50
【问题描述】:

由于 Covid-19,我无法访问物理 NAO,需要使用模拟。目标是模拟不同复杂性的对话,也包括手势。语音识别是这里最重要的功能,但模拟其他增加真实感的功能(如语音)也将受到赞赏。

我在 Mac 上工作(使用 Catalina)。

我尝试过的:

  • Choregraphe:包含的模拟效果很好,但它的能力非常有限。如果我没有遗漏什么,对话只会在书面聊天中模拟 - 所以我输入语音输入,得到“语音气泡”作为响应
  • 适用于 NAO 的 Webots:不再受支持?
  • Webots(使用 Python 控制器):迄今为止最有前途的方法,但基本上没有关于如何编写 NAO 控制器的文档。我不知道如何使 Speaker() 类工作。 naoqisim 的机器人和世界模拟(也不再持续)似乎运行良好。
  • 使用 ROS 控制器的 Webots:没有官方对 Mac 的支持,推荐的 ROS Kinetics 安装对我来说还没有用。

我会很感激任何关于 Webots 是否适合对话(似乎主要关注运动)或其他合适模拟的建议的提示。

【问题讨论】:

  • 你可以看看这个最近的模拟器:pypi.org/project/qibullet 更多用于移动,但为什么不添加你自己的存根来正确处理两边的音频,因为它是一个贡献包?跨度>

标签: speech-recognition simulation nao-robot


【解决方案1】:

编舞

不幸的是,ALTextToSpeechALSpeechRecognition API 不适用于虚拟机器人。来自文档here

ACAPELA、microAITalk 和 Nuance 引擎仅在真实机器人上可用。使用虚拟机器人时,可以在 Choregraphe Robot View 和 Dialog 面板中可视化所述文本。

here

[语音识别]无法在模拟机器人上测试-该模块仅在真实机器人上可用,您无法在模拟机器人上测试。

文本交互可用于测试对话的流程,但不允许您正确测试语音识别的细微差别。

其他模拟器

Webots 不再受支持,而且我从来没有任何运气来设置它。 Pepper/NAO 目前最好的模拟环境是ROS Gazebo Stack。但它也不是为音频模拟而设计的。它可以让您模拟机器人做出手势并在世界中移动,但您必须编写自己的自定义代码(ROS 节点,在 python 或 C++ 中)来处理音频、进行语音识别和输出语音(连接起来例如,您拥有的麦克风和扬声器)。

如果您打算使用 NAOqi QiChat 聊天机器人,您可以使用 naoqi python api 来运行它,并将外部语音转文本和文本转语音服务连接到它。尽管您想要更复杂的语音交互,但我建议您使用成熟的聊天机器人(Dialogflow、IBM Watson 等)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-12-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-02-05
    相关资源
    最近更新 更多