是否有带有语音识别的 NAO 模拟？答案

【问题标题】：Is there a NAO simulation with Speech Recognition?是否有带有语音识别的 NAO 模拟？
【发布时间】：2020-08-18 20:22:50
【问题描述】：

由于 Covid-19，我无法访问物理 NAO，需要使用模拟。目标是模拟不同复杂性的对话，也包括手势。语音识别是这里最重要的功能，但模拟其他增加真实感的功能（如语音）也将受到赞赏。

我在 Mac 上工作（使用 Catalina）。

我尝试过的：

Choregraphe：包含的模拟效果很好，但它的能力非常有限。如果我没有遗漏什么，对话只会在书面聊天中模拟 - 所以我输入语音输入，得到“语音气泡”作为响应
适用于 NAO 的 Webots：不再受支持？
Webots（使用 Python 控制器）：迄今为止最有前途的方法，但基本上没有关于如何编写 NAO 控制器的文档。我不知道如何使 Speaker() 类工作。 naoqisim 的机器人和世界模拟（也不再持续）似乎运行良好。
使用 ROS 控制器的 Webots：没有官方对 Mac 的支持，推荐的 ROS Kinetics 安装对我来说还没有用。

我会很感激任何关于 Webots 是否适合对话（似乎主要关注运动）或其他合适模拟的建议的提示。

【问题讨论】：

你可以看看这个最近的模拟器：pypi.org/project/qibullet 更多用于移动，但为什么不添加你自己的存根来正确处理两边的音频，因为它是一个贡献包？跨度>

标签： speech-recognition simulation nao-robot

【解决方案1】：

编舞

不幸的是，ALTextToSpeech 和 ALSpeechRecognition API 不适用于虚拟机器人。来自文档here

ACAPELA、microAITalk 和 Nuance 引擎仅在真实机器人上可用。使用虚拟机器人时，可以在 Choregraphe Robot View 和 Dialog 面板中可视化所述文本。

和here

[语音识别]无法在模拟机器人上测试-该模块仅在真实机器人上可用，您无法在模拟机器人上测试。

文本交互可用于测试对话的流程，但不允许您正确测试语音识别的细微差别。

其他模拟器

Webots 不再受支持，而且我从来没有任何运气来设置它。 Pepper/NAO 目前最好的模拟环境是ROS Gazebo Stack。但它也不是为音频模拟而设计的。它可以让您模拟机器人做出手势并在世界中移动，但您必须编写自己的自定义代码（ROS 节点，在 python 或 C++ 中）来处理音频、进行语音识别和输出语音（连接起来例如，您拥有的麦克风和扬声器）。

如果您打算使用 NAOqi QiChat 聊天机器人，您可以使用 naoqi python api 来运行它，并将外部语音转文本和文本转语音服务连接到它。尽管您想要更复杂的语音交互，但我建议您使用成熟的聊天机器人（Dialogflow、IBM Watson 等）

【讨论】：