如何快速准备 rasa 训练数据答案

【问题标题】：How to quickly prepare rasa training data如何快速准备 rasa 训练数据
【发布时间】：2019-09-16 08:02:03
【问题描述】：

我打算用rasa从零开始构建一个聊天机器人。现在最大的困难是如何自动化生产训练数据。训练数据包括nlu.md和story.md。

我试过rasa-nlu-trainer和Chatito，但是还是有很多手动操作，如果以后有上万的语料库的话，如何标记数据，让数据符合数据格式nlu.md 和 stories.md

是否有自动化工具或程序来执行此操作？非常感谢！

【问题讨论】：

我不是专业人士，但是你试过botsociety.io/chat 吗？
我没有投反对票，但您必须详细解释“生产训练数据”的含义；是数据文本文档（您提到语料库）？要不然是啥？请用示例重新编辑您的问题

【解决方案1】：

好吧，如果您正在做任何与机器学习相关的事情，那么您的数据是模型学习所需要的最重要的东西。因为我们希望模型从这些数据中学习，所以我们创建数据，然后用它训练模型。你所要求的是以某种方式为其创建数据的东西。正是因为不存在这样的东西，我们才创建数据集来自己训练人工智能，以便模型从中学习。那么，如果您将数据创建过程自动化，您希望模型学习什么？

因此，您无法自动创建数据，因为如果可以的话，我们现在已经拥有通用人工智能 (AGI)。

但如果您的目标只是格式化数据，那么您可以为此编写一个脚本。

【讨论】：