【问题标题】:How to quickly prepare rasa training data如何快速准备 rasa 训练数据
【发布时间】:2019-09-16 08:02:03
【问题描述】:

我打算用rasa从零开始构建一个聊天机器人。现在最大的困难是如何自动化生产训练数据。训练数据包括nlu.md和story.md。

我试过rasa-nlu-trainer和Chatito,但是还是有很多手动操作,如果以后有上万的语料库的话,如何标记数据,让数据符合数据格式nlu.md 和 stories.md

是否有自动化工具或程序来执行此操作?非常感谢!

【问题讨论】:

  • 我不是专业人士,但是你试过botsociety.io/chat 吗?
  • 我没有投反对票,但您必须详细解释“生产训练数据”的含义;是数据文本文档(您提到语料库)?要不然是啥?请用示例重新编辑您的问题

标签: rasa-nlu rasa-core rasa


【解决方案1】:

好吧,如果您正在做任何与机器学习相关的事情,那么您的数据是模型学习所需要的最重要的东西。因为我们希望模型从这些数据中学习,所以我们创建数据,然后用它训练模型。你所要求的是以某种方式为其创建数据的东西。正是因为不存在这样的东西,我们才创建数据集来自己训练人工智能,以便模型从中学习。那么,如果您将数据创建过程自动化,您希望模型学习什么?

因此,您无法自动创建数据,因为如果可以的话,我们现在已经拥有通用人工智能 (AGI)。

但如果您的目标只是格式化数据,那么您可以为此编写一个脚本。

【讨论】:

    猜你喜欢
    • 2018-03-29
    • 2019-09-30
    • 2015-12-16
    • 1970-01-01
    • 1970-01-01
    • 2020-04-05
    • 2020-03-16
    • 1970-01-01
    • 2011-12-31
    相关资源
    最近更新 更多