【问题标题】:How to train on very small data set?如何在非常小的数据集上进行训练?
【发布时间】:2021-03-14 08:26:26
【问题描述】:

我们正试图了解 Rasa 的基本模型 - 那里的论坛仍然没有给我们答案 - 关于两个主要问题:

  • 我们了解 Rasa 模型是一种基于转换器的架构。是不是 在任何数据集上进行预训练? (例如维基百科等)

  • 那么,如果我们 理解正确,意图分类是一项微调任务 在那个变压器的顶部。这么小的怎么能用 训练集?

欣赏任何见解!

谢谢

里尔

【问题讨论】:

    标签: rasa-nlu rasa rasa-core nlu


    【解决方案1】:

    transformer 模型未在任何数据集上进行预训练。我们使用了相当浅的 Transformer 堆栈,它不像大型预训练语言模型中使用的更深的 Transformer 堆栈那样需要大量数据。 话虽如此,没有确切数量的数据点足以训练您的助手,因为它因域和您的问题而异。通常一个好的估计是每个意图 30-40 个示例。

    【讨论】:

    • 谢谢!想知道我们在哪里可以看到这个模型,以及是否有一篇论文解释并显示了这种方法的基准测试结果。对我来说绝对是新奇的。非常感谢!
    猜你喜欢
    • 2015-08-14
    • 2018-05-06
    • 1970-01-01
    • 2020-08-15
    • 2019-06-19
    • 2015-12-11
    • 2020-07-22
    • 2015-03-13
    • 1970-01-01
    相关资源
    最近更新 更多