如何在非常小的数据集上进行训练？

【问题标题】：How to train on very small data set?如何在非常小的数据集上进行训练？
【发布时间】：2021-03-14 08:26:26
【问题描述】：

我们正试图了解 Rasa 的基本模型 - 那里的论坛仍然没有给我们答案 - 关于两个主要问题：

我们了解 Rasa 模型是一种基于转换器的架构。是不是在任何数据集上进行预训练？（例如维基百科等）
那么，如果我们理解正确，意图分类是一项微调任务在那个变压器的顶部。这么小的怎么能用训练集？

欣赏任何见解！

谢谢

里尔

【问题讨论】：

标签： rasa-nlu rasa rasa-core nlu

【解决方案1】：

transformer 模型未在任何数据集上进行预训练。我们使用了相当浅的 Transformer 堆栈，它不像大型预训练语言模型中使用的更深的 Transformer 堆栈那样需要大量数据。话虽如此，没有确切数量的数据点足以训练您的助手，因为它因域和您的问题而异。通常一个好的估计是每个意图 30-40 个示例。

【讨论】：

谢谢！想知道我们在哪里可以看到这个模型，以及是否有一篇论文解释并显示了这种方法的基准测试结果。对我来说绝对是新奇的。非常感谢！