【问题标题】:How to train LUIS in right way如何以正确的方式训练 LUIS
【发布时间】:2017-05-04 17:05:41
【问题描述】:
我已经介绍了简单的意图 - SearchForPerson。因此,应用程序“None”和“SearchForPerson”中有两个意图。为了识别我正在寻找的人,我已经定义了具有孩子“FirstName”和“LastName”的层次结构实体“Person”。
现在我正在寻找一种如何训练 LUIS 的方法。有可能的方法:
- 我可以上传预定义的一组话语,但使用不同的
名字/姓氏(每个话语 100 个变体 - “搜索 {fistname}
{lastname}" - 例如)。
- 我可以上传预定义的话语集,并使用拳头和姓氏定义短语列表。
- 别的东西。
请任何人推荐最有效的方法来训练 LUIS 以完成这项简单的任务。所有数据将通过api上传到应用程序。
【问题讨论】:
标签:
c#
botframework
azure-language-understanding
【解决方案1】:
您在问题中说最有效的方法:
- 我可以上传预定义的话语集 (7),但名称不同(每个话语有 100 个变体 - 例如“搜索 {fistname} {lastname}”)
但有几点需要重新审视。您不应该尝试使用 100 种变体来训练它,因为您使用的是 LUIS,因此您不需要这样做。我建议从最多十几个话语开始。
训练它的话语数量会有所不同,尤其是取决于您使用的语言。我假设您正在使用 en-us 文化。因此,它比丹麦语或泰卢固语更容易识别英语中的常用名称。
要导入数据集,请转到 LUIS 应用中的训练和测试。这是页面的屏幕截图,您可以在其中导入话语:
最后,这是 LUIS 门户中接受的数据集语法信息:
数据集允许的语法
文件应为 JSON 格式。
该文件应包含一组遵循以下 JSON 格式的话语:
[
{
"text": "hey dad, are you hungry?",
"intent": "None",
"entities":
[
{
"entity": "FamilyMember",
"startPos": 4,
"endPos": 6
}
]
},
{
.
.
.
}
]