【发布时间】:2020-02-04 08:08:05
【问题描述】:
对于我们在使用 LUIS、QnA Maker 时遇到的某些问题(尤其是调度程序),我有一些“最佳实践”的问题:
1) 如果我们在 Dispatcher 中有超过 15k 的话语,是否有任何最佳实践?这看起来像是 LUIS 应用程序的一个限制,但从长远来看,该模型的可扩展性是值得怀疑的。
2) LUIS 的必应拼写检查更改了姓名和姓氏,例如,如何避免这种情况?我想当我们谈论聊天机器人时,必应拼写检查是必要的,因为错字总是在门后,但用它来命名是危险的。
3) 开箱即用不支持交叉验证,您可以使用自定义代码将数据拆分为折叠(不难),使用命令行在 k-1/k 折叠上训练和发布模型,然后将 k-fold 话语一一发送到 API。仅通过 UI https://cognitive.uservoice.com/forums/551524-language-understanding-luis/suggestions/20082157-add-api-to-batch-test-model 支持批量上传,并且仅限于包含 1,000 个话语的测试集。如果我们使用一对一的方法,我们为每 1k 笔交易支付 1.50 美元https://azure.microsoft.com/de-de/pricing/details/cognitive-services/language-understanding-intelligent-services/,这意味着要获得 5 折的交叉验证指标,例如,我们可以为一次实验支付大约 20 美元我们当前的数据,如果我们添加更多数据会更多。
4) 模型是一个黑盒子,如果需要,我们无法使用自定义功能。
【问题讨论】:
-
您能否详细说明您的第四个问题,以便我可以更新我发布的答案中的部分?
-
关于自定义功能(第 4 点),我的意思是使用我们为我们的领域开发的自定义嵌入或对文本进行自定义预处理
标签: azure nlp botframework azure-language-understanding qnamaker