【发布时间】:2019-10-12 07:57:33
【问题描述】:
我有一个机器因某些机器组件故障而获得的票据数据集。票是文本形式的。
对于每个故障,我们有大约 8-10 个诊断标签。这说明了问题可能是什么,并被用来修复票证。
现在在训练数据中,我有一张票和 1 个诊断标签。所以这是一个多类训练数据。
在训练多类 ML 模型后,给定一个新的文本问题,我能否根据概率排名为该可能的票证建议前 5 个诊断?
我担心的是,这对于多标签数据是有意义的,因为训练数据也有多个标签,并且您可以将 sigmoid 激活放在最后,以获得针对该票证的每个诊断的正确概率。
但是,如果训练数据是多类的(意味着一张票只有一个对应的标签),我还可以建议多个诊断标签作为排名顺序吗?
谢谢
【问题讨论】:
标签: machine-learning nlp