【问题标题】:Watson Natural Language Classifier - using a scale for classesWatson Natural Language Classifier - 使用等级来分类
【发布时间】:2016-08-12 10:50:21
【问题描述】:
在使用 Watson 的 NLC API 时,可以为课程使用量表吗?例如,1-5 分或是/否/可能分类?
我的训练数据包含一系列新闻标题。对于每一个,我都有一个不有趣、有点有趣和非常有趣的“类”。我想根据读者过去发现的有趣内容来预测它是否是读者感兴趣的标题。因为它感觉更像是一个预测 1 到 3 之间数字的回归模型,所以我想知道分类器是否可以在这个应用程序中正常工作。想法?
【问题讨论】:
标签:
ibm-cloud
ibm-watson
nl-classifier
【解决方案1】:
是的,您可以使用 1-5 分(使用 5 个类别),它是否有效,很难说,因为这取决于您的数据:-)
但这是一种完全有效的方法。
NLC 将在幕后做的是从每个文本样本中提取含义,使用基于内部维基百科的本体计算一些语义距离,并尝试根据每个样本文本的概念创建分类器。
因此,如果在您的文本示例中,每个集群之间存在内在语义差异,则使用 5 个类别将起作用,因此分类器可以正确收集相关内容并区分不同内容。
这里使用了相同的逻辑,in this recipe,使用 Watson Image 分类器而不是 NLC,但逻辑是相同的。