【发布时间】:2019-01-30 16:43:51
【问题描述】:
我有一个标签文本列表。有的只有一个标签,有的有 2 个,有的甚至有 3 个。您是否将其视为多类分类问题?
【问题讨论】:
标签: text-classification multiclass-classification
我有一个标签文本列表。有的只有一个标签,有的有 2 个,有的甚至有 3 个。您是否将其视为多类分类问题?
【问题讨论】:
标签: text-classification multiclass-classification
要解决的分类问题的类型取决于您的目标是什么,我不确切知道您要解决的问题类型,但从数据的形式我推测您在谈论多标签分类问题。
无论如何,让我们做一些澄清:
多类分类: 你可以有很多类(狗、猫、熊……),但每个样本只能分配给一个类,狗不能是猫。
多标签分类 这种方法的目标是为样本分配一组标签,例如在文本分类场景中,短语“今天天气晴朗”可能被分配一组标签[“天气”, “好”]。
因此,如果您需要将每个样本仅分配给一个类,基于某些可以与标签相关联的指标,您应该使用多类算法,
但如果您的目标是预测最适合您的样本的标签(例如文本标记),那么我们讨论的是多标签分类问题。
【讨论】: