【发布时间】:2019-10-08 22:00:43
【问题描述】:
我正在做方言文本分类。问题是一些推文,可以分为方言A和B,我该怎么做?我想做然后自动计算精度,我不想手动做。当我不将它们同时归类为 A 和 B 时,它给了我许多错误分类的文本。
但在训练中,它们并没有被归类为方言 A 和 B。而是分开进行。
【问题讨论】:
-
你需要尝试不同的东西。一个是你可以在 A 和 B 都可能的情况下创建一个新类。所以现在你的数据将是一个 3 类问题。或者你可以尝试多标签分类。看到这个:scikit-learn.org/stable/modules/multiclass.html
标签: python scikit-learn nlp text-classification