【发布时间】:2015-11-20 03:33:52
【问题描述】:
目前我们在做什么,根据社交媒体上的一些关键字检查用户讨论。根据关键字检测,我们确定这可能是谣言。
自动化流程的方法:
- 基于关键字:验证会话中基于 1-2 克的关键字。如果存在关键字,则将其标记为可疑对话
- 基于分类器的方法:使用一些预先标记的可疑对话训练分类器。曾经以 >50% 的概率分类,标记为可疑。
对于第二种方法,我正在考虑朴素贝叶斯分类器,并使用 scikit learn 以精度、召回率、F 度量值识别结果。
有没有更好的方法来解决这个问题?或者一些可以结合这两种方法的模型?
【问题讨论】:
标签: machine-learning scikit-learn classification prediction naivebayes