【发布时间】:2016-03-24 20:21:12
【问题描述】:
我想实现邮件过滤;在 WEKA 应用中通过机器学习将电子邮件分类为垃圾邮件或合法(文本分类)。
如何通过 WEKA 应用获取数据集的“特征向量”?该向量应包含频率最高、权重最高的 100 个垃圾邮件词。
数据集:http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/smsSpamCollection.arff
【问题讨论】:
标签: machine-learning classification weka feature-extraction