【问题标题】:What naughty word list is good to fight spam? [closed]什么淘气词表好对抗垃圾邮件? [关闭]
【发布时间】:2012-03-09 22:07:15
【问题描述】:

我有一个相当简单的垃圾邮件过滤机制,它使用可能来自垃圾邮件的顽皮词列表(我将这些用于发布内容以及用户个人资料字段等​​)。

我目前有:

 array ('shop','bags','shoes','shag','watches','sales','health','insurance','trader','wedding','casino','hack','ps3','cheap','episode','accessories','movie','nobod.info')

您使用什么列表?我一直在添加/更改单词,所以查看其他列表可能会有很大帮助!

【问题讨论】:

标签: spam


【解决方案1】:

这样的黑名单不会有效。机器学习技术在这里非常有用。也就是说,查看被明确标记为垃圾邮件的邮件,让计算机了解垃圾邮件的真实外观。这就是像 gmail 这样的邮件网站用来对抗垃圾邮件的方法。这是一项繁重的工作,但却是一种非常可靠的打击垃圾邮件的方法(您最后一次在 gmail 收件箱中看到垃圾邮件是什么时候?)

这样的黑名单词也有很高的误报率,这会很烦人。

【讨论】:

  • 确实有一些误报,但管理员可以很快否决。该消息仅在被有权这样做的人否决之前被隐藏。确实很烦人,但目前还不是灾难。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-11-03
  • 1970-01-01
  • 2014-08-07
  • 2013-08-06
  • 2011-09-18
  • 2012-11-10
相关资源
最近更新 更多