【发布时间】:2013-06-06 21:45:17
【问题描述】:
我是 PHP 新手,我正在尝试开发一个系统来捕捉那些试图将垃圾邮件站点输入到社交网站的人。 (例如在 pinterest、博客网站等中的评论或帖子。)
以下是我正在使用的方法:当用户在帖子/评论字段中输入文本时,我将浏览所有文本并提取其中的所有 URL。那么:
- 将网页的标题与该网页的正文进行比较,以查看标题字段中有多少单词包含在正文中。然后给它一个排名。
- 将元标记与网页正文进行比较,并查看元标记是否包含在网页正文中。然后给它一个排名。
- 将锚文本与该网页的正文进行比较
- 将 URL 中的关键字与网页正文进行比较
- 检查网页是否包含色情文字。
- 通过将 URL 与在线数据库进行比较来检查列入黑名单的网站。
您能否告诉我是否有任何其他方法可以用来确定给定 URL 的用户是垃圾邮件还是营销网站?任何帮助将不胜感激。
【问题讨论】: