【发布时间】:2012-11-02 14:14:43
【问题描述】:
到目前为止,我能够通过将这些字符串与已知的用户代理匹配来从用户代理字符串列表中检测机器人,但我想知道还有什么其他方法可以使用 php 来做到这一点,因为我检索的机器人比预期的要少这个方法。
我也在寻找如何检测浏览器或机器人是否使用用户代理字符串来欺骗另一个浏览器。
感谢任何建议。
编辑:这必须使用带有如下行的日志文件来完成:
129.173.129.168 - - [11/Oct/2011:00:00:05 -0300] "GET /cams/uni_ave2.jpg?time=1318302291289 HTTP/1.1" 200 20240 "http://faculty.dentistry. dal.ca/loanertracker/webcam.html" "Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.4; en-US; rv:1.9.2.23) Gecko/20110920 Firefox/3.6.23"
这意味着除了访问时间之外,我无法检查用户行为。
【问题讨论】:
-
不幸的是,无论你多么努力,机器人仍然会通过你为此实现的任何东西。
-
不可能。您可以启发式地查看它,但仅此而已。
标签: php user-agent bots spoof