【发布时间】:2014-05-05 18:33:07
【问题描述】:
Facebook 使用该范围的 IP 地址抓取我的服务器 - 这导致我的服务器多次停机
31.13.97.117
31.13.97.116
31.13.97.113
31.13.97.115
31.13.97.112
31.13.97.118
31.13.97.114
31.13.97.119
首先:它不考虑任何 Robots.txt 规则......所以不能使用 Crawler-Delay。 第二:使用iptables(linux防火墙)停止爬取过程会导致Facebook社交插件的OpenGraph读取、点赞、分享和cmets出现问题。
请问如何阻止这种爬行或通过保持社交插件正常工作来控制它们..?
我看到了这个解决方案:excessive traffic from facebookexternalhit bot
但是 解决方案可以是 Apache Webserver 还是服务器端?
感谢和问候
【问题讨论】:
标签: mysql facebook apache web-crawler