【问题标题】:How to Stop Fake Traffic Bot with htaccess如何使用 htaccess 阻止虚假流量机器人
【发布时间】:2017-08-24 23:42:56
【问题描述】:

我担心我的网站,因为分析社交/Facebook 中显示了一些虚假流量,但详细地说,机器人会随机选择我网站上的虚假错误 URL,例如 example.com/page?=__HzoblPdx,但实际 URL 是 example.com/page/HzoblPdx/title-title。我要屏蔽这个链接page?=__HzoblPdx.

有人帮我解决这个问题吗?

【问题讨论】:

  • 我认为你最好在 serverfault 中提出这个问题。似乎不是与编程相关的问题

标签: php .htaccess


【解决方案1】:

您可以通过在 .htaccess 文件中使用以下内容轻松做到这一点:

RewriteEngine on
Options +FollowSymlinks
RewriteCond %{HTTP_REFERER} domain\.com/page\?=__HzoblPdx [NC,OR]
RewriteCond %{HTTP_REFERER} www\.domain\.com/page\?=__HzoblPdx [NC]
RewriteRule .* - [F] 

这将阻止对试图通过该域进行访问的任何机器人的访问。请确保在测试之前清除缓存。

【讨论】:

  • 兄弟这个id随机变化不固定__HzoblPdx
  • 应该在您的问题中指定。将其更改为page?=$1
  • 是否总是将__添加到URL变量之前?
  • 是的,我总是在分析中检查单下划线或双下划线
  • 但是兄弟,我检查了没有__不起作用,如果可以的话,我可以和你私聊吗
【解决方案2】:

检查 apache 访问日志并检查试图访问不存在页面的访问者的用户代理字符串。您可以使用 robots.txt 完全阻止某些用户代理。

您可以从 google 获得有关 robots.txt 的大量信息。这是一个您可以阅读的有关它的网站。 http://www.robotstxt.org/

【讨论】:

  • 这是一个优点,但不是真正的解决方案:robots.txt 提供信息,而不是禁止。机器人可以完美地选择忽略文件中的内容。
  • 我同意这一点。
  • 滞后有 htaccess 答案。我会同时使用!
  • 是的,robots.txt 非常有用,“好机器人”会跟随其中的内容.. 只是想说明它不会阻止恶意机器人
  • 当有人尝试将我的网站与此类链接域/页面一起使用时,我想显示禁止的 403 错误?=HzoblPdx
【解决方案3】:

.htaccess 文件顶部附近使用 mod_rewrite 尝试以下操作:

RewriteEngine On
RewriteCond %{QUERY_STRING} ^=_
RewriteRule ^ - [F]

这会阻止(403 禁止)任何请求的 URL,其中包含以 =_ 开头的查询字符串。

尽管此 URL 参数映射到真实 URL 的事实看起来可能是错误配置错误,而机器人已经能够找到?

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-12-05
    • 1970-01-01
    • 2021-11-16
    • 1970-01-01
    相关资源
    最近更新 更多