【发布时间】:2022-01-03 02:20:48
【问题描述】:
WebDriveridentifies itself as a bot to external websites 的一种方法是将 webdriver-active 标志设置为 true。
SO suggested 上的用户认为可以修改 Chrome Driver 源代码以删除所有机器人识别属性(请参阅 this 和 this 响应)。
是否可以通过修改Geckodriver、Firefox WebDriver 或两者的源代码来实现与 Firefox 类似的结果?我问是因为目前有no way to conceal WebDriver using Firefox Options 没有修改源代码。
如果我们能以某种方式从源代码中删除机器人识别功能,我们可以防止 WebDriver 被识别为机器人而不需要 to bundle TOR with Firefox。
虽然 Selenium(在其当前状态下)识别自己这一事实无法回避,但我们当然可以修改源代码以删除所有识别,类似于它在 Chrome 驱动程序中实现的方式?
【问题讨论】:
-
源代码在这里:github.com/mozilla/geckodriver/releases(您可能还想更改原型名称...)
-
Firefox 可能会设置标志,但是......它会知道何时使用 Marionette,这可能会自行设置标志。我真的不知道......但无论如何,任何机器人检测都会比仅仅依靠这个更聪明。他们至少还会检测到脚本注入/挂钩。 (但必须针对特定于机器人的东西,因此不会标记附加组件/扩展......)
标签: java selenium selenium-webdriver firefox webdriver