【发布时间】:2021-07-16 01:48:00
【问题描述】:
这是我获取重定向 URL 的代码。是为了教育目的。我觉得该请求被检测为机器人,因此网站显示为 reCaptcha,尽管我使用了假用户代理和代理。在使用 requests.get 之前,我没有获得不同的链接,而是获得了相同的 url。有什么办法解决吗?
import requests
from fake_useragent import UserAgent
ua = UserAgent()
hdr = {'User-Agent': ua.random,
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
'Accept-Encoding': 'none',
'Accept-Language': 'en-US,en;q=0.8',
'Connection': 'keep-alive'}
PROXY = {"http":"http://X.X.X.X:YYYY"}
url = "https://avxhm.se/go/6074475/0/"
response = requests.get(url, allow_redirects=True, headers=hdr, proxies = PROXY)
print(response.url)
【问题讨论】:
-
这能回答你的问题吗? Python Requests library redirect new url
-
对不起,这不是答案。我试图找到一种绕过机器人检测的方法。我的代码在其他网站上运行良好,而不是在这个特定网站上。
标签: python web-scraping data-mining