【发布时间】:2020-02-09 11:28:31
【问题描述】:
import requests
user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36'
headers = {'User-Agent': user_agent}
page = requests.get("https://sky.lea.moe/stats/PapaGordsmack/", headers=headers)
html_contents = page.text
print(html_contents)
我正在尝试从 sky.lea.moe 网站为特定用户进行网络抓取,但是当我请求 html 并打印它时,它与浏览器中显示的不同(在 chrome 上,查看页面源代码)。
我得到的是:https://pastebin.com/91zRw3vP 分析这个,它是关于检查浏览器和重定向的东西。有什么想法我应该怎么做?
【问题讨论】:
-
“检查浏览器和重定向”是什么意思?你知道问题是什么吗?你确定 HTML 没有被 JavaScript 修改吗?
标签: python html python-3.x python-requests