【发布时间】:2019-12-10 14:20:05
【问题描述】:
我正在尝试做一些网页抓取(用于使用 Python udemy 自动化无聊的东西课程),但我不断收到 HTTPError: 403 Client Error: HTTP Forbidden for url: 错误。这是我一直在使用的代码:
import bs4
import requests
ro = requests.get('https://www.amazon.com/Automate-Boring-Stuff-Python-Programming/dp/1593275994/')
ro.raise_for_status()
这是我收到的错误消息:
Traceback (most recent call last):
File "<pyshell#3>", line 1, in <module>
ro.raise_for_status()
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/requests/models.py", line 940, in raise_for_status
raise HTTPError(http_error_msg, response=self)
requests.exceptions.HTTPError: 403 Client Error: HTTP Forbidden for url: https://www.carsales.com.au/cars/details/2012-mazda-3-neo-bl-series-2-auto/SSE-AD-6368302/
我在网上阅读了有关更改用户代理的信息,但我也不明白那是什么或如何做到这一点。有人可以在这里提供一些帮助吗?我完全迷失了,我似乎无法在任何地方获得任何网络抓取信息。如果有帮助的话,我在 Mac 上。谢谢。
【问题讨论】:
标签: python python-requests http-status-code-403