【发布时间】:2021-05-21 18:55:52
【问题描述】:
如果这个问题太愚蠢,请原谅我。 我们知道,在浏览器中可以转到 Inspect -> Network -> XHR -> Headers 并获取 Request Headers。然后可以将这些标头添加到 Scrapy 请求中。
但是,有没有办法使用 Scrapy 请求自动获取这些请求标头,而不是手动获取?
我尝试使用:response.request.headers,但这些信息还不够:
{b'Accept': [b'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8'], b'Accept-Language': [b'en'], b'User-Agent': [b'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 S afari/537.36'], b'Accept-Encoding': [b'gzip,deflate']}
我们在浏览器中看到了更多的请求标头信息。如何获取这些信息?
【问题讨论】:
标签: web-scraping scrapy