【发布时间】:2018-05-05 23:10:37
【问题描述】:
我现在正在尝试抓取 instagram 帖子查询(“https://www.instagram.com/graphql/query/query_id=17888483320059182&id=USER_ID&first=50”)的纯文本,但只得到 403 和 301 响应。 有谁知道我怎样才能绕过这些响应或抓取数据?
【问题讨论】:
-
除了请求该 URL,您还需要添加网站期望的所有标头。这包括用户代理和一些特殊的身份验证标头。
标签: python web-scraping scrapy instagram