【发布时间】:2018-02-07 21:53:29
【问题描述】:
我最近有了从 instagram 帐户及其帖子中抓取信息的想法,例如 cmets 的数量或喜欢的数量。到目前为止,我在 chrome 中调试时发现,例如网络选项卡下的链接 https://www.instagram.com/instagram/?__a 返回带有所需信息的 JSON,但实际加载的仍然是正常的网站 html代码。
到目前为止,我在 python 中尝试了以下代码:
import urllib.request
r = urllib.request.urlopen(url)
print(r.read())
或在 javascript 中:
window.onload = function () {
res = fetch("https://www.instagram.com/instagram/?__a", {
method: 'get'
}).then(function (data) {
return data.json();
}).catch(function (error) {
console.log("ERROR".concat(error.toString()));
});
console.log(res.user);
};
所以我遇到的问题是,当使用这些函数时,我只能获取网站代码(html),有没有办法只获取在后台加载的 JSON?我知道人们会推荐我使用 instagram api,但我没有网站也没有公司可以注册。
【问题讨论】:
-
url 也有 query_hash - 你没有那个。它也可能受到保护,不允许跨域
标签: javascript python json