【发布时间】:2016-08-16 06:34:09
【问题描述】:
Instagram 官方 API (link) 允许我们通过向端点 https://api.instagram.com/v1/tags/{tag-name}/media/recent?access_token=ACCESS-TOKEN 发出 get 请求来搜索带有特定主题标签的最近图片。通过这样做,我们获得了该标签的最新 33 张图片,我们还获得了一个 max_tag_id,它允许我们请求接下来的 33 张图片。
我想获得至少 1 个月大的照片。我可以继续提出请求并找到新的max_tag_id,直到找到足够旧的图片。问题是有数百万张最近的照片,我会花很长时间才能到达旧照片的页面。我看到的唯一解决方案是了解max_tag_id 的工作原理并手动更改它以找到旧图片的页面。
这里有 5 个不同的max_tag_id 连续页面:
max_tag_ids = [u'AQDYK_538AzbSXpT2wfZrdhtqwJ8Buu0y5_Bcx-dZeQYX-RZeyRE1xW99JUoW4c2SNJ6GZ2Co-6UgWUpzdOCRl3RBIoNZw6ALRZTOYbM0kphPtEahSbv1nOyTO0SpdV3utw', u'AQA7JX63t9iVB8n0PE0_7JqUfYBWwSaukmkHJ6woOh7RTGyjbsRTFzoTr-Lml4rLnMdKKRlqbplTEK6JLfOq7r88fPmepra1SYiZKZNxh7--jxAvqWq5ru-Wt444-LuZQxk', u'AQD8GJCCxWDUd-Gv2Iys1G2RjUozXbAVcZOWa8H29vgq9UMVjD_kPVwp6y-Og2xQXO11R1ck5V925irELWK0MwHvrgGgbVljeGU9j0jpSEEDZ8ZfLmjTkbshiMsGqvw846g', u'AQCbV44lzEIHW4xgz82F-duu1iMIPLvp-ArXoTZrt_DgLwOBVpmWLsNlnyOGKlfimGrhZz3m5aFF-0lRrxNAr82pd9LOpJB06G4wwhv-VGmzZo8ZuBqnEV2LEqjNQudmZlQ', u'AQDX7sXWrADCvno3KUhvsO7r9ldcnGga5R42PSBUre2cVfu660gd232qpj74TQoboQFSS-y2jKwE2N4NAr4tsylqeA1BwArlcQpnsGO9SqusCpUG38KKJzjx7wXhdQIYE0A']
所有 id 的长度相同,均为 131 个字符。以前的页面max_tag_id 总是大于新的页面max_tag_id。
for i in xrange(len(max_tag_ids)-1):
assert max_tag_ids[0]>max_tag_ids[1], 'you should never read this'
所以我尝试使用非常小的max_tag_id(例如'0'*131)但我得到以下回复:
'max_id 不是一个有效的游标。'
有什么想法吗?
【问题讨论】: