解析顶部关注的页面答案

【问题标题】：Parse top followed pages解析顶部关注的页面
【发布时间】：2018-04-05 04:19:25
【问题描述】：

我专注于使用 Python 进行解析，目前从事社会学研究。在我的研究中，我需要解析任何最流行的社交网络中最受关注的页面。我已经通过他们的 API 和其他方法来搜索这些内容，并发现他们中的大多数（Facebook、Twitter、Instagram）不允许通过关注者数量或其他信息进行搜索。

有人遇到过这个问题吗？你是怎么克服的？有什么方法可以解析我需要的内容（不仅在上述社交网络中，不包括 YouTube）？

UPD：出于研究目的，我需要数千个。

【问题讨论】：

【解决方案1】：

设法找到 twitter 的答案。不是很优雅，但这正是我所需要的。

如果您需要超过 1k 的某些博主（例如拥有 100 万或更多关注者的博主），您可以使用以下算法：

我想你已经明白了。在大多数情况下，热门页面主要跟随最受欢迎的页面，这就是为什么它会成功=）由于 twitters 的 API 每 15 分钟只为您提供 15 个请求，具体取决于您需要的页面数，这项工作需要一些时间（对我来说，获得 1k 个页面需要 1 小时）

【讨论】：