【发布时间】:2019-03-27 19:06:34
【问题描述】:
对于我的工作,我需要创建一个 Python 程序来自动从 SBIR 下载“奖励”的所有结果。
目前有 171616 个结果。
我有两个可能的选择。我一次可以下载 1000 个,但我需要验证我不是 reCAPTCHA 的机器人,因此我无法自动下载。
或者我可以使用他们的 API,这很棒!但是在搜索所有可用的内容时,它只会下载 100 个结果。有没有办法遍历块,然后将其编译成一个大的 JSON 文件?
这是where我说file>save as>filename.json
任何帮助/建议都会真正帮助我。
【问题讨论】:
-
除非有人破解了验证码,否则我会说通过 API 是唯一的选择,对于一次更多的结果,您可以继续循环访问他们的 api 并将新的 json 附加到更大的对象中.
-
就是这样。我不知道如何使用将块从第一个 100 更改为第二个 100 ......等等。在我以前使用不同来源的项目中,我能够循环增加块,但这不适用于这个。 ........ds=d&flds=e&down_chunk=1........ds=d&flds=e&down_chunk=2........ds=d&flds=e&down_chunk=3
标签: python json xml api dataframe