【发布时间】:2021-06-16 21:47:15
【问题描述】:
我正在尝试使用 Rest API 作为 Azure 数据工厂中的数据源。
当我像底部一样使用Base URL时,它只导入了500行数据。
https://data.cms.gov/provider-data/api/1/datastore/sql?query=[SELECT * FROM af6b8b82-3893-55d4-9cea-bf8101a05e05];
因此,根据我通过互联网研究获得的一些信息,我尝试添加更多参数来提高限制,但我没有运气。
https://data.cms.gov/provider-data/api/1/datastore/sql?query=[SELECT * FROM af6b8b82-3893-55d4-9cea-bf8101a05e05][LIMIT 5000 OFFSET 5000];
基于this article,提到了添加这些参数($top & $count=true)。
我尝试了类似的方法,但它仍然只导入了 500 行数据。
https://data.cms.gov/provider-data/api/1/datastore/sql?query=[SELECT * FROM af6b8b82-3893-55d4-9cea-bf8101a05e05]&$top=10000&$count=true;
如何在 Azure 数据工厂中加入来自 Rest API 的超过 500 行数据?
这是web site,它解释了这个 SQL 查询:
由于提到了“数据集”和“SQL 查询”,我不确定应该采取哪种方法。
现在,我的问题是,我们并没有严格限制 JSON 格式的输出,对吗?
我很好奇,因为当我尝试将数据下载为 JSON 格式时,不知何故,当我尝试从 JSON 编辑器读取数据时似乎导致了一些错误。
【问题讨论】:
-
您是否尝试过
https://data.cms.gov/provider-data/api/1/datastore/sql?query=[SELECT * FROM af6b8b82-3893-55d4-9cea-bf8101a05e05][LIMIT 500 OFFSET 500];,因为从我在文档中看到的内容来看,您应该如何获得第 2 页 -
@GregGalloway 我刚刚尝试过,它仍然只插入了 500 行。
-
是的,只有 500 行,但它是行的第二页。您将不得不遍历每一页,直到少于 500 行。像这样的东西:stackoverflow.com/questions/56949173/…
-
@GregGalloway 感谢您的链接。我更新了我的问题(关于将 JSON 格式以外的方法作为输出的开放式问题)。当我阅读您提到的链接时,输出似乎是 JSON 格式 (OPENJSON(@json))。引用此数据源的网站 (data.cms.gov/provider-data/dataset/4pq5-n9py),SQL 查询部分未指定输出应为 JSON 格式。我只是不知道应该在哪里以及如何解决我的问题。我应该使用“数据集”还是应该使用“SQL 查询”?