【发布时间】:2018-12-18 08:38:13
【问题描述】:
我希望研究 Kaggle 上的一些公共数据集。 是否可以使用 RStudio 通过其 API 访问 kaggle 数据集?
干杯, 支持
【问题讨论】:
我希望研究 Kaggle 上的一些公共数据集。 是否可以使用 RStudio 通过其 API 访问 kaggle 数据集?
干杯, 支持
【问题讨论】:
Kaggle 刚刚在 2018 年 2 月(今年早些时候)推出了他们的公共 API。根据他们的 Github 存储库Kaggle/kaggle-api,Kaggle (至少到目前为止)已经让他们的 API 可以访问 "using a command line tool implemented in Python"。
我也很高兴发现 Kaggle 的 API 的存在,同样,如果有人编写了一个 API 包装器包用于在 R 中与 Kaggle 的 API 接口,我也很感兴趣。我找不到任何人,所以我写了一个我自己,你可以在这里找到:https://github.com/mkearney/kaggler。从我创建 repo 到现在还不到一周,所以我还不能说它的可靠性,但现在它似乎是最好的起点。而且,作为记录,只要人们愿意使用它,我就打算至少维持对包的最低支持水平(假设没有热心的第三方介入他们自己的 R 包),但 API 本身是新的,因此可能还需要几个月的时间才能有任何真正稳定的选择。
;;
另外,虽然我完全理解您的问题的意思,但我认为值得指出的是,从技术上讲,Rstudio 是一个集成开发环境 (IDE),不一定是将您连接到非Rstudio 网络 API。您实际上正在寻找的是一个 R 扩展/库/包,旨在充当 Kaggle API 的包装器/客户端/接口。当然,这种区别大多是微不足道的,因为如果你在 Rstudio(一个优秀的、开源的以 R 为中心的 IDE)中工作以与 Kaggle 之类的外部 API 进行通信,那么你是 "access[ing] kaggle datasets through its API using RStudio" 。但为了在应得的地方给予信任,更准确地说,您希望利用 {Rstudio} 和 {pkgname} 包通过 R 环境与 Kaggle 的 API 通信。
【讨论】: