【发布时间】:2018-09-02 14:42:42
【问题描述】:
我尝试了两种使用Bigrquery 包的方法
library(bigrquery)
library(DBI)
con <- dbConnect(
bigrquery::bigquery(),
project = "YOUR PROJECT ID HERE",
dataset = "YOUR DATASET"
)
test<- dbGetQuery(con, sql, n = 10000, max_pages = Inf)
和
sql <- `YOUR LARGE QUERY HERE` #long query saved to View and its select here
tb <- bigrquery::bq_project_query(project, sql)
bq_table_download(tb, max_results = 1000)
但未能出现错误"Error: Requested Resource Too Large to Return [responseTooLarge]",可能相关问题here,但我对完成工作的任何工具感兴趣:我已经尝试了here 概述的解决方案,但它们失败了。
如何将大型数据集从 BigQuery 加载到 R?
【问题讨论】:
-
为什么要投反对票?我可以很容易地用 Python 等其他语言进行操作,但使用 R 似乎没有简单的方法,除非找到一些分片选项或类似的选项。
-
该错误专门来自 Google/bigquery。你确定你read everything you should have in the docs吗?
-
@hrbrmstr 原来如此,没想到这个工具不会像 Python 中的 Pandas read_gbq 那样使用批处理或分片下载,我目前使用提到的方法用于大数据集,但它会更方便直接来自R。难道真的没有像read_gbq这样的R批量下载选项吗?
标签: r google-bigquery bigrquery