【发布时间】:2021-03-09 12:45:43
【问题描述】:
到目前为止,我使用 bigrquery 的 query_exec 从 BigQuery 下载时间序列数据。
sql <- "SELECT Date, val1, val2
FROM `mydata`
WHERE DATE(_PARTITIONTIME) BETWEEN '2020-05-01' AND '2020-06-01'"
project <- "myproj"
df <- query_exec(sql, project = project, max_pages = Inf, use_legacy_sql = FALSE) %>% as_tibble()
自上次更新以来,会出现一条警告,指出 query_exec 已弃用,而应使用 bq_table_download 与 bq_project_query 结合使用。
tb <- bq_project_query(project, sql)
df <- bq_table_download(tb, page_size = 100000)
调整我的代码后,数据框的大小(超过 400 万行)与使用 query_exec 的请求相同。但是,从 ~80000 行开始,现在只出现格式为 1970-01-01 的日期,其余列要么为空,要么包含零。使用 query_exec 的旧方法仍然有效,并导致格式正确的数据帧。
有什么想法可能是这里的问题吗?
【问题讨论】:
标签: sql r dplyr google-bigquery bigrquery