【发布时间】:2020-02-15 06:58:09
【问题描述】:
我一直在收集BigQuery 中的数据以进行分析。但是,数据量在增长,我只需要 2 周的近期数据。我想删除未使用的数据。我做了一些研究,发现分区数据有一个过期选项。
当前设置:
我的表是分区表 我使用带有类似代码的 Lambda 函数来将数据放入表中(我尝试添加 timePartitioning 选项,但它不起作用,所以这就是为什么我在 stackoverflow 上询问是否有人知道)
wait bq
.dataset("dataset name")
.table('tablename' + '$' + partitionTime)
.load( filename, {
sourceFormat: 'CSV',
schema,
skipLeadingRows: 1,
timePartitioning: {
expirationMs: "300000"
}
});
partitionTime 的格式为 YYYYMMDD(这会将数据插入该分区)
感谢您的所有 cmets 并花时间阅读我的麻烦 :) 祝你有美好的一天。
【问题讨论】:
-
您能提供更多信息吗?我想知道您在 lambda 中使用的是哪种语言(可能是 JavaScript)。你能解释一下你的工作流程吗?
标签: database google-cloud-platform google-bigquery