【发布时间】:2021-09-11 02:49:58
【问题描述】:
我有两个数据集:
dataset_a
time_stamp user group value
2021-06-20 12:48:24.521 A video 1
2021-06-15 12:50:24.521 A video 1
2021-06-10 12:48:24.521 A video 1
dataset_b
time_stamp user group label
2021-06-20 09:40:24.521 A video BA
2021-06-19 13:30:24.521 A video BB
2021-06-13 12:48:24.521 A video BC
2021-06-09 12:55:24.521 A video BD
我想创建一个数据集,如果数据集 b 按时间戳、用户和组在数据集 a 的时间戳的 1 天内,则它是匹配的。以前有没有人做过类似的事情,比如left join on dataset_b.timestamp between dataset_a.timestamp and date_add(dataset_a.timestamp,-1)。我希望具有灵活性,将来我也可以测试 -7 天,以便轻松修改。
预期输出如下:
dataset_a
time_stamp user group value timestamp_b label
2021-06-20 12:48:24.521 A video 0.5 2021-06-20 09:40:24.521 BA
2021-06-20 12:48:24.521 A video 0.5 2021-06-19 13:30:24.521 BB
2021-06-15 12:50:24.521 A video 1 NULL NULL
2021-06-10 12:48:24.521 A video 1 2021-06-09 12:55:24.521 BD
【问题讨论】:
标签: sql left-join snowflake-cloud-data-platform dateadd