【发布时间】:2021-07-06 05:11:23
【问题描述】:
我有一个表,其中包含一个game_id、category、表示一个月活动的日期列,表示为该月的第一天date_month,以及总计amount。
在某些月份中,game_id 和 date_month 的类别缺失,我需要为每个游戏的每个月在整个表中为缺失的唯一组集填充这些缺失的行。
举个例子:
CREATE TEMPORARY TABLE activity (
game_id INT,
category TEXT,
date DATE,
amount INT
);
INSERT INTO activity (game_id, category, date, amount) VALUES
(1, 'Up', '2015-12-01', 9)
, (1, 'Down', '2015-12-01', 12)
-- Left Missing for '2015-12-01
-- Right Missing for '2015-12-01
, (1, 'Up', '2016-01-01', 12)
, (1, 'Down', '2016-01-01', 4)
, (1, 'Left', '2016-01-01', 7)
, (1, 'Right', '2016-01-01', 3)
, (1, 'Up', '2016-02-01', 3)
, (1, 'Down', '2016-02-01', 11)
, (1, 'Left', '2016-02-01', 4)
, (1, 'Right', '2016-02-01', 8)
, (1, 'Up', '2016-03-01', 3)
, (1, 'Down', '2016-03-01', 11)
-- Left Missing for '2016-03-01'
, (1, 'Right', '2016-03-01', 8)
, (1, 'Up', '2016-04-01', 3)
, (1, 'Down', '2016-04-01', 11)
, (1, 'Left', '2016-04-01', 4)
-- Right Missing for '2016-04-01'
, (2, 'Up', '2020-12-01', 9)
, (2, 'Down', '2020-12-01', 12)
-- Left Missing for '2020-12-01'
-- Right Missing for '2020-12-01'
, (2, 'Up', '2020-01-01', 12)
, (2, 'Down', '2020-01-01', 4)
, (2, 'Left', '2020-01-01', 7)
-- Right Missing for '2020-01-01'
;
在这种情况下,需要使用 0 数量创建以下缺失值,game_id 可以有一组不同的日期范围。
(1, 'Left', '2015-12-01', 0)
(1, 'Right', '2015-12-01', 0)
(1, 'Left', '2016-03-01', 0)
(1, 'Right', '2016-04-01', 0)
(2, 'Left', '2020-12-01', 0)
(2, 'Right', '2020-12-01', 0)
(2, 'Right', '2020-01-01', 0)
到目前为止,我的尝试是在 UNION 中使用它回到主表。这不会产生任何行,因为不会生成超出其最小和最大日期范围的缺失组。
SELECT
game_id,
category,
generate_series(
min(date_month),
max(date_month),
'1month'
)::date AS date_month,
0 as amount
FROM activity
WHERE NOT EXISTS (
SELECT
1
FROM activity
WHERE game_id=game_id AND category=category AND date_month=date_month
)
GROUP BY 1,2
ORDER BY game_id, date_month
【问题讨论】:
标签: postgresql group-by aggregate-functions missing-data generate-series