【发布时间】:2017-06-14 09:17:47
【问题描述】:
有点难以定义我想要达到的目标,但在这里尝试一下。我正在研究 redshift 并在以下示例 Table A 之上编写查询:
User ID || Active_in_Month || Max_Months_On_Platform
1 1 6
1 2 6
1 5 6
2 1 3
2 3 3
按“Active_in_Month”分组后,我想在 Table B 中获得以下输出:
Active_in_Month || Active_Distinct_Users || User_Cohorts
1 2 2
2 1 2
3 1 2
5 1 1
“Active_Distinct_Users”是一个简单的 COUNT(*)。但是,“User_Cohorts”的计算是我卡住的地方。该列应该代表平台上有多少用户最多处于“active_in_month”列中的值处于活动状态。例如,在 表 B 的第 1 行中,有两个用户的“Max_Months_on_Platform” > 1(在月份活跃)。 表 B 的第 5 行只有 1 个“User_Cohort”,因为只有 1 个用户的“平台上的最大月数”> 5 (Active_in_Month)。
希望这能解释我想要了解的内容。
【问题讨论】:
标签: mysql amazon-redshift