【发布时间】:2021-08-30 15:42:53
【问题描述】:
| start_time | end_time | HostID | gameID |
|---|---|---|---|
| 6/14/2021 20:13 | 6/14/2021 22:22 | 1 | AB1 |
| 6/14/2021 20:20 | 6/14/2021 21:47 | 2 | AB2 |
| 6/14/2021 20:22 | 6/14/2021 22:07 | 3 | AB3 |
| 6/14/2021 20:59 | 6/14/2021 21:15 | 4 | AB4 |
| 6/15/2021 21:24 | 6/15/2021 22:09 | 1 | AB5 |
| 6/15/2021 21:24 | 6/15/2021 21:59 | 2 | AB6 |
| 6/15/2021 23:11 | 6/16/2021 01:22 | 4 | AB7 |
| 6/16/2021 20:13 | 6/16/2021 21:23 | 3 | AB8 |
我有一张有开始时间和结束时间的表格。我想计算每小时活跃的游戏室。我知道我至少应该尝试解决这个问题,但我真的不知道从哪里开始,也不知道这是否可以使用 SQL。
我首先做的是使用 start_time 计算一个小时内有多少个游戏 ID。但我确定我没有回答每个会话的“活跃”问题。我所做的只是统计每小时有多少人开始玩游戏。
预期的结果是这样的
白天
| Time | Active |
|---|---|
| 6/14/2021 2000 | 4 |
| 6/15/2021 2100 | 4 |
| 6/16/2021 2200 | 2 |
| 6/15/2021 2100 | 2 |
| 6/16/2021 2200 | 1 |
| 6/17/2021 2300 | 1 |
| 6/16/2021 0 | 1 |
| 6/17/2021 1 | 1 |
| 6/18/2021 2000 | 1 |
| 6/19/2021 2100 | 1 |
或不按天分组的每小时活跃会话数。
小时
| Time | Active |
|---|---|
| 2000 | 5 |
| 2100 | 7 |
| 2200 | 3 |
| 2300 | 1 |
| 0000 | 1 |
| 0001 | 1 |
【问题讨论】:
标签: sql google-bigquery data-analysis