【发布时间】:2021-12-05 14:03:25
【问题描述】:
那么假设我的桌子是这样的:
+---------------------+
|ColA | ColB | ColC |
+---------------------+
| AA C 5 |
| AA C 8 |
| AA C 9 |
| BB D 3 |
| BB D 4 |
| CC E 1 |
| CC E 2 |
| CC E 3 |
| CC E 5 |
+---------------------+
我想从 COL A 中随机抽样组而不是行。每个组都是一系列事件,我想要每个组的所有这些事件,这就是为什么我不想只对行进行采样。我想像下面这样采样:
+---------------------+
ColA | ColB | ColC
+---------------------+
| AA C 5 |
| AA C 8 |
| AA C 9 |
| CC E 1 |
| CC E 2 |
| CC E 3 |
| CC E 5 |
+---------------------+
下面显然是对行进行采样,所以不好。
SELECT * FROM TABLE TABLE_SAMPLE BERNOULI(1)
GROUP BY COLUMN A
我还有一个包含 10 个组的 COL B,我希望所有这些 qroup 就它们的总行数而言具有相同的表示。谢谢!
【问题讨论】:
-
您能否添加一些示例数据和所需的输出?
-
谢谢,我编辑了我的帖子
标签: sql group-by amazon-athena presto sample