【发布时间】:2018-03-01 03:15:16
【问题描述】:
我在来自the NYC Yellow TaxiCab public dataset 的 Google BigQuery 中有一个包含约 100 万行的表。正如您从该链接中看到的那样,该模式没有主键。每行代表一次旅行/交易,但没有customer_id 字段。
我想添加一列 customer_id 并向其分配随机数,以便:
For rows 1-20, `customer_id` should be assigned `1`
For rows 21-40, `customer_id` should be assigned `2`
and so on..
换句话说,我希望表中的 20 行恰好(和任何)具有特定值 customer_id。
【问题讨论】:
-
如何对这些行进行排序?意思是,“第1行”是什么意思?请注意,在 SQL 世界中,行没有顺序,除非您给它们一个顺序。
-
有没有办法将字段添加到表中,使其每 20 行后递增。
-
但是为什么呢?了解用例可能会让我们找到解决问题的替代答案
-
我想查看大约 100 万客户的聚合数据,每个客户有 20 行。所以我希望一个客户在表中有 20 笔交易
-
为每个客户分配完全随机的行?它必须是 20,还是每个 id 可以得到大约 17~23 行?
标签: mysql sql google-bigquery