【发布时间】:2016-06-30 08:26:58
【问题描述】:
我们使用“hits.product.v2ProductCategory”按“date”和“fullVisitorId”分组来获取每个 date*fullVisitorId 组合访问的类别。 这包括重复的类别。
我们的目标是在时间范围内获得一个聚合变量(按“fullVisitorId”分组,这意味着每个只有一行),以及唯一类别的数量(如果可能,一步完成)。
Felipe Hoffa 创建与类别一样多的变量的解决方案 (BigQuery: SPLIT() returns only one value) 不可行,因为 它们的数量和动态性很高。
how to do nested SQL select count 中的另一个选项强制我们按除“fullVisitorId”之外的“hits.product.v2ProductCategory”进行分组 和子查询中的“日期”,为每个日期*fullVisitorId 提供一个包含与类别一样多的行的中间表。
我们已经尝试使用 GROUP_CONCAT(UNIQUE) 来获取字符串中的所有唯一类别,然后使用 LENGTH(REGEXP_REPLACE) 来获取除分隔符之外的元素数。
还有其他更有效的方法吗?
提前致谢,
卢尔德·埃尔南德斯
【问题讨论】:
标签: sql google-bigquery