【问题标题】:Query hits and custom dimensions in the BigQuery?BigQuery 中的查询命中和自定义维度?
【发布时间】:2018-06-15 11:57:47
【问题描述】:

我正在使用 BigQuery 中的 GoogleAnalytics 数据。 我想输出 2 列:特定事件操作(点击)和自定义维度(基于会话)。所有这一切,使用标准 SQL。我无法弄清楚如何正确地做到这一点。文档也无济于事。请帮我。这就是我正在尝试的:

SELECT
  (SELECT MAX(IF(index=80, value, NULL)) FROM UNNEST(customDimensions)) AS is_app,
  (SELECT hits.eventInfo.eventAction) AS ea
FROM  
  `table-big-query.105229861.ga_sessions_201711*`, UNNEST(hits) hits
WHERE 
  totals.visits = 1
  AND _TABLE_SUFFIX BETWEEN '21' and '21'
  AND EXISTS(SELECT 1 FROM UNNEST(hits) hits
    WHERE hits.eventInfo.eventCategory = 'SomeEventCategory'
  )

【问题讨论】:

  • 您遇到错误了吗?或者不是预期的输出?我想也许你应该在第二次选择中添加一个where eventinfo.eventAction = 'SomeEventCategory')但除此之外查询似乎是正确的。
  • 是的,它返回query: Column name customDimensions is ambiguous at [2:54] 。但是,@sco 的解释有所帮助。

标签: sql google-analytics google-bigquery bigquery-standard-sql


【解决方案1】:

尝试为您的表和子表指定不属于原始表架构的名称。始终告诉您指的是哪个表 - 交叉连接时,您基本上是在添加新列(此处为 h.* - 扁平化) - 但旧的列(hits.* - 嵌套)仍然存在。 我命名 ga_sessions_* t 并用它来引用交叉连接和 customDimension。

另外:您不再需要将 MAX() 用于 customDimensions 的传统 sql 技巧。现在是一个简单的子查询 :)

尝试:

SELECT
  (SELECT  value FROM t.customDimensions where index=80) AS is_app, -- use h.customDimensions if it is hit-scope
  eventInfo.eventAction AS ea
FROM  
  `projectid.dataset.ga_sessions_201711*` t, t.hits h
WHERE 
  totals.visits = 1
  AND _TABLE_SUFFIX BETWEEN '21' and '21'
  AND h.eventInfo.eventCategory is not null

【讨论】:

  • 其实我还有一个问题。据我了解,这更像是一种隐式的交叉连接方式。在那种情况下,连接两个表的键是什么?我假设当前加入发生在每个唯一会话的范围内?
  • 交叉连接不需要键 - 它是两个表中所有可能的行组合。这意味着两个表都不能为 NULL。因为每个会话都是t 中的一行,是的,它是会话范围。
  • 第二行不应该是(SELECT value FROM h.customDimensions where index=80) AS is_app吗?
  • 任何人收到此错误:Scalar subquery produced more than one element
  • 这意味着您的子查询返回了多个值。但是一个字段只能保存一个值 - 因此,您可以将输出输入到 array() 或子查询中的 limit 1。如果您期望的值不超过一个,则数据创建过程可能有问题。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多