【发布时间】:2015-04-30 13:19:31
【问题描述】:
我是 bigquery 的新手,如果这是一个菜鸟问题,我很抱歉!我有兴趣按页面路径或标题划分会话。我了解一个会话可以包含多个路径/标题,因此总和将大于会话总数。本质上,我想创建一个“会话 ID”并计算不同的会话 ID,其中路径如 a 或 b。
从一开始就手动计算总会话数实际上可能会有所帮助。我试图连接访问 id 和完整的访问者 id 以创建一个唯一的访问 id,但显然这与会话有很大不同。有人可以帮助启发我吗?谢谢!
我正在处理我们的 GA 网站数据。架构是 standard in GA 导出。
数据样本
让我们使用样本BigQuery (London Helmet) data中的一个例子:
这一天有 63 节课:
SELECT count(*) FROM [google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910]
这些会话中有多少是 hits.page.pagePath 之类的 /vests% 或 /helmets%?仅背心与仅头盔有多少?谢谢!
【问题讨论】:
-
介意发布您已有的查询,或者您正在使用的表的架构?我个人想知道我正在为哪个表编写查询:)。提供一个示例数据集,以及您希望该数据集的预期输出:)
-
我相信他的意思是 Google Analytics 导出到 BigQuery 生成的标准架构
-
感谢您的回复帕特里斯!我正在处理我们的 GA 站点数据。 Schema 是 GA 导出中的标准:support.google.com/analytics/answer/3437719?hl=en 让我们使用示例 bigquery(伦敦头盔)数据中的一个示例:support.google.com/analytics/answer/3416091?hl=en 今天有 63 个会话:SELECT count(*) FROM [google.com:analytics- bigquery:LondonCycleHelmet.ga_sessions_20130910] 这些会话中有多少是 hits.page.pagePath 之类的 /vests% 或 /helmets%?谢谢!
-
@MoshaPasumansky 确实如此。发表评论后,我查找了 BQ 和分析,并认为这是一个标准模式 :)
标签: google-analytics google-bigquery