【问题标题】:Firebase vs BigQuery: distinct users does not matchFirebase vs BigQuery:不同的用户不匹配
【发布时间】:2020-06-17 11:30:28
【问题描述】:

我无法理解 Firebase 控制台和 BigQuery 之间计算不同用户的差异,请您帮我理解它们吗?

  • 在 bigquery 中,我运行以下查询:
           select x.daytime, count(distinct x.user_pseudo_id) from (
                                        select _TABLE_SUFFIX daytime, user_pseudo_id 
                                        from `analytics_186900506.events_*`
                                           where _TABLE_SUFFIX BETWEEN '20200501' AND '20200531'
                                               and event_name="session_start"  
                                               and platform ='ANDROID'
                                     ) x
             group by x.daytime
             order by x.daytime
  • 在 firebase 控制台中,我选择 event="session_start",按 Platform=Android 和 2020 年 5 月 1 日至 31 日期间进行过滤。然后我将结果导出到 csv 文件。

我检测到,在先验不再修改的时间段内,每天不同用户的数量存在 0-5% 的差异,他们已经超过 1 周了。一般来说,bigquery 中的结果要么匹配 Firebase,要么略高。在 bigquery 中查看数据,也不适合我认为这是由于时区的差异。查询是否有错误?

【问题讨论】:

    标签: firebase google-bigquery firebase-analytics


    【解决方案1】:

    您的查询似乎没问题;但是,it's not recommended 使用 session_start 事件进行比较:

    永远不要比较像 session_start 或 user_engagement 这样频繁触发的事件。

    在同一个答案中,还有一些关于 Firebase 中的 count 方法的有趣信息可以解释差异:

    此外,Google Analytics for Firebase 正在使用 HyperLogLog (HLL) 近似算法来计算用户数。这在按用户属性和受众过滤用户指标时提供了更大的灵活性,但可能会导致事件计数出现差异。

    如果您希望统计活跃用户,也许using "user_engagement" event 可以帮助进一步减少差异。

    最后,如果您想深入了解您观察到的差异,我建议您直接联系Firebase support

    【讨论】:

      猜你喜欢
      • 2019-10-02
      • 1970-01-01
      • 1970-01-01
      • 2022-12-09
      • 2018-09-11
      • 1970-01-01
      • 2018-04-08
      • 1970-01-01
      相关资源
      最近更新 更多