【问题标题】:count distinct of text field in data studio increased when using filter使用过滤器时数据工作室中文本字段的不同计数增加
【发布时间】:2019-05-29 00:33:15
【问题描述】:

我想在谷歌数据工作室中计算具有特定事件标签的会话数。我在数据工作室中的谷歌分析源上创建了一个新字段,如下所示:

COUNT_DISTINCT(CASE WHEN Event Label = "Form Start" THEN Session ID ELSE "" END)

其中会话 ID 是来自 GA(字符串)的自定义维度。 问题是,例如,当我将这个新指标拉到记分卡中时,我得到的值为 6,如果我在这个记分卡上添加一个过滤器,事件标签 =“表单开始”(与案例中的事件标签完全相同)新字段的声明)度量增加到 23! (这是正确的数字)。

Data Studio 是否在幕后发生了一些数据截断,或者为什么使用过滤器会增加不同的计数?

【问题讨论】:

    标签: google-analytics google-data-studio


    【解决方案1】:

    您看到的奇怪数字可能是由于采样造成的。在“查看”模式下的报告底部,应指示数字是否被抽样。

    此外,唯一事件指标应该告诉您特定事件在每个会话中发生的次数。您可能不需要在 Data Studio 中完成所有自定义工作,只需为标签添加一个过滤器即可。

    【讨论】:

    • 好的,我在报告中看不到任何有关抽样的信息,但它可以解释问题。有没有办法去除采样?我正在尝试创建自定义转化率,这就是我需要计算指标的原因(如下:datarunsdeep.com.au/blog/…
    • 您可以使用更短的日期范围。否则,您需要为 GA360 付费
    • 在这种情况下,您不应该有任何抽样问题,除非您正在提取价值数亿的会话。
    • 会话数约为 500 000,计算会话 ID 的唯一数量没有问题。混合事件标签(处于命中级别)时似乎会出现问题,这会增加计算必须经过的详细程度。我只是觉得奇怪的是在事件标签上过滤没有问题,而只是在 case 语句中使用它。
    • 您是否尝试过将指标与其他维度一起输出到表格中以确保有意义?
    【解决方案2】:

    我可能遗漏了一些需要 COUNT_DISTINCT 函数的东西,但更简单、不同的公式是否可行?

    CASE
      WHEN Event Label = "Form Start" THEN 1
      ELSE 0
    END
    

    这将创建一个数字字段,可用于具有多个聚合选项的记分卡的度量元素?关键选项是 SUM :)

    【讨论】:

    • 是的,我希望这行得通,已经尝试过了,但该语句的总和实际上总是返回 1:/
    【解决方案3】:

    我认为我遇到了类似的问题,我试图将所有页面与元数据中的某个类别进行统计:

    CASE
    WHEN REGEXP_MATCH(idio:industry, '.*Agriculture.*') THEN "Agriculture"
    else "Others"
    END
    

    在你的情况下,我认为你会使用这个:

    CASE
    WHEN REGEXP_MATCH(Event Label, '.*Form Start.*') THEN Session ID
    else "Others"
    END
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-11-15
      • 1970-01-01
      • 1970-01-01
      • 2018-09-23
      • 2021-07-05
      • 1970-01-01
      • 1970-01-01
      • 2021-08-11
      相关资源
      最近更新 更多