【问题标题】:Mixpanel: Merge duplicate people profiles and also merge eventsMixpanel:合并重复的人员资料并合并事件
【发布时间】:2020-05-09 09:01:12
【问题描述】:

由于代码中标识符的切换,我有重复的配置文件。我现在想合并重复的个人资料,并合并事件/活动源。

我通过调用使 API 正常工作

deduplicate_people(prop_to_match='$email',merge_props=True,case_sensitive=False,backup=True,backup_file=None)

实际上已删除重复项,但未合并事件/活动提要。所以我会丢失很多事件。

有没有办法同时删除重复和合并事件/活动提要?

【问题讨论】:

    标签: merge duplicates mixpanel


    【解决方案1】:

    由于标识符的更改,有些人使用 ID 而其他人使用电子邮件作为 distinct_id 会发生重复。事件由该 ID 引用或发送给相应人员的电子邮件。

    这就是我最终为人和他们的事件重新创建身份映射所做的工作:

    我使用 Mixpanel 的 API (export_people / export_events) 创建人员和事件的备份。我编写了一个脚本,为使用实际 ID 作为 distinct_id 而不是电子邮件的人创建映射“distinct_id email”(每个人都有一个 $email 字段,无论 $distinct_id 的内容如何)。

    然后我检查了所有导出的事件。对于 ID 为 distinct_id 的每个事件,我使用映射将 distinct_id 更改为电子邮件。更新的事件保存在 JSON 文件中。因此,使用电子邮件作为 distinct_id 创建从事件到人员的引用——否则会丢失的事件。

    然后我继续使用 Mixpanel 中的重复数据删除 API 删除所有重复项,从而丢失了一些事件。现在我从之前的步骤中导入了事件,这让我找回了那些丢失的事件。

    在使用这种方法之前需要考虑三个开放性问题:

    1. 我相信事件实际上并没有在重复数据删除时被删除。因此,通过再次导入它们,系统中可能会出现重复的事件,这些事件只是没有被某个人引用,并且可能会在某个时候出现。

    2. $email 的重复数据删除确实将使用电子邮件的人保留为 distinct_id,并删除了具有实际 ID 的人。我不知道这是不是每次都是真的,或者可能是巧合。对于仍然使用 ID 作为 distinct_id 的人,我的方法将失败。

    3. 我想通常不鼓励像这样破解 distinct_id,因为犯错可能会导致数据丢失。所以一定要做好。。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-03-30
      • 1970-01-01
      • 2018-10-08
      • 1970-01-01
      • 2017-05-27
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多