【问题标题】:how to cluster percentile of events by time delta?如何按时间增量对事件的百分位数进行聚类?
【发布时间】:2016-07-19 15:38:22
【问题描述】:

在 t0 发送邮件后,我将有几个“已交付”(以及打开和点击)事件(架构和示例)

mailing_name, timestamp, email_id, event_type
niceattack, 2016-07-14 12:11:00, 42, open
niceattack, 2016-07-14 12:11:08, 842, open
niceattack, 2016-07-14 12:11:34, 847, open

我想查看一封邮件需要多长时间才能送达一半的收件人。所以说我现在要向 1000 个地址发送电子邮件,第一个开放事件在 2 分钟内,最后一个将在一周内(最小/最大第一个似乎很容易找到)但是我'希望看到一半的收件人在发送后的前 2 小时内打开了它。

我们的目标是发送能够比较的是现在发送还是周六早上发送,这会影响它的平均打开速度,或者某个特定邮件是否获得更快的曝光,并将其与其他事件相关联(点击次数一个链接,在我们的网站上采取特定的行动...)

我尝试使用累积函数(每个点发送多少个打开事件),但似乎尚未实现累积函数https://github.com/influxdata/influxdb/issues/813

您如何使用 influxdb 解决这个问题?

【问题讨论】:

  • 你能解释一下你想要做的更多一点吗?我不确定我是否理解。
  • 当然,更新了问题,对我想了解的内容进行了更完整的描述。
  • 所以我认为单独使用 InfluxDB 是不可能的,但是使用一些外部工具应该是可能的。

标签: influxdb


【解决方案1】:

目前无法单独使用 InfluxDB 解决此问题,但是如果您愿意将Kapacitor 添加到组合中,那么应该可以。特别是您需要在 Kapacitor 中为该累积函数编写用户定义函数 (UDF)。

一般流程如下所示:

  1. 安装和配置 Kapacitor

  2. 为您要查找的累积函数创建 UDF

  3. 在 Kapacitor 中启用 UDF

  4. 写一个TICKscript,使用UDF并将结果写回InfluxDB

  5. 启用由您编写的TICKscript 定义的任务

  6. 查询InfluxDB实例,获取累计函数的结果。

我很高兴在这方面如此高水平。这是一个相当复杂的过程,但应该会给您想要的结果。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-07-21
    • 2013-02-10
    • 2015-04-02
    • 1970-01-01
    • 1970-01-01
    • 2021-06-02
    • 2013-07-09
    • 1970-01-01
    相关资源
    最近更新 更多