【发布时间】:2014-10-28 13:49:06
【问题描述】:
我有一个关于将元数据附加到我们的 quiet.io 网页浏览事件的最佳做法的问题。在内部,我们使用 3 个不同的关键字类别来识别一段内容,这些关键字位于每个页面的标签中。一个很好的例子是这样的:
<meta name="namespace:tier1" content="Programming" />
<meta name="namespace:tier2" content="Web Development, Web Operations" />
<meta name="namespace:tier3" content="JavaScript, Analytics, jQuery, HTML, CSS" />
我们希望能够根据这些层级对用户进行细分,并进行如下查询:
- 查看按 tier1 关键字细分的所有流量
- 查看属于特定 tier1 关键字的最流行 tier2 关键字
- ...等等。
这是我的问题:似乎我们可以将这些元数据与浏览量事件一起发送,但我们最终会得到大量冗余数据,这些数据可能存在于一个单独的位置。例如,如果我们每天为我们的网页抓取关键字,我们可以通过 URL 对它们进行索引,并且不会将所有重复的元数据放在敬业度.io 中。
你会如何处理这个问题?我是否被困在 SQL 领域,我应该不担心重复数据吗?
一个相关的问题是,我们的关键字基本上是列表,并且热衷于.io 文档说我们应该stay away from lists。那么我需要为每个单词创建一个Metadata 事件吗?在每次浏览量上发送 +10 请求似乎有点矫枉过正。
【问题讨论】:
-
您是否能够通过 Keen 实现“属于特定 tier1 关键字的顶级 tier2 关键字”的最初目标?我在资源管理器中没有找到任何这样做的方法。