【问题标题】:Good data structure to use for range counting uniques?用于范围计数唯一性的良好数据结构?
【发布时间】:2012-09-18 06:01:02
【问题描述】:

我一直在学习用于存储数据和在 n 维空间中执行范围计数的 k-d 树。我想知道是否还有其他数据结构可以很好地计算沿某个维度的唯一值。例如,假设我有一些购买数据,如下所示:

{ "name" : "Bill", "paid_amount" : 10.00 }
{ "name" : "Anne", "paid_amount" : 3.00 }
{ "name" : "Carl", "paid_amount" : 15.00 }
{ "name" : "Bill", "paid_amount" : 8.00 }
...

我想知道有多少人(例如独特的“名字”)购买了超过 10 人。有什么想法吗?

【问题讨论】:

  • 听起来你想要一个关系数据库,也许在内存中;查看 SQLite。

标签: data-structures counting


【解决方案1】:

这是一篇关于 efficient data structures for unique counting 的文章(以及大小和准确性的权衡)。

StreamLib 的源代码、文档和相当活跃的邮件列表也是一个很好的资源。

【讨论】:

    猜你喜欢
    • 2011-01-05
    • 1970-01-01
    • 2015-12-21
    • 1970-01-01
    • 2020-10-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多