【问题标题】:Which Hash functions can be used in count-min sketch?count-min 草图中可以使用哪些哈希函数?
【发布时间】:2015-06-05 16:48:30
【问题描述】:

我的集合中的元素数量超过十亿 230。我打算计算集合中每个元素的出现次数。为此,我想使用 count-min 草图。请建议如何选择散列函数。我的申请可以容忍最多 5% 的误报率。

【问题讨论】:

  • 取值范围是多少?你有关于值分布的任何信息吗?
  • 范围集是由 4 个字母组成的字符串的集合。换句话说,宇宙是一组长度最多为 15 的四元串

标签: data-structures hash language-agnostic count-min-sketch


【解决方案1】:

Count-Min Sketch 需要 2-wise 独立哈希函数,但在实践中,我强烈推荐 MurmurHash。它快速而强大,非常适合 Count-Min Sketch。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-03-11
    • 2012-08-10
    • 2021-08-20
    • 2015-01-26
    • 2012-06-04
    • 1970-01-01
    • 1970-01-01
    • 2011-05-15
    相关资源
    最近更新 更多