【发布时间】:2020-10-09 02:24:56
【问题描述】:
我试图理解为什么 Flajolet-Martin 算法 (FM) 工作时间过长。算法here(第 4.4.2 节)的描述很有希望,但并不完美。
为什么任何元素的最大尾部长度(尾随零的数量)可以作为流中不同元素数量的估计?想象一下只有两个不同的元素 {1,2},它们分别散列到 {10001, 10000}。这意味着不同元素的数量是 2^4,这显然是不正确的。
有什么诀窍?
【问题讨论】:
标签: algorithm stream cardinality-estimation flajolet-martin