【发布时间】:2019-07-10 15:23:59
【问题描述】:
我正在为一组对象制作标签,最多可能有 10,000 个。标签格式为user-generated-name-h3b4,h3b4 是机器生成的哈希。我需要多少个字符来保证对象集的唯一性,我应该使用什么散列函数/库? (在 python 或节点中。)
【问题讨论】:
-
哈希是否需要以某种方式确定?
-
只需要保证唯一。
-
如果您事先知道对象,那么只需跟踪您目前生成的唯一 ID,如果发生冲突,再生成另一个?
-
一旦生成,我将不会对它们进行任何跟踪。寻找统计上的可能性。试图保持尽可能短,但想知道权衡会是什么,如 4 个字符散列、1 个 X 等。碰撞的后果并不重要,所以如果这意味着可能发生碰撞,我可能会缩短有,但相对不太可能。
-
对。好吧,如果它们是随机生成的,则永远无法保证不会发生冲突,标识符越长且其键空间越大,概率就会降低到“极不可能”。
标签: node.js hash uniqueidentifier