【发布时间】:2017-02-09 13:56:34
【问题描述】:
我想计算 hive 中字符串的哈希值,而无需仅使用现有函数编写任何 UDF。这样我就可以使用类似的方法在其他语言中获得一致的哈希值。例如:是否有任何函数可以让我做一些事情,比如添加字符或采用 Xor。
【问题讨论】:
-
你的标题说“不使用现有的哈希函数”,但你的问题说“只使用现有的函数”,这恰恰相反。你到底想要什么??
-
您必须更具体地了解您使用的 Hive 版本以及您所指的其他语言
-
“这样我就可以使用类似的方法在其他语言中获得一致的哈希”所以如果我使用现有的哈希函数,如果我用其他语言计算它就不会相似。所以我想使用“其他”现有函数计算最简单的哈希值,我也可以用其他语言复制这些函数。例如:我想对字符串进行分桶,这样我就可以做 ASCII("abc")%NoofBuckets 它会给我第一个字符的 ascii,但是跨桶的分布不会那么好。所以我需要一些更合理的东西。
标签: hive