【发布时间】:2015-04-08 09:58:44
【问题描述】:
谁能解释一下 VW 中的散列技巧是如何进行的?具体来说,下面的描述,从要点:
默认是散列/投影特征名称到机器 使用 murmurhash v3 变体的架构无符号字 (仅限 32 位)算法,然后与 (2^k)-1 进行与运算(即它是 向下投影到前 k 个低阶位,其余为 0)。
提到哈希的结果与 (2^k)-1 进行“与”运算。这是什么意思?我知道如果哈希是对某个数字 D (hash('my string')%D) 进行修改,它会产生一个只能采用 D 值的新数字。这和AND'ed一样吗?如果是这样,它究竟是如何工作的?
【问题讨论】:
标签: vowpalwabbit