【发布时间】:2011-07-24 01:51:10
【问题描述】:
对于生成的字母表不是二进制的情况,是否有一个简单的 Huffman 编码树概括?例如,如果我想通过以三进制写出一些文本来压缩它,我仍然可以为我写出的每个字符建立一个无前缀编码系统。 Huffman 构造的直接概括(使用 k-ary 树而不是二叉树)是否仍能正确有效地工作?还是这种结构会导致编码方案效率极低?
【问题讨论】:
-
显而易见的方法是在一些具有 3-ary 和 4-ary 树的数据上进行尝试,并将压缩与标准霍夫曼编码和数据的熵进行比较。我实际上有点希望它比标准霍夫曼更接近熵,但这只是一个猜测。
-
可能在这种情况下,树的末端节点将有 3 个叶子而不是 2 个叶子,其他一切都将保持不变。
-
致那些投反对票的人 - 你能解释一下我能做些什么来改善这个问题吗?
-
不是我,但我怀疑当有人问一个简单的谷歌查询会返回大量答案的问题时,人们会感到沮丧,而且之前在 Stack Overflow 上会返回很多次。
-
很有趣,在此对话开始三年后,我在 Google 搜索中获得的“非二进制霍夫曼”的第一个结果是 Stackoverflow 中的 this answer。投票者经常以一种癫痫的方式做出反应,这令人沮丧。
标签: algorithm compression huffman-code