【发布时间】:2013-02-13 11:21:13
【问题描述】:
我正在使用一个用 C 语言编程的微控制器进行电子项目。
我需要将一些 ID 及其相关信息存储在闪存 (SD) 中。这些 ID 长 16 个字节,因此有 2^128 个可能的值。尽管它们是 16 个字节,但只会使用 50000 个(唯一)值。在 SD 中存储所有可能的 (2^128) ID 在物理上是不可能的。
我只能存储 50000 个使用过的值,但是我必须遍历所有(最坏的情况)它们才能找到我需要的值。此外,它必须为它们中的每一个计算一个 16 字节的值比较,这使得它非常慢。
所以我想我需要某种(散列?)函数,将 2^128 值映射到 50000(将 16 个字节映射到 2 个字节)。很明显,一些原始值将映射到相同的值/索引。这个想法是,当我得到一个 ID 时,我应用一个哈希函数,它给我一个介于 0 和 ~50000 (0-65535) 之间的索引。使用该索引,我可以直接访问存储 ID 及其相关信息的 SD 扇区。正如我已经指出的那样,该索引将引用内存中的位置,由于某些不同的 ID 映射到相同的索引值,因此各种 ID 将共存。我必须找到正确的 ID,但它只需要几个比较而不是原来的 50000 个。
任何想法/意见将不胜感激。
提前致谢。
【问题讨论】:
-
你正在重新发明“哈希表”的概念——谷歌一下。
-
只需添加所有字节?
-
使用 16 位校验和或散列对密钥进行散列。我的第一枪是 CRC16。
-
“我必须遍历所有(最坏的情况)才能找到我需要的那个” - 不一定。例如,考虑一个二进制搜索,它需要多达 16 次比较。超过哈希表查找的预期比较次数,但仍然很低。如果您在填充 SD 存储时知道所有 ID,那么您只需在写入之前对它们进行排序。
-
听从史蒂夫的建议。并参加一两门算法课程。