【发布时间】:2009-12-24 08:32:10
【问题描述】:
我有一个要存储到磁盘的哈希表。该列表如下所示:
<16-byte key > <1-byte result>
a7b4903def8764941bac7485d97e4f76 04
b859de04f2f2ff76496879bda875aecf 03
etc...
有 1-5 百万个条目。目前我只是将它们存储在一个文件中,每个条目 17 字节乘以条目数。那个文件有几十兆。我的目标是以一种首先优化磁盘空间然后优化查找时间的方式存储它们。插入时间并不重要。
最好的方法是什么?我希望文件尽可能小。多个文件也可以。帕特里夏?基数特里?
无论我得到什么好的建议,我都会实施和测试。我会把结果贴在这里给大家看看。
【问题讨论】:
-
请说明 RAM 使用要求...
-
我建议密钥是随机的(例如 GUID)。对吗?
标签: optimization data-structures diskspace