【发布时间】:2010-08-13 21:19:20
【问题描述】:
在 C 中,我想处理一个包含 108 个 16 位字母数字字符串的文件,并确定每个字符串在文件中是否唯一。我该怎么做?
【问题讨论】:
-
到目前为止您尝试过什么?你在哪里遇到问题?我们不是代码猴子。
-
您需要确定每一个是否唯一,还是只提取唯一的?
-
你有多少内存?仅存储标识符就需要大约 800MB。如果你能负担得起使用大约两倍,任何合理的数据结构(哈希表、平衡树、trie)都可以。否则,你需要更聪明。
-
我会将字符串转储到具有适当索引的 sqlite 表中,并使用组查询来查询骗子。您需要多久执行一次此操作以及必须以多快的速度执行此操作?如果你只需要偶尔做一次,那就使用现有的工具。
-
@wong 我需要在那个文件中告诉我是否有任何相同的字符串意味着我要检查每个 id