【发布时间】:2011-11-06 04:46:24
【问题描述】:
我只是好奇是否有人能告诉我使用 SQLite 存储字典(如暴力破解)以在 Python 脚本中使用是否是一种有效的方法。虽然我对 Python 比较陌生,但我确实对其他编程语言有相当多的经验,目前正在开发一种用于 Backtrack 的渗透测试工具。到目前为止,Python 的速度和简单性给我留下了深刻的印象,而且我的 SQL 查询似乎工作得非常理想,可以为我的蛮力工具返回所需的前缀。但是,我想我想知道在 Python 中存储大数据文件的标准是什么?我是否仅仅因为我对 SQL 的熟悉而忽略了一种更好(更快)的存储前缀的方法?请记住,我没有使用 Python 来查询 ID 0 到 n 并使用它们,而是使用 Python 来缩小可能性并查询符合条件的字典条目。任何帮助或意见将不胜感激!
【问题讨论】:
-
您希望它有多快?数据集 MB、GB、TB 有多大? “前缀”是什么意思,就像“前缀树”(trie)一样?您对数据执行的操作与关系模型的对应程度如何?
标签: python sqlite data-structures