【发布时间】:2016-06-16 01:00:37
【问题描述】:
我有一个包含超过 400k 行和大约 20 列的 CSV 文件,因此当我在寻找某个值时搜索 CSV 需要花费太多时间。我想知道如何映射文件,以便可以有效快速地搜索它以获得某个值。
提前感谢您!我很乐意回答任何问题!
【问题讨论】:
-
您是否尝试过内存映射或使用 SQL 数据库?
-
不!我对数据库选项一点也不熟悉。
-
你打算怎么搜索?您知道要在哪一列中搜索还是要在所有列中搜索文本(例如在文本文件中)?
-
您可以尝试使用sqlite 数据库,方法是将行/列存储在表中,然后使用
sqlite3Python 模块搜索您的数据,或者只使用Pandas模块(哪个可能最简单?) -
@MaxU 我知道要搜索哪一列但不知道哪一行。
标签: python csv search dictionary search-engine