【发布时间】:2019-08-06 23:15:57
【问题描述】:
我有几 TB 的数据要存储并能够快速查找。当然,我不能简单地使用 python 字典,因为它的大小受 RAM 大小的限制。
我尝试使用 dbm python:https://docs.python.org/3/library/dbm.html,但它对我的应用程序来说太慢了。
【问题讨论】:
-
您需要对您的数据进行哪些操作?
-
我不认为字典可以很好地存储 TB 的数据,因为它都在内存中。大数据的文件格式有很多种,一个例子是Pandas library支持的HDF5。
-
当然可以,但是您需要 TB 的 RAM,然后可能需要像 Redis 这样的东西。老实说,玩起来会很有趣。
-
@EricWang 存储、检索、变异。原子操作也很好。另外,获取字典的所有键,以便我可以对其进行迭代。这些将是大的。
-
@PyNoob 是的。确实如此。但是,这些对于我的应用程序来说太慢了。
标签: python dictionary bigdata