【发布时间】:2013-01-10 10:55:07
【问题描述】:
我有一个包含 25000 行的 15GB 文本文件。 我在 Python 中创建了一个多级字典,其形式为: dict1 = {'':int}, dict2 = {'':dict1}。
我必须在我的程序中多次使用整个 dict2(大约 1000 次……在一个 for 循环中)。 谁能告诉一个好的方法来做到这一点。
文件中存储了相同类型的信息 (25000 张图像的不同 RGB 值的计数。每行 1 张图像) 例如:文件的 1 行如下: 图片1:255,255,255-70; 234,221,231-40; 112,13,19-28; 图片2:5,25,25-30; 34,15,61-20; 102,103,109-228; 等等。
【问题讨论】:
-
在实践中它肯定会消耗至少 15GB 的 RAM(并且可能是 2 或 4 倍)。你有至少 16GB 的空间吗?
-
这将有助于更多地了解如何使用这些数据。您真的需要在应用程序的每个点对整个数据结构进行任意随机访问吗?也许您一次只需要一张图像的数据,或者一次只需要一种颜色的数据?
-
以下任一答案有帮助吗?
标签: python file dictionary loading