【发布时间】:2018-03-06 14:53:47
【问题描述】:
我想在 numpy 数组中加载一个巨大的图像数据集,以使其作为我正在尝试训练的 cnn 模型的训练数据。当我尝试如下创建一个 numpy 数组时,它给了我内存错误。
np.ndarray(shape=(250000, 3, 512, 512))
我怎么能在 python 中加载如此庞大的数据集?
【问题讨论】:
-
尝试使用
dtype=np.uint8。这是 RGB 图像所能达到的最低值。 -
也不行
-
好吧,如果你没有 ~24GB RAM 用于 numpy,你将无法加载 1/4mio。图片。
-
如果您没有相应的 PC 规格,您就无法一次加载那么多。
-
构造一个生成器,它会输出您在单个批次中使用的图像数量。在循环生成器时调用 fit() 方法。它对我有用。