ImageDataGenerator 是一个 python 生成器,它每次都会生成一批形状与您的模型输入相同的数据(如(batch_size,width,height,channels))。生成器的好处是当您的数据集太大时,您无法将所有数据都放在有限的内存中,但是,使用生成器您可以每次生成一批数据。并且 ImageDataGenerator 与 model.fit_generator(), model.predict_generator() 一起使用。
如果要获取数值数据,可以使用生成器的next()函数:
import numpy as np
data_gen = ImageDataGenerator(rescale = 1. / 255)
data_generator = datagen.flow_from_directory(
data_dir,
target_size=(img_height, img_width),
batch_size=batch_size,
class_mode='categorical')
data_list = []
batch_index = 0
while batch_index <= data_generator.batch_index:
data = data_generator.next()
data_list.append(data[0])
batch_index = batch_index + 1
# now, data_array is the numeric data of whole images
data_array = np.asarray(data_list)
或者,您可以使用PIL 和numpy 自行处理图像:
from PIL import Image
import numpy as np
def image_to_array(file_path):
img = Image.open(file_path)
img = img.resize((img_width,img_height))
data = np.asarray(img,dtype='float32')
return data
# now data is a tensor with shape(width,height,channels) of a single image.
然后,您可以使用此函数循环所有图像以获取数字数据。
注意,我建议您使用生成器而不是直接获取所有数据,否则您可能会耗尽内存。