为什么 ImageDataGenerator() 表现不佳？答案

【问题标题】：Why is ImageDataGenerator() performing poorly?为什么 ImageDataGenerator() 表现不佳？
【发布时间】：2019-11-19 20:07:51
【问题描述】：

我正在尝试使用 ImageDataGenerator() 构建图像分类模型。似乎模型训练和表现不佳。训练损失保持在 15 左右，准确率只有 10%，验证大致相同。

为了看看会发生什么，我尝试在不使用 ImageDataGenerator() 的情况下进行训练，并以类似的方式设置数据。它在训练、验证和测试方面的表现要好得多。训练损失为 0.71，准确度为 75%，验证损失为 0.8，准确度为 72%。

我需要用数据生成器找出这个模型，因为我将转移到一个更大的数据集，它不适合内存。

所以，我想我的问题是我在 ImageDataGenerator() 上做错了什么，它的表现如此糟糕，我该如何改善结果？

在设置文件时（在所有 Train、Test、Validation 文件夹中），类都有自己的文件夹，而这些文件夹中是图像所在的位置。

代码如下：

import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import pickle
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation, Flatten, Conv2D, MaxPooling2D, Dropout

data_gen = ImageDataGenerator()
IMG_SIZE = 100
train_it = data_gen.flow_from_directory('D:/.../Train/', class_mode='sparse',
                                       target_size=(IMG_SIZE, IMG_SIZE),color_mode='grayscale', shuffle=True,batch_size=32)
val_it = data_gen.flow_from_directory('D:/.../Validation/', class_mode='sparse',
                                     target_size=(IMG_SIZE, IMG_SIZE),color_mode='grayscale', shuffle=True,batch_size=32)

IMAGE_SIZE = [100, 100]

model=Sequential()
model.add(Conv2D(32,(3,3), input_shape=[*IMAGE_SIZE, 1]))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.5))

model.add(Conv2D(32,(3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.5))

model.add(Conv2D(32,(3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.5))

model.add(Flatten())
model.add(Dense(len(train_it.class_indices), activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit_generator(train_it, epochs=20, validation_data=val_it )

这是我没有 ImageDataGenerator() 的代码：使用 OpenCV 设置数据

DATADIR='D:\...\Train'
CATEGORIES = pickle.load(open("CATEGORIES.p" , "rb"))
print(len(CATEGORIES))
IMG_SIZE = 100
training_data=[]

def create_training_data():
    for category in CATEGORIES:
        path = os.path.join(DATADIR,category)
        class_num = CATEGORIES.index(category)
        for img in os.listdir(path):
            try:
                img_array = cv2.imread(os.path.join(path,img),cv2.IMREAD_GRAYSCALE)
                new_array = cv2.resize(img_array, (IMG_SIZE, IMG_SIZE))
                training_data.append([new_array, class_num])
            except:
                print(category)
                print(img)

create_training_data()

random.shuffle(training_data)

X=[]
y=[]
for features, label in training_data:
    X.append(features)
    y.append(label)

X=np.array(X).reshape(-1,IMG_SIZE, IMG_SIZE, 1)
X=X/255.0

模型设置：

model=Sequential()
model.add(Conv2D(32,(3,3), input_shape=[*IMAGE_SIZE, 1]))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.5))

model.add(Conv2D(32,(3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.5))

model.add(Conv2D(32,(3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.5))

model.add(Flatten())
model.add(Dense(len(CATEGORIES), activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X,y, epochs=20, batch_size=32, validation_split=0.1)

【问题讨论】：

您对训练和验证数据集使用相同的“data_gen”对象。尝试实例化第二个 ImageDataGenerator 进行验证。
谢谢，我会试一试并给你更新！
@jkjung13 不幸的是，它没有帮助损失或准确性。
@jkjung13 如果您有更多见解，请告诉我。谢谢'
使用您更新的代码，我无法确定问题出在哪里。我的建议是从您的数据迭代器（'train_it'）中获取几批数据，绘制它们，并确保它们符合预期。你可以参考下面我的代码和博客文章来了解如何做到这一点。代码示例：github.com/jkjung-avt/keras-cats-dogs-tutorial/blob/master/…。博文：jkjung-avt.github.io/keras-image-cropping.

标签： tensorflow machine-learning keras

【解决方案1】：

@acho，

提及您在 cmets 中引用的此问题的解决方案，以造福社区。p>

问题的原因是输入数据没有通过将每个像素值除以 255 进行归一化。它对训练有影响，原因如下：

它将像素值从整数转换为浮点数，范围为 0.0-1.0，其中 0.0 表示 0 (0x00)，1.0 表示 255 (0xFF)。与整数值相比，Conv Nets 在浮点值上工作得更好，并且通过在 0-1 范围内对其进行归一化，可以减少计算量。
标准化将帮助您消除由图像中的灯光和阴影引起的失真。

【讨论】：