【问题标题】:ValueError: Error when checking target: expected dense_2 to have shape (None, 2) but got array with shape (1, 1)ValueError:检查目标时出错:预期dense_2的形状为(None,2),但数组的形状为(1, 1)
【发布时间】:2017-05-26 19:10:08
【问题描述】:

您好,我是 Keras 的新手,使用后端 tensorflow。我已经建立了两个可能类别的训练和验证图像集;我的网络必须以是或否两个类结束。我使用 ImageDatagenerator 从文件夹中读取图像并准备训练和验证集。最后,我得到了标题中描述的问题。我的猜测是 ImageDatagenerator 没有按照我的意愿准备数据;任何人都可以向我解释如何解决它,这是代码(谢谢):

# Data Preparation
# dimensions of our images.
img_width, img_height = 256, 256

#top_model_weights_path = 'bottleneck_fc_model.h5'
train_data_dir = 'data/train'
validation_data_dir = 'data/validation'
nb_train_samples = 2
nb_validation_samples = 2
epochs = 50
batch_size = 1
num_classes = 2

# prepare data augmentation configuration
train_datagen = ImageDataGenerator(
                                   rescale=1. / 255,
                                   shear_range=0.2,
                                   zoom_range=0.2,
                                   data_format=K.image_data_format(),
                                   horizontal_flip=True)

test_datagen = ImageDataGenerator(
                                  rescale=1. / 255,
                                  data_format=K.image_data_format())

train_generator = train_datagen.flow_from_directory(
                                                    train_data_dir,
                                                    target_size=(img_height, img_width),
                                                    batch_size=batch_size,
                                                    class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
                                                        validation_data_dir,
                                                        target_size=(img_height, img_width),
                                                        batch_size=batch_size,
                                                        class_mode='binary')

# create the CNN model
model = Sequential()
model.add(Conv2D(24, kernel_size=(20, 20), strides=(2,2), padding='valid', activation='relu', input_shape=(256,256,3)))

model.add(MaxPooling2D(pool_size=(7, 7), strides=(2,2), padding='valid'))

# Avoiding overfitting
model.add(Dropout(0.5))
model.add(Flatten())
model.add(Dense(64, activation='relu'))

# Avoiding overfitting
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

print(model.summary())

# Compile model
sgd = optimizers.SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimizer='sgd', metrics=['accuracy'])

# Fit the model
model.fit_generator(
                    train_generator,
                    steps_per_epoch=nb_train_samples // batch_size,
                    epochs=epochs,
                    validation_data=validation_generator,
                    validation_steps=nb_validation_samples // batch_size,
                    verbose=0)

# Save the weights
model.save_weights('first_try.h5')

【问题讨论】:

    标签: tensorflow keras


    【解决方案1】:

    专门针对“二类”,有两种做法:

    • 一个结果,0 或 1,是或否。
    • 两个结果,一个是 A 类的概率,另一个是 B 类的概率。

    每个都需要不同的模型输出:

    • 一维输出,带Dense(1,....)
    • 二维输出,带Dense(2,....)

    你似乎是第一种情况,所以,改变你的最后一层。

    这个错误是什么意思?

    您的模型输出具有形状 (BatchSize, 2) 的东西,但您的类标签具有形状 (BatchSize,1)。

    【讨论】:

    • 非常感谢,我认为即使是第一种方式 0 或 1 也属于模型输出 2D。在我想要两个结果的情况下,一个是 A 类的概率,另一个是 B 类的概率;我必须如何修改我的输入数据以属于这种情况?
    【解决方案2】:

    如果您需要预测 0 或 1 的单个输出,则只需将最后一层更改为

    model.add(Dense(1, activation='softmax'))

    但是,如果您的每个类都需要两个输出,则为您的训练和验证生成器使用分类类模式,即,

    train_generator = train_datagen.flow_from_directory(
                                                        train_data_dir,
                                                        target_size=(img_height, img_width),
                                                        batch_size=batch_size,
                                                        class_mode='categorical')
    
    
    validation_generator = test_datagen.flow_from_directory(
                                                            validation_data_dir,
                                                            target_size=(img_height, img_width),
                                                            batch_size=batch_size,
                                                            class_mode='categorical')
    <...>
    model.add(Dense(2, activation='softmax'))
    

    总结一下:

    • “binary”类模式表示一维二进制标签
    • “categorical”表示二维 one-hot 编码标签

    【讨论】:

      猜你喜欢
      • 2020-03-19
      • 2021-03-15
      • 2020-08-09
      • 1970-01-01
      • 1970-01-01
      • 2020-09-03
      • 1970-01-01
      • 2021-06-30
      • 1970-01-01
      相关资源
      最近更新 更多