【发布时间】:2018-03-19 18:41:38
【问题描述】:
我需要帮助,试图弄清楚如何使用 Keras 实现批量加载。
到目前为止,我正在尝试使用 Keras CNN 制作歌曲分类器。我已经为 10 种流派分类构建了下面的模型。
model = Sequential()
model.add(Conv1D(16, 5, padding="same", input_shape=(1, 661500)))
model.add(Activation("relu"))
model.add(MaxPool1D(pool_size=2, padding="same"))
model.add(Conv1D(16, 5, padding="same"))
model.add(Activation("relu"))
model.add(MaxPool1D(pool_size=2, padding="same"))
model.add(Conv1D(16, 5, padding="same"))
model.add(Activation("relu"))
model.add(MaxPool1D(pool_size=2, padding="same"))
model.add(Flatten())
model.add(Dense(128))
model.add(Activation("relu"))
model.add(Dense(10))
model.add(Activation("softmax"))
model.compile(optimizer="adam",
loss="categorical_crossentropy",
metrics=["accuracy"])
当我自己加载实例和标签但我的计算机无法同时处理 1000 首歌曲时,它正在工作。我尝试使用 ImageDataGenerator 通过 flow_from_directory 批量加载它们。代码如下:
generator = ImageDataGenerator()
train_generator = generator.flow_from_directory("train",
target_size=(1, 661500),
batch_size=64,
class_mode="categorical")
test_generator = generator.flow_from_directory("test",
target_size=(1, 661500),
batch_size=64,
class_mode="categorical")
model.fit_generator(train_generator,
steps_per_epoch=5584,
epochs=10,
validation_data=test_generator,
validation_steps=1861)
我遇到了音频文件不是图像的问题,因此我将 .wav 添加到了
中的白名单文件格式\keras\Lib\site-packages\keras\preprocessing\image.py
这让 Keras 可以找到音频图像,但它无法真正打开它们。我改变了使用 Pillow to Librosa 打开它们的位置,但它给出了更多错误。我不认为我可以更改所有这些,所以我想知道是否有办法实现批量加载?
编辑:我来到 this question,它指向 Keras sequences 我实现了一个,如下所示。
class MySequence(Sequence):
def __init__(self, x_files, y_files, batch_size):
self.x, self.y = x_files, y_files
self.batch_size = batch_size
def __len__(self):
from numpy import ceil
return int(ceil(len(self.x) / float(self.batch_size)))
def __getitem__(self, idx):
from librosa import load
from numpy import array, expand_dims
batch_x = self.x[idx * self.batch_size:(idx + 1) * self.batch_size]
batch_y = self.y[idx * self.batch_size:(idx + 1) * self.batch_size]
return expand_dims(array([load(file_name)[0] for file_name in batch_x]), axis=1), array(batch_y)
这次火车时间长得离谱。以前,10 个 epoch 需要 3 个小时才能完成,但现在一个 epoch 需要 14 个小时。有什么办法可以减少火车时间吗?
编辑 2:在 fit_generator 函数中更改了 steps_per_epoch 参数,它已降至可接受的水平。
【问题讨论】: