【问题标题】:keras - tensorflow - LSTM - csv - how to use fit_generatorkeras - tensorflow - LSTM - csv - 如何使用 fit_generator
【发布时间】:2018-09-07 06:44:12
【问题描述】:

我很想实现一个简单的 RNN LSTM 模型但卡住了。问题本身很简单。我将为模型提供 5 个连续数字(但一次 1 个数字),然后我希望模型预测第 6 个。

示例: 输入数据:1、2、3、4、5(每个时间步长1位) 这个序列的输出应该是6

我有一个 csv 文件,其中:

  • 第一行是标题
  • 共有 6 列
  • 第一列仅是 ID。未用于训练。
  • 接下来的 5 列是输入数据 (x)
  • 最后一列是标签 (y)

我想用 Keras 开发一个模型,让它成功猜出第 6 个数字。

这是我的工作:

1) 首先实现一些我们需要的常量。

NR_FEATURES = 5
ITERATOR_BATCH_SIZE = 1
NR_EPOCHS = 15

2) 定义训练时将使用的生成器。

def train_data_generator():

    dataset = tf.contrib.data.make_csv_dataset(train_path1, 
                                               batch_size=ITERATOR_BATCH_SIZE, 
                                               num_epochs=NR_EPOCHS, 
                                               shuffle=True)

    iter = dataset.make_one_shot_iterator()
    next = iter.get_next()
    ID = next['ID']
    features = [next['nr1'], next['nr2'], next['nr3'], next['nr4'], next['nr5']]
    features = tf.reshape(features, [NR_FEATURES, 1])
    label = next['next_nr']
    yield (features, label)

3) 创建模型并开始训练。

input_data = Input(shape=(5, 1), name='input_data')
layer1_out = LSTM(1, return_sequences=False)(input_data)  # only return the last output
lstm_model = Model(inputs=input_data, outputs=layer1_out)

lstm_model.compile(loss='mean_absolute_error', optimizer='adam', metrics=['accuracy'])

lstm_model.fit_generator(train_data_generator(), 
                         steps_per_epoch=(150/ITERATOR_BATCH_SIZE),
                         epochs=NR_EPOCHS, 
                         verbose=1)

但它马上就崩溃了……

我得到的错误信息:

Epoch 1/15

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-5-af9dcbcbe289> in <module>()
      8                          steps_per_epoch=(150/ITERATOR_BATCH_SIZE),
      9                          epochs=NR_EPOCHS,
---> 10                          verbose=1)

~/anaconda3/envs/tensorflow/lib/python3.6/site-packages/keras/legacy/interfaces.py in wrapper(*args, **kwargs)
     89                 warnings.warn('Update your `' + object_name +
     90                               '` call to the Keras 2 API: ' + signature, stacklevel=2)
---> 91             return func(*args, **kwargs)
     92         wrapper._original_function = func
     93         return wrapper

~/anaconda3/envs/tensorflow/lib/python3.6/site-packages/keras/engine/training.py in fit_generator(self, generator, steps_per_epoch, epochs, verbose, callbacks, validation_data, validation_steps, class_weight, max_queue_size, workers, use_multiprocessing, shuffle, initial_epoch)
   2212                     # build batch logs
   2213                     batch_logs = {}
-> 2214                     if x is None or len(x) == 0:
   2215                         # Handle data tensors support when no input given
   2216                         # step-size = 1 for data tensors

TypeError: object of type 'Tensor' has no len()

我只是不明白。有人知道吗?

【问题讨论】:

  • 问题是数据格式而不是fit_generator 使用错误。您使用的张量没有 len() 。您导入的最佳数据类型应该是numpy
  • 感谢您的评论。确实 train_data_generator() 正在返回张量。但是我如何以某种方式转换它,以便它返回 numpy 数组呢?

标签: python tensorflow keras generator lstm


【解决方案1】:

您可以直接通过eval()tensor 转换为numpy

features = tf.reshape(features, [NR_FEATURES, 1])
# convert tensor to numpy
with tf.Session() as sess:
    features = features.eval()
# Your data shape needs to be adjusted relative to your model input.
features = features.reshape(-1,NR_FEATURES,1) 
label = next['next_nr']
label = np.array([label])
yield (features, label)

【讨论】:

    猜你喜欢
    • 2018-07-01
    • 1970-01-01
    • 2020-01-02
    • 2018-05-08
    • 1970-01-01
    • 1970-01-01
    • 2019-03-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多