Keras model.fit UnboundLocalError答案

【问题标题】：Keras model.fit UnboundLocalErrorKeras model.fit UnboundLocalError
【发布时间】：2017-10-29 11:15:02
【问题描述】：

我还是 keras 和 python 的新手，我遇到了一个我似乎无法理解的错误。错误是：

Traceback (most recent call last):
  File "/Users/N/PycharmProjects/hw2/hw2_1.py", line 35, in <module>
model.fit(trainingInp, trainingOut, epochs=10, batch_size=1)
  File "/Library/Python/2.7/site-packages/keras/models.py", line 893, in fit
initial_epoch=initial_epoch)
  File "/Library/Python/2.7/site-packages/keras/engine/training.py", line 1555, in fit
batch_size=batch_size)
  File "/Library/Python/2.7/site-packages/keras/engine/training.py", line 1409, in _standardize_user_data
exception_prefix='input')
  File "/Library/Python/2.7/site-packages/keras/engine/training.py", line 126, in _standardize_input_data
array = arrays[i]
UnboundLocalError: local variable 'arrays' referenced before assignment

它发生在 model.fit() 中。我的模型是这样的：

model = Sequential()
model.add(Dense(3, activation='sigmoid', input_dim=8))
model.add(Dropout(0.5))
model.add(Dense(10, activation='sigmoid'))

model.compile(loss='mean_squared_error', optimizer='sgd', metrics=['accuracy'])
print trainingInp
print trainingOut
model.fit(trainingInp, trainingOut, epochs=10, batch_size=1)

我打印我的数据以确保我没有传入空数据，并且它在进入 model.fit() 之前正确打印。

我不太确定如何解决它，因为我真的不知道问题出在哪里。看起来问题是batch_size，但我认为允许批量大小为1。

这是我获取数据的方式。我保证数据没有任何空值。

#read and categorize data
data = pandas.read_csv('cars.data.txt', delim_whitespace=True, header=None)

#turn class into an integer
enc = pandas.factorize(data['class'])
data["enc"] = enc[0]


#split the data set and make class into a matrix of outputs
trainingSet, testingSet = train_test_split(data, test_size=0.3)

trainingInp = trainingSet.iloc[:,1:9]
trainingOut = keras.utils.to_categorical(trainingSet['enc'], num_classes=10)

testingInp = testingSet.iloc[:,1:9]
testingOut = keras.utils.to_categorical(testingSet['enc'], num_classes=10)

【问题讨论】：

显示您声明 trainingInp 和 trainingOut 变量的代码。如果可能，也向我们展示数据。
好的，我已经添加了我的变量声明。感谢您的帮助。
只是一种预感，您可以尝试将批量大小增加到 2 的幂或什么的吗？还是批量大小为 32？
查看我的变量声明实际上就是答案。我的印象是 train_test_split 返回了数组，但它仍然返回一个熊猫数据框。当通过 trainingInp.values 时，问题就消失了。感谢您的帮助。我想我需要更加注意我的声明。
UnboundLocalError: local variable … referenced before assignment的可能重复

标签： python keras

【解决方案1】：

看起来像 Keras 中的一个错误。

在engine/training.py，

elif data.__class__.__name__ == 'DataFrame':
    # test if data is a DataFrame, without pandas installed
    data = data.values

应该是

elif data.__class__.__name__ == 'DataFrame':
    # test if data is a DataFrame, without pandas installed
    arrays = data.values

Created a pull request.

我是这样得到的：

UnboundLocalError 表示变量未定义——这实际上总是一个编程错误。故障线所属的块在使用变量之前不检查任何条件。因此，代码假定它必须始终由这一点定义。

从错误行向上搜索“arrays”表明它是在一个大的if 块的分支中定义的。因此，每个分支最终都应该在其工作过程中分配这个变量。事实上，他们都这样做了，除了这个。因此，执行这个分支是变量最终未定义的唯一方式。

现在，剩下的就是找出该分支中的预期代码应该是什么。看到了

所有其他分支都以arrays = <something>结尾，这一行看起来就像它，并且
在这里重新分配data 是没有意义的操作：
- 它在不同的分支中有不同的类型（例如在一个arrays = data 和另一个arrays = [data]）
- 不会在其中任何一个中重新分配，因此 if 块不应该将其转换为某种常见的表示形式 - 因此，它很可能不会进一步使用

代码的作者很可能打错字了，这就是他们的本意。 Looking up Pandas.DataFrame.values 确认它是一个数组数组，因此将它直接分配给一个叫做“数组”的东西看起来是合法的。

【讨论】：

【解决方案2】：

当您将 Pandas 系列或数据框传递给 keras 估算器时，有时会出现此错误。只需这样做

df_train_x = df_train_x.values
df_test_x = df_test_x.values

然后

estimator.fit(df_train_x , df_train_y)

【讨论】：