使用数组输入神经网络答案

【问题标题】：Input to the Neural Network using an array使用数组输入神经网络
【发布时间】：2022-01-18 13:59:06
【问题描述】：

我正在编写一个神经网络以将 Mel 频率系数作为输入，然后运行模型。我的数据集包含 100 个样本 - 每个样本是一个由 12 个值组成的数组，对应于系数。将这些数据拆分为训练集和测试集后，我创建了对应于数组的 X 输入和对应于标签的 y 输入。

Data array containing the coefficients

这是我的数据的一个小样本，其中包含 X_train 数组中的 5 个元素：

['[107.59366 -14.153783 24.799461 -8.244417 20.95272\n -4.375943 12.77285 -0.92922235 3.9418116 7.3581047\n -0.30066165 5.441765]] '[ 96.49664 2.0689797 21.557552 -32.827045 7.348135 -23.513977\n 7.9406714 -16.218931 10.594619 -21.4381 0.5903044 -10.569035 ]' '[105.98041 -2.0483367 12.276348 -27.334534 6.8239 -23.019623\n 7.5176797 -21.884727 11.349695 -22.734652 3.0335162 -11.142375]' （7.73094559E + 00 6.72225571C + 00 -2.74525508E-02 \ n 6.60858080 + 00 1.96265772S-01 1.9626486080-01 1.962657720-01 1.962657720-01 1.962657720-01 1.962657720-01-1.962657720-01-1.962657720-01 1.962657720-01-3.94725770 + 9.422394286S + 00 1.214320660 + 9.42320690 + 9.214320660 + 9.214320662 + 9.21432066 -01 2.44894314e+00]']

当我创建神经网络时，我想使用 12 个系数作为网络的输入。为此，我需要使用包含这些数组的 X_train 数据集的每一行作为输入。但是，当我尝试将数组索引视为输入时，它会在尝试拟合模型时出现形状错误。我的模型如下：

def build_model_graph():
model = Sequential()
model.add(Input(shape=(12,)))
model.add(Dense(12))
model.add(Activation('relu'))
model.add(Dense(10))
model.add(Activation('relu'))
model.add(Dense(num_labels))
model.add(Activation('softmax'))
# Compile the model
model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer='adam')
return model

在这里，我想使用 X_train 数组的每一行作为对应于 shape(12,) 的输入。当我使用这样的东西时：

num_epochs = 50
num_batch_size = 32
model.fit(x_train, y_train, batch_size=num_batch_size, epochs=num_epochs, 
validation_data=(x_test, y_test), verbose=1)

我得到一个对我来说有意义的形状错误。供参考，报错如下：

ValueError: Exception encountered when calling layer "sequential_20" (type Sequential).

Input 0 of layer "dense_54" is incompatible with the layer: expected min_ndim=2, found ndim=1. Full shape received: (None,)

但我不确定如何提取 X_train 的每个索引处存在的 12 个系数的数组，然后在模型输入中使用它。索引 x_train 和 y_train 也不起作用。如果有人能指出我的相关方向，那将非常有帮助。谢谢！

编辑：我的数据框代码如下：

clapdf = pd.read_csv("clapsdf.csv")
clapdf.drop('Unnamed: 0', inplace=True, axis=1)
clapdf.head()
nonclapdf = pd.read_csv("nonclapsdf.csv")
nonclapdf.drop('Unnamed: 0', inplace=True, axis=1)
sound_df = clapdf.append(nonclapdf)
sound_df.head()
d=sound_data.tolist()
df=pd.DataFrame(data=d)
data = df[0].to_numpy()
print("Before-->", data.shape)
dat = np.array([np.array(d) for d in data])
print('After-->', dat.shape)

在这里，形状保持不变，因为 80 个样本中的每一个的值不是以逗号分隔的格式，而是以系列的形式。

【问题讨论】：

发布一些数据的小样本，以使错误可复制
如果数据是字符串且元素由空格分隔，则可以按空格拆分，然后将每个元素转换为整数
你能确认你的元素类型是字符串吗？如果没有，您使用 type(sample) 得到哪种类型
我认为问题出在 y_train - 因为 x_train 包含数值，但 y_train 是描述样本标签的字符串。

标签： python arrays tensorflow deep-learning neural-network

【解决方案1】：

如果您的数据如下所示：

samples = 2
features = 12
x_train = tf.random.normal((samples, 1, features))

tf.Tensor(
[[[-2.5988803  -0.629626   -0.8306641  -0.78226614  0.88989156
   -0.3851106  -0.66053045  1.0571191  -0.59061646 -1.1602987
    0.69124466 -0.04354193]]

 [[-0.86917496  2.2923143  -0.05498986 -0.09578358  0.85037625
   -0.54679644 -1.2213608  -1.3766612   0.35416105 -0.57801914
   -0.3699728   0.7884727 ]]], shape=(2, 1, 12), dtype=float32)

您必须将其重塑为 (2, 12) 以使您的模型与输入形状 (batch_size, 12) 相匹配：

import tensorflow as tf

def build_model_graph():
  model = tf.keras.Sequential()
  model.add(tf.keras.layers.Input(shape=(12,)))
  model.add(tf.keras.layers.Dense(12))
  model.add(tf.keras.layers.Activation('relu'))
  model.add(tf.keras.layers.Dense(10))
  model.add(tf.keras.layers.Activation('relu'))
  model.add(tf.keras.layers.Dense(2))
  model.add(tf.keras.layers.Activation('softmax'))
  # Compile the model
  model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer='adam')
  return model

model = build_model_graph()

samples = 2
features = 12
x_train = tf.random.normal((samples, 1, features))
x_train = tf.reshape(x_train, (samples, features))
y = tf.random.uniform((samples, 1), maxval=2, dtype=tf.int32)
y_train = tf.keras.utils.to_categorical(y, 2)
model.fit(x_train, y_train, batch_size=1, epochs=2)

此外，如果您打算使用 categorical_crossentropy，通常需要将标签转换为 one-hot 编码向量。 y_train 看起来像这样：

[[0. 1.]
 [1. 0.]]

更新 1： 如果您的数据来自数据框，请尝试以下操作：

import numpy as np
import pandas as pd

d = {'features': [[0.18525402, 0.92130125, 0.2296906,  0.75818471, 0.69813222, 0.47147329,
                   0.03560711, 0.06583931, 0.90921289, 0.76002148, 0.50413995, 0.36099004], 
                  [0.18525402, 0.92130125, 0.2296906,  0.75818471, 0.69813222, 0.47147329,
                   0.03560711, 0.06583931, 0.90921289, 0.76002148, 0.50413995, 0.36099004]]}
df = pd.DataFrame(data=d)

data = df['features'].to_numpy()
print('Before -->', data.shape)
data = np.array([np.array(d) for d in data])
print('After -->', data.shape)

Before --> (2,)
After --> (2, 12)

【讨论】：

感谢您的回答！所以，我确实使用标签的编码。我对所有训练和测试数组的形状如下： X_train ->(80,) ； X_test ->(20,) ; Y_train->(80, 2) ; Y_test->(20, 2)。在 X 和 Y 列车的这 80 个和 20 个条目中的每一个中，存储的值是一个由 12 个数字组成的数组 - 这些数字是我想要作为模型的输入传递的。因此，虽然您的建议在通常情况下确实有效 - 重塑对我来说会带来一个问题，因为我只能重塑 X 和 Y 的尺寸，但我需要 X 和 Y 集的每个索引处存在 12 个值。
更新了答案。成功了吗？
嘿，我正在尝试。如何识别数据存在一些问题。我正在组合两个数据框来创建我的最终数据框 - 当我这样做时，最终数据框包含 80 个样本，其中一个样本中有 12 个值，但这些值不是逗号分隔格式。因此，当我将它们通过循环时，形状保持不变。我正在努力将数组保持为可以修改解决方案中给出的形状的格式
数组是空格分隔的吗？
是的，它现在是一个 numpy 数组，只用空格而不是逗号分隔 - 但操作前后的形状保持不变