具有多种特征的 RNN 的数据形状/格式答案

【问题标题】：Data Shape / Format for RNNs with Multiple Features具有多种特征的 RNN 的数据形状/格式
【发布时间】：2017-09-23 02:13:44
【问题描述】：

我正在尝试使用 python/keras 构建 RNN。我了解它是如何使用一个功能完成的（以 t+1 为输出），但是如何处理多个功能呢？

如果我有一个回归问题和一个具有几个不同特征的数据集，一个预期输出，并且我希望将时间步长/窗口设置为 30（如果每个步骤代表一天，那么一个月） - 会怎样数据的形状是什么？在这个例子中，我希望能够预测未来 n 个时间段的输出。

有关此数据的示例，请参见下文：

我很难直观地理解 RNN 数据所需的最佳形状/格式。

此外，RNN 处理具有 500 个特征和几千条记录的数据集的能力如何？

希望有人可以帮助回答或指出正确的方向来获得一个 - 到目前为止，我已经在 Reddit 和 Cross Validated 上发帖，但没有运气:(

如果首选代码数据示例：

# random df
df = pd.DataFrame({'date': np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]),
                   'feature_1': np.random.randint(10, size=10),
                   'feature_2': np.random.randint(10, size=10),
                   'feature_3': np.random.randint(10, size=10),
                   'feature_4': np.random.randint(10, size=10),
                   'output': np.random.randint(10, size=10)}
                 )

# set date as index
df.index = df.date
df = df.drop('date', 1)

【问题讨论】：

你想用哪种语言编写你的 RNN ？在 keras 中，你的数据的形状应该是sample_size,timestep,nb_features。您可以查看网站以了解在 keras 中使用 LSTM 进行回归：machinelearningmastery.com/…
@Benoubenou45 感谢回复！这帮助我理解了它（这是我正在研究的教程），但这只是一个功能..即使他使用多个功能，它仍然只是一项功能 - 我是否必须像他那样错开所有功能？我想这就是我想要理解的
好的，我明天会尝试在更详细的答案中解释一下

标签： python machine-learning neural-network keras recurrent-neural-network

【解决方案1】：

假设您有 2 个时间序列 X 和 Y，并且您想使用这两个时间序列来预测 X。如果我们选择时间步长 3 并假设我们有 (X1,...,Xt) 和 (Y1,...,Yt)，那么第一个样本将是： [[X1,X2,X3],[Y1,Y2,Y3]] 和相关的输出：X4。第二个是[[X2,X3,X4],[Y2,Y3,Y4]]，输出为X5。最后一个：[[Xt-3,Xt-2,Xt-1],[Yt-3,Yt-2,Yt-1]] Xt 作为输出。

例如，在第一个示例中：首先您将向网络 (X1,Y1) 馈送，然后是 (X2,Y2) 和 (X3,Y3)。

这是创建输入和输出然后使用 LSTM 网络进行预测的代码：

import pandas as pd                                                                                                                                                                                                                                                                
import numpy as np                                                                                                                                                                                                                                                                 
import keras.optimizers                                                                                                                                                                                                                                                            
from keras.models import Sequential                                                                                                                                                                                                                                                
from keras.layers import Dense,Activation                                                                                                                                                                                                                                          
from keras.layers import LSTM                                                                                                                                                                                                                                                      

#random df                                                                                                                                                                                                                                                                        
df = pd.DataFrame({'date': np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]),                                                                                                                                                                                                               
               'feature_1': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'feature_2': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'feature_3': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'feature_4': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'output': np.random.randint(10, size=10)}                                                                                                                                                                                                                       
             )                                                                                                                                                                                                                                                                 

# set date as index                                                                                                                                                                                                                                                                
df.index = df.date                                                                                                                                                                                                                                                                 
df = df.drop('date', 1)                                                                                                                                                                                                                                                            

nb_epoch = 10                                                                                                                                                                                                                                                                      
batch_size = 10                                                                                                                                                                                                                                                                    
learning_rate = 0.01                                                                                                                                                                                                                                                               
nb_units = 50                                                                                                                                                                                                                                                                       
timeStep = 3                                                                                                                                                                                                                                                                       

X = df[['feature_'+str(i) for i in range(1,5)]].values # Select good columns                                                                                                                                                                                                        
sizeX = X.shape[0]-X.shape[0]%timeStep  # Choose a number of observations that is a multiple of the timstep                                                                                                                                                                            
X = X[:sizeX]                                                                                                                                                                                                                                                                      
X = X.reshape(X.shape[0]/timeStep,timeStep,X.shape[1]) # Create X with shape (nb_sample,timestep,nb_features)                                                                                                                                                                       

Y = df[['output']].values                                                                                                                                                                                                                                                          
Y = Y[range(3,len(Y),3)] #Select the good output                                                                                                                                                                                                                                   


model = Sequential()                                                                                                                                                                                                                                                               
model.add(LSTM(input_dim = X.shape[2],output_dim = nb_units,return_sequences = False)) # One LSTM layer with 50 units                                                                                                                                                               
model.add(Activation("sigmoid"))                                                                                                                                                                                                                                                   
model.add(Dense(1)) #A dense layer which is the final layer                                                                                                                                                                                                                        
model.add(Activation('linear'))                

KerasOptimizer = keras.optimizers.RMSprop(lr=learning_rate, rho=0.9, epsilon=1e-08, decay=0.0)                                                                                                                                                                                     
model.compile(loss="mse", optimizer=KerasOptimizer)                                                                                                                                                                                                                                
model.fit(X,Y,nb_epoch = nb_epoch,batch_size = batch_size)                                                                                                                                                                                                                         
prediction = model.predict(X)

【讨论】：

谢谢 Ben 我真的很感激！那肯定有帮助。但是有一个问题，为什么在重塑 X 时将样本数除以时间步长 (X.shape[0]/timeStep)？如果我理解正确，由于时间步长被添加为第三维，它的样本数量不是相同吗？
在我的代码中，如果我认为我只有一个功能，第一个样本是X1,X2,X3，第二个样本是X4,X5,X6 等等。在X = X[:sizeX]、X.shape = (9,4) 之后。我希望 X 的形状像 (nb_sample,3,4)，所以我需要 nb_sample = 3 = X.shape[0]/timeStep。您可以轻松地在第一个示例 X1,X2,X3、第二个示例 X2,X3,X4 等中编写代码
嗯，上下文是有道理的，但在你解释的开头你写道：“第一个样本是：[[X1,X2,X3],[Y1,Y2,Y3]] 和相关的输出：X4。第二个样本是[[X2,X3,X4],[Y2,Y3,Y4]] 以 X5 作为输出”，我理解为时间步长是第三个维度