【问题标题】:Data Shape / Format for RNNs with Multiple Features具有多种特征的 RNN 的数据形状/格式
【发布时间】:2017-09-23 02:13:44
【问题描述】:

我正在尝试使用 python/keras 构建 RNN。我了解它是如何使用一个功能完成的(以 t+1 为输出),但是如何处理多个功能呢?

如果我有一个回归问题和一个具有几个不同特征的数据集,一个预期输出,并且我希望将时间步长/窗口设置为 30(如果每个步骤代表一天,那么一个月) - 会怎样数据的形状是什么?在这个例子中,我希望能够预测未来 n 个时间段的输出。

有关此数据的示例,请参见下文:

我很难直观地理解 RNN 数据所需的最佳形状/格式。

此外,RNN 处理具有 500 个特征和几千条记录的数据集的能力如何?

希望有人可以帮助回答或指出正确的方向来获得一个 - 到目前为止,我已经在 Reddit 和 Cross Validated 上发帖,但没有运气:(

如果首选代码数据示例:

# random df
df = pd.DataFrame({'date': np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]),
                   'feature_1': np.random.randint(10, size=10),
                   'feature_2': np.random.randint(10, size=10),
                   'feature_3': np.random.randint(10, size=10),
                   'feature_4': np.random.randint(10, size=10),
                   'output': np.random.randint(10, size=10)}
                 )

# set date as index
df.index = df.date
df = df.drop('date', 1)

【问题讨论】:

  • 你想用哪种语言编写你的 RNN ?在 keras 中,你的数据的形状应该是sample_size,timestep,nb_features。您可以查看网站以了解在 keras 中使用 LSTM 进行回归:machinelearningmastery.com/…
  • @Benoubenou45 感谢回复!这帮助我理解了它(这是我正在研究的教程),但这只是一个功能..即使他使用多个功能,它仍然只是一项功能 - 我是否必须像他那样错开所有功能?我想这就是我想要理解的
  • 好的,我明天会尝试在更详细的答案中解释一下

标签: python machine-learning neural-network keras recurrent-neural-network


【解决方案1】:

假设您有 2 个时间序列 X 和 Y,并且您想使用这两个时间序列来预测 X。 如果我们选择时间步长 3 并假设我们有 (X1,...,Xt)(Y1,...,Yt),那么第一个样本将是: [[X1,X2,X3],[Y1,Y2,Y3]] 和相关的输出:X4。 第二个是[[X2,X3,X4],[Y2,Y3,Y4]],输出为X5。 最后一个:[[Xt-3,Xt-2,Xt-1],[Yt-3,Yt-2,Yt-1]] Xt 作为输出。

例如,在第一个示例中:首先您将向网络 (X1,Y1) 馈送,然后是 (X2,Y2)(X3,Y3)

这是创建输入和输出然后使用 LSTM 网络进行预测的代码:

import pandas as pd                                                                                                                                                                                                                                                                
import numpy as np                                                                                                                                                                                                                                                                 
import keras.optimizers                                                                                                                                                                                                                                                            
from keras.models import Sequential                                                                                                                                                                                                                                                
from keras.layers import Dense,Activation                                                                                                                                                                                                                                          
from keras.layers import LSTM                                                                                                                                                                                                                                                      

#random df                                                                                                                                                                                                                                                                        
df = pd.DataFrame({'date': np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]),                                                                                                                                                                                                               
               'feature_1': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'feature_2': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'feature_3': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'feature_4': np.random.randint(10, size=10),                                                                                                                                                                                                                    
               'output': np.random.randint(10, size=10)}                                                                                                                                                                                                                       
             )                                                                                                                                                                                                                                                                 

# set date as index                                                                                                                                                                                                                                                                
df.index = df.date                                                                                                                                                                                                                                                                 
df = df.drop('date', 1)                                                                                                                                                                                                                                                            

nb_epoch = 10                                                                                                                                                                                                                                                                      
batch_size = 10                                                                                                                                                                                                                                                                    
learning_rate = 0.01                                                                                                                                                                                                                                                               
nb_units = 50                                                                                                                                                                                                                                                                       
timeStep = 3                                                                                                                                                                                                                                                                       

X = df[['feature_'+str(i) for i in range(1,5)]].values # Select good columns                                                                                                                                                                                                        
sizeX = X.shape[0]-X.shape[0]%timeStep  # Choose a number of observations that is a multiple of the timstep                                                                                                                                                                            
X = X[:sizeX]                                                                                                                                                                                                                                                                      
X = X.reshape(X.shape[0]/timeStep,timeStep,X.shape[1]) # Create X with shape (nb_sample,timestep,nb_features)                                                                                                                                                                       

Y = df[['output']].values                                                                                                                                                                                                                                                          
Y = Y[range(3,len(Y),3)] #Select the good output                                                                                                                                                                                                                                   


model = Sequential()                                                                                                                                                                                                                                                               
model.add(LSTM(input_dim = X.shape[2],output_dim = nb_units,return_sequences = False)) # One LSTM layer with 50 units                                                                                                                                                               
model.add(Activation("sigmoid"))                                                                                                                                                                                                                                                   
model.add(Dense(1)) #A dense layer which is the final layer                                                                                                                                                                                                                        
model.add(Activation('linear'))                

KerasOptimizer = keras.optimizers.RMSprop(lr=learning_rate, rho=0.9, epsilon=1e-08, decay=0.0)                                                                                                                                                                                     
model.compile(loss="mse", optimizer=KerasOptimizer)                                                                                                                                                                                                                                
model.fit(X,Y,nb_epoch = nb_epoch,batch_size = batch_size)                                                                                                                                                                                                                         
prediction = model.predict(X)  

【讨论】:

  • 谢谢 Ben 我真的很感激!那肯定有帮助。但是有一个问题,为什么在重塑 X 时将样本数除以时间步长 (X.shape[0]/timeStep)?如果我理解正确,由于时间步长被添加为第三维,它的样本数量不是相同吗?
  • 在我的代码中,如果我认为我只有一个功能,第一个样本是X1,X2,X3,第二个样本是X4,X5,X6 等等。在X = X[:sizeX]X.shape = (9,4) 之后。我希望 X 的形状像 (nb_sample,3,4),所以我需要 nb_sample = 3 = X.shape[0]/timeStep。您可以轻松地在第一个示例 X1,X2,X3、第二个示例 X2,X3,X4 等中编写代码
  • 嗯,上下文是有道理的,但在你解释的开头你写道:“第一个样本是:[[X1,X2,X3],[Y1,Y2,Y3]] 和相关的输出:X4。第二个样本是[[X2,X3,X4],[Y2,Y3,Y4]]X5 作为输出”,我理解为时间步长是第三个维度
猜你喜欢
  • 2021-07-25
  • 2019-06-13
  • 1970-01-01
  • 2019-04-26
  • 1970-01-01
  • 1970-01-01
  • 2013-07-30
  • 2015-11-27
  • 1970-01-01
相关资源
最近更新 更多