【发布时间】:2017-12-12 08:28:09
【问题描述】:
我有这个three column dataset 格式如下
t_stamp,Xval,Ytval
0.000543,0,10
0.000575,0,10
0.041324,1,10
0.041331,2,10
0.041336,3,10
0.04134,4,10
0.041345,5,10
0.04135,6,10
0.041354,7,10
我们如何使用Python 中sklearn 的random forest classifier model 的Xval 的最后5 个数据点预测Y 的当前值(真实值)?意思是将Xval 列的[0,0,1,2,3] 作为输入——我想预测Ytval 的第5 行值。使用简单的rolling OLS regression model,我们可以按照以下方式进行操作,但我想使用random forest model 进行操作。
import pandas as pd
df = pd.read_csv('data_pred.csv')
model = pd.stats.ols.MovingOLS(y=df.Ytval, x=df[['Xval']],
window_type='rolling', window=5, intercept=True)
【问题讨论】:
-
这个问题似乎不是针对随机森林的,而是关于数据转换的。您可能会考虑更改您的标题。
-
我从另一个问题中删除了标记,但似乎是版主删除了该问题。
-
@sera,我自己删除了它以进一步扩展问题。
标签: python pandas scikit-learn classification random-forest