【发布时间】:2017-07-06 13:58:02
【问题描述】:
所有,我在 R 中可能有一个非常简单的问题,但我无法通过与此问题相关的现有答案解决一些问题。
我想将我的数据集一分为二,以便可以使用 predict() 函数。我的数据集是 27 行,不包括标题。我只想将其拆分为 20 行和 7 行集(两组)。当我使用split 函数时,我不仅可以弄清楚如何拆分为总行数倍数的组,而且生成的对象会更改变量/标题名称,每个前面都带有X1.。
我尝试过并喜欢的当前代码是,
data=newdata
indexes = sample(1:nrow(newdata), size=0.8*nrow(newdata))
test = data[indexes,]
train = data[-indexes,]
但这会导致随机分组行,而不是前大约 20 行。如何获得返回前 20 和后 7 的结果?为这个简单的问题道歉,非常感谢任何见解!
【问题讨论】:
-
如果你想选择特定的列,一般代码是
data[rows,columns]所以你会用test = data[1:20]选择第1 到第20 行,用train = data[21:27]选择第21 到第27 行。