【发布时间】:2019-04-19 23:42:56
【问题描述】:
我正在使用函数 sample.split(data, SplitRatio) 来拆分 100 万 x 6 个元素的数据集。它非常慢。在 R 中有没有更快的方法来做到这一点?
【问题讨论】:
-
sample.split接受一个向量,而不是整个 data.frame。我使用它时似乎相当快。 -
sample.split(data_set$luser_id, SplitRatio = 0.8)
-
我就是这样做的
-
这在我的机器上不到一秒钟。请参阅答案以了解您可以尝试的另一种方法。
-
我的数据集有一百万行