【发布时间】:2016-10-08 05:00:34
【问题描述】:
我正在研究泰坦尼克号数据集。我正在尝试填写 CABIN 列中的空白。我从 CABIN 列值中提取了第一个字母,然后将它们放在 CABIN_NEW 列中。之后我使用rpart进行预测,但不知何故,每次我运行下面的代码时,R都会花费很多时间(一次还没完成,每次都必须终止它)。
DATAset 有 1309 行,我使用的列在下面的代码中。我使用的系统在 4 GB Ram、i5 处理器和 Window 7 上运行。
combifit <- rpart(Cabin_New ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked + Title
+ FamilySize + Surname + FamilyID,
data = combi[!is.na(combi$Cabin_New),], method = 'class')
【问题讨论】:
标签: r analytics prediction rpart