【发布时间】:2016-02-13 20:23:40
【问题描述】:
所以我在线生成了一个随机数据集,我需要对其应用 C4.5 算法。
我安装了 RWeka 包及其所有依赖项,但我不知道如何执行它。
有人可以帮我提供教程的链接吗?除了 RWeka 文档之外的任何内容。还是 R 中的示例 C4.5 代码以了解其工作原理?
谢谢
【问题讨论】:
所以我在线生成了一个随机数据集,我需要对其应用 C4.5 算法。
我安装了 RWeka 包及其所有依赖项,但我不知道如何执行它。
有人可以帮我提供教程的链接吗?除了 RWeka 文档之外的任何内容。还是 R 中的示例 C4.5 代码以了解其工作原理?
谢谢
【问题讨论】:
我认为值得您花时间查看caret 包。它标准化了 R 中大多数机器学习包的语法,包括RWeka。
它还有大量非常有用的辅助函数和their website上的精彩教程
以下是使用 RWeka 包和类 C4.5 的树预测 iris 数据集上的物种的语法:
library(caret)
train_rows <- createDataPartition(iris$Species, list=FALSE)
train_set <- iris[train_rows, ]
test_set <- iris[-train_rows, ]
fit.rweka <- train(Species ~ ., data=train_set, method='J48')
pred <- predict(fit.rweka, newdata=test_set)
那么,如果你想尝试梯度提升机或其他算法,只需更改为method='gbm'
【讨论】: