【问题标题】:How to use RWeka package on a dataset?如何在数据集上使用 RWeka 包?
【发布时间】:2016-02-13 20:23:40
【问题描述】:

所以我在线生成了一个随机数据集,我需要对其应用 C4.5 算法。
我安装了 RWeka 包及其所有依赖项,但我不知道如何执行它。
有人可以帮我提供教程的链接吗?除了 RWeka 文档之外的任何内容。还是 R 中的示例 C4.5 代码以了解其工作原理?
谢谢

【问题讨论】:

    标签: r id3 rweka c4.5


    【解决方案1】:

    我认为值得您花时间查看caret 包。它标准化了 R 中大多数机器学习包的语法,包括RWeka

    它还有大量非常有用的辅助函数和their website上的精彩教程

    以下是使用 RWeka 包和类 C4.5 的树预测 iris 数据集上的物种的语法:

    library(caret)
    train_rows <- createDataPartition(iris$Species, list=FALSE)
    train_set <- iris[train_rows, ]
    test_set <- iris[-train_rows, ]
    
    fit.rweka <- train(Species ~ ., data=train_set, method='J48')
    pred <- predict(fit.rweka, newdata=test_set)
    

    那么,如果你想尝试梯度提升机或其他算法,只需更改为method='gbm'

    【讨论】:

    • 嗨@DunderChief。谢谢您的帮助。我仍然面临一个问题。当我在基于 Iris 数据集构建的数据集上运行此程序时,我在 fit.rweka 步骤中遇到错误。这是显示的错误:train.default(x, y, weights = w, ...) 中的错误:结果中的一个或多个因子级别没有数据:''
    • 另外,我如何查看我们从 predict 获得的输出?抱歉新手问题。我对此完全陌生。
    • @SakshamArora 训练数据中似乎没有您的结果变量之一。因此,在 iris 数据集的情况下,就好像训练集只包含 setosa 和 versicolor 花,但没有Virginica。 predict 的输出保存在上述代码中的 pred 对象中。
    • MLR(R 中的机器学习)包 here 怎么样?它与插入符号相比如何?您如何在插入符号中知道您正在使用 RWeka,是否可以将 WEKA 的预处理步骤与 RWeka 一起使用?
    猜你喜欢
    • 2019-09-05
    • 2016-07-09
    • 2016-05-16
    • 2018-01-26
    • 2016-10-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-10-10
    相关资源
    最近更新 更多