【问题标题】:All binary predictors in a classification task分类任务中的所有二元预测器
【发布时间】:2018-04-01 08:02:06
【问题描述】:

我正在使用 R 进行分析,我将实现四种算法。

1. RF
2. Log Reg
3. SVM
4. LDA

我有 50 个预测变量和 1 个目标变量。我所有的预测变量和目标变量都只是二进制数字 0 和 1。

我有以下问题:

Should I convert them all into factors?
Converting them into factors, and applying RF algorithms give 100% accuracy, I am very much surprised to see that as well.
Also, for other algorithms, how should i treat my variables priorly, before feeding them into my other algorithms.

谢谢

【问题讨论】:

标签: r machine-learning statistics random-forest r-caret


【解决方案1】:

使用 adaboost...

查看不同的 kaggle 内核,尤其是 Mercedes 内核,以了解实施 adaboost 的想法。

https://www.kaggle.com/c/mercedes-benz-greener-manufacturing/kernels

数据集混合了数值和因子以及 0s,1s。

【讨论】:

    【解决方案2】:

    如果您的变量/预测变量是分类的,那么最好将它们转换为因子。否则,它们很可能会被视为数值。

    如果您正在执行分类任务,那么最好将目标/响应变量也作为一个因素。

    最好查看您使用的函数的文档,以确保它们不会将因子转换为数值。

    【讨论】:

    • 我已经把它们转换成因子了,我不认为,你的回答是合格的,应该有评论。
    • 为什么不达标?您的问题显然是“我应该将它们全部转换为因子吗?”
    • 如果你不喜欢我的回答,那就顺其自然吧。似乎您寻求帮助,然后期望以某种方式给出令您满意的答案。
    猜你喜欢
    • 2020-01-19
    • 1970-01-01
    • 2023-03-16
    • 2018-08-22
    • 2019-04-12
    • 2020-03-20
    • 2018-09-16
    • 1970-01-01
    • 2019-06-11
    相关资源
    最近更新 更多