【发布时间】:2017-10-22 05:38:12
【问题描述】:
我有 50 个预测变量和 1 个目标变量。我所有的预测变量和目标变量都只是二进制数 0 和 1。我正在使用 R 进行分析。
我将实现四种算法。 1.射频 2. 日志注册 3. 支持向量机 4. LDA
我有以下问题:
我将它们全部转换为因子。在将变量输入其他算法之前,我应该如何处理它们。
我使用 caret 包来训练我的模型,这需要很长时间。我确实经常练习 ML,但我不知道如何将所有变量都设为二进制。
如何去除共线变量?
【问题讨论】:
-
@Headpoint,你能回答这个问题吗
-
你应该尽量缩小问题的范围——有更多的分类器和处理数据的方法。如果变量实际上是分类变量,则应将它们转换为因子,以免将它们视为数值变量。如果您不确定如何处理分类数据,最好阅读一些介绍性文章。我想对于这类数据有很多机器学习算法。
-
我尝试了很多算法,以上都是,也转换成因子
标签: r machine-learning data-science