【问题标题】:R- FactoMiner MCA How to select Important Features?R- FactoMiner MCA 如何选择重要功能?
【发布时间】:2018-06-10 02:30:37
【问题描述】:

我的数据集是数字和分类值的混合体,结果是类标签,大约有 400 列,数据集包含缺失值。我的脑海里有很多问题。首先是:

  1. 如何处理缺失值?我用-1替换了所有缺失值,可以吗??

  2. 如何对这些数据应用 MCA 因子分析?我应该结合训练和测试然后申请 MCA 吗?

  3. 如何解释 MCA 分析的输出以获得最相关的特征?

【问题讨论】:

    标签: r pca


    【解决方案1】:
    1. 不要触摸您的数据集 如果您使用 FactoMineR 包,它会自行处理缺失值。

    2. 你必须尝试这种代码

      library(FactoMineR)
      library(factoextra)
      
      df <- data.frame(df) # Dataset with only categorical variables
      res.mca <- MCA(df, quali.sup)
      
      # Visualize Principal Components
      fviz_eig(res.mca, 
               addlabels = TRUE)
      
      # Individual plot
      fviz_mca_ind(res.mca, 
                   col.ind = "cos2",
                   axes = c(1,2), # axes by default
                   repel = TRUE)
      
       # Variable plot on axe 1
       fviz_contrib(res.mca, 
                    choice = "var", 
                    axes = 1, # you can switch with the other axes
                    top = 10)
      
       # Best variable contribution
       fviz_mca_var(res.mca, col.var = "contrib",
                    axes = c(1,2),
                   repel = TRUE)
      
    3. 解释看起来像 PCA。

      • 可视化主成分 (CP):查看每个变量的百分比信息
      • 个体和变量图:显示相关变量和异常值
      • 贡献:查看每个轴上的变量贡献百分比

    【讨论】:

      猜你喜欢
      • 2016-02-04
      • 2021-05-11
      • 2012-12-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多