【发布时间】:2019-05-18 14:44:15
【问题描述】:
我有分类变量,我将其转换为虚拟变量并得到超过 2381 个变量。我不需要那么多变量进行分析(比如回归或相关性)。如果给定列中超过 90% 的总值是“0”,我想删除列。此外,除了 90% 的值是 '0' 之外,是否有一个很好的指标来删除列?救命!
【问题讨论】:
-
您能否向我们展示您的数据示例?在这里阅读:stackoverflow.com/questions/5963269/…
-
这里是关于如何做到这一点的分步指南:stackoverflow.com/questions/53646975/… 你需要
colSums而不是colSums。以dat == 0开头。 -
请提供您已经尝试过的内容。
标签: r if-statement logic dummy-variable