【发布时间】:2015-11-05 11:41:34
【问题描述】:
我有一个数据,其中有一列提到了一个人的性别。不幸的是,很少有错位的列/错误的值。
summary(data$gender)
给出类似的东西
boy : 19232
girl : 14565
Maths : 3
Science : 4
... some 20 garbage values : 1
我编写了一个代码来将 boy, girl 以外的值替换为 error。现在 summary(data$gender) 给出类似
boy : 19232
error : 156
girl : 14565
Maths : 0
Science : 0
... other garbage values : 0
有什么方法可以防止打印计数为 0 的值?
我为什么需要这个 - 有 100 多列。我正在使用一个新的标志列,当它在任何单元格值中遇到“错误”时设置为 1,最后,我删除了标志 = 1 的记录。 我需要查看整个数据的简短摘要。,类似于
boy : 19232
error : 156
girl : 14565
提前感谢您的帮助!
【问题讨论】:
-
可能你有一个因素,水平仍然存在。删除级别,然后重试。共享一些数据会很好,请参阅stackoverflow.com/questions/5963269/…
-
没有。我已将它们转换为“错误”。
标签: r summary garbage data-cleaning