【发布时间】:2017-03-28 22:01:24
【问题描述】:
我找到了一个简单的解决方案,可以使用
获取数据框中列的最频繁因子names(which.max(table(df$column)))
但是如果我想在一个链中找到最常见的因子怎么办。是否有一个简单的代码可以为您提供因素的“模式”?
或者有没有一种方法可以将上述代码包含在一个链中?
我已经这样做了,这似乎是在浪费时间。
(df %>% group_by(column) %>% summarise(count=n()) %>% arrange(desc(count)))$count[1]
一个简单的代码将不胜感激,无需提供示例数据。谢谢!
【问题讨论】:
-
为什么不能在第一个示例中将
df替换为.? -
对不起,我不明白,我对 R 很陌生。我只想在链中执行此操作,因为我想首先过滤和变异 df,然后获得最多特定列的频繁因子。但是我不想在这个过程中创建一个新的df,然后做table方法。
-
df %>% top_n(1, column) -
@Ricky 我的意思是,
df %>% mutate(new_column = names(which.max(table(.$column)))) -
另外,it's your responsibility to provide sample data 如果你想得到答案。