【问题标题】:unique values in categorical variables R estudio分类变量 R estudio 中的唯一值
【发布时间】:2020-07-28 04:30:28
【问题描述】:

如何找出每个类别在数据框中包含多少个唯一值,然后用图表表示?这一切都在 R 工作室中

【问题讨论】:

  • 嗨,欢迎来到堆栈溢出。使用一些示例数据和尝试实现目标的代码通常更容易回答问题。总之,这些应该形成一个最小的可重现示例,人们可以理想地将粘贴复制到他们的 R 会话中。以这种方式提出问题通常也可以帮助您发现错误。

标签: ggplot2 frame categorical-data unique-values


【解决方案1】:

我们将在这里使用 tidyverse。

library(tidyverse)

您可以将 unique() 函数应用于数据框以删除任何重复行。

df <- iris %>% unique()

group_by()、summarise() 和 n() 函数可让您计算数据框中变量的实例数。

df2 <- df %>% group_by(Species) %>% summarise(n = n())

## alternatively use count() which does the same thing
df2 <- df %>% count(Species)

最后我们可以使用 ggplot 包来创建图表了。

ggplot() + geom_col(data = df2, aes(x = Species, y = n))

如果您对包含数据的单独数据框不感兴趣并想直接跳转到图表,则可以忽略 group_by() 和 summarise() 的步骤,而只使用 geom_bar()。

ggplot() + geom_bar(data = df, aes(Species))

【讨论】:

  • 另外,如果我想使用多个变量执行此方法,我应该为所有变量执行 summarise_at 吗?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-11-19
  • 2015-11-30
  • 1970-01-01
  • 1970-01-01
  • 2018-12-15
相关资源
最近更新 更多