【发布时间】:2020-03-30 08:39:19
【问题描述】:
下面是 2 块代码用于比较 - 注意 filter(n() >= 100) 的位置不同:
library(tidyverse)
library(dslabs)
movielens %>%
group_by(userId) %>%
filter(n() >= 100) %>%
summarise(mean_rating = mean(rating)) %>%
ggplot(aes(mean_rating)) +
geom_histogram(bins=30, col="black")
和
movielens %>%
group_by(userId) %>%
summarise(mean_rating = mean(rating)) %>%
filter(n() >= 100) %>%
ggplot(aes(mean_rating)) +
geom_histogram(bins=30, col="black")
这两段代码给出了两个外观不同的直方图。为什么会这样?他们不应该做同样的事情吗?
【问题讨论】:
-
不,尝试使用第一个脚本的前两行(当然不是
library())和第二个脚本的前三行,你会看到不同之处,它的应用filter().
标签: r ggplot2 data-visualization tidyverse