【发布时间】:2018-04-20 11:04:08
【问题描述】:
我的数据如下所示:
> str(bigrams_joined)
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 71319 obs. of 2 variables:
$ line : int 1 1 1 1 1 1 1 1 1 1 ...
$ bigrams: chr "in practice" "practice risk" "risk management" "management is"
我想将我的数据集中最常出现的前 10 或 15 个二元组绘制到 ggplot2 中的条形图上,并在 y 轴上使用标签水平运行条形图。
非常感谢任何帮助!
谢谢
【问题讨论】:
-
前 15 名是什么?只是前 15 名还是每行前 15 名?
-
前 15 个最频繁发生 - 抱歉,我没有具体说明。立即编辑。
-
这个?
ggplot(bigrams_joined, aes(bigrams)) + stat_count(geom="bar") -
感谢您的建议 - 不幸的是,它试图绘制每一个值,而不是前 10 或 15 个。我有大约 35000 行,我只对前 10 或 15 个感兴趣
标签: r ggplot2 text-mining tidytext