【发布时间】:2018-08-15 17:58:17
【问题描述】:
我在 Rstudio 工作。
使用 ggplot2,我试图形成一个图,其中我有一个分类变量的频率(购买的股票数量),每个类别(有 5 个类别)。 例如,A 类成员可能比 D 类成员更频繁地购买 1 股。
我现在有一个计数图。但是,由于一个类别比其他类别大得多,因此您无法很好地了解其他类别中的 n 个份额。
count plot的代码如下:
#ABS. DISTRIBUTION SHARES/CATEGORY
ggplot(dat, aes(x=Number_share, fill=category)) +
geom_histogram(binwidth=.5, alpha=.5, position="dodge")
这会导致这个图表:https://imgur.com/a/e4k94
因此,我计划制作一个图,其中不是绝对计数,而是相对于其类别的分布。
我计算了每个类别的相对频率:
library(MASS)
categories = dat$category
categories.freq = table(categories)
categories.relfreq = categories.freq / nrow(dat)
cbind(categories.relfreq)
categories.relfreq
博文特 1 0.002708692
博文特 2 0.015020931
E&B 0.037182960
生态动力 1 0.042107855
生态动力 2 0.029549372
生态动力 3 0.873183945
我不知道如何绘制股票数量获取频率相对于类别而不是绝对值的图。有人可以帮我解决这个问题吗?
【问题讨论】:
标签: r ggplot2 frequency categorical-data