【发布时间】:2017-04-23 03:46:33
【问题描述】:
首先,我已经阅读了以下帖子:ggplot2 - Multi-group histogram with in-group proportions rather than frequency
我遵循了 ddply 建议,但它似乎不适用于我的数据。从逻辑上讲,代码应该在我的数据集上完美运行,我不知道我做错了什么。
总体而言:我想制作一个直方图(我正在学习 ggplot),以显示我每个研究组中的基因型频率。
类似这样的:
这是一个模拟我自己的模拟数据集:
df<-data.frame(ID=1:60,
Genotypes=sample(c("CG", "CC", "GG"), 60, replace=T),
Study_Group=sample(c("Control", "Pathology1", "pathology2"), 60, replace=T))
我尝试了 p + geom_bar(aes(aes(y = ..count../sum(..count..)) 的变体,但 r 返回“找不到‘计数’对象”或类似的东西。
我也试过了:
df.new<-ddply(df,.(Study_Group),summarise,
prop=prop.table(table(df$Genotype)),
Genotype=names(table(df$Genotype)))`
而且我认为 summarise 函数存在错误,但老实说,我不知道自己在做什么。
问题仅仅是我对解决方案的理解,还是我的数据集中存在固有的不同?
感谢您的帮助。
【问题讨论】:
标签: r ggplot2 histogram frequency