【发布时间】:2014-02-20 17:24:37
【问题描述】:
假设您有一个包含 2 个变量的数据框 - 姓名和年龄。姓名是班级因素和年龄编号。现在想象现在这个数据框中有成千上万的人。你好吗:
生成一个包含以下内容的表:NAME |每个名称的 COUNT(NAME) 唯一吗?
生成一个直方图,您可以在其中更改最小数量 出现在直方图中。?
对于第 2 部分,我希望能够测试不同的最小频率值并查看直方图的结果。或者有没有更好的方法务实地确定每个名字进入直方图的最小计数?
谢谢!
编辑:这是表格在 RDBS 中的样子:
NAME | COUNT(NAME)
John | 10
Bill | 24
Jane | 12
Tony | 50
伊曼纽尔| 1 ...
我想要做的是创建一个函数来绘制直方图,我可以在其中更改设置要绘制的最小频率的值。更有意义?
【问题讨论】:
-
您已经尝试了哪些,哪些没有奏效,您希望在哪里获得帮助?哦,你有一些我们可以使用的数据吗?如需帮助,请参阅 stackoverflow.com/questions/5963269/…。
-
所以我刚刚找到了
table()函数,当你传递一个名称数组时,它会自动给你计数。我在那里应该很好。对于直方图,我使用的是plot(df.counts$NAME[which(df.counts > 10)]);,但这不起作用。 -
根据您提供的内容,无法知道您的
df.counts是什么样的,也无法知道NAME的元素是什么样的。假设您的初始 data.frame 是d,并且名称在元素name中,请尝试plot(as.table(table(d$name)[table(d$name) > 10]))
标签: r histogram frequency counting