【发布时间】:2018-07-19 18:31:11
【问题描述】:
dat <- data.frame(A = c("r","t","y","g","r"),
B = c("g","r","r","t","y"),
C = c("t","g","t","r","t"))
A B C
1 r g t
2 t r g
3 y r t
4 g t r
5 r y t
我想列出在三列中一起出现的字符,忽略顺序。 例如
Combinations Freq
r t g 3
y t r 2
如果我想添加名义变量(例如性别)的频率计数,我该怎么做?
例如
dat <- data.frame(A = c("r","t","y","g","r"),
B = c("g","r","r","t","y"),
C = c("t","g","t","r","t"),
Gender = c("male", "female", "female", "male", "male"))
dat
A B C Gender
1 r g t male
2 t r g female
3 y r t female
4 g t r male
5 r y t male
要得到这个:
Combinations Freq Male Female
r t g 3 2 1
y t r 2 1 1
【问题讨论】:
-
这里的礼仪通常是在发布答案后不对问题进行重大修改,除非回答者期待它。顺便说一句,你对新东西的格式有点不对劲。缩进四个空格以制作代码块,或突出显示并按 CTRL+K。您在那里使用内联代码格式。
-
抱歉。我是新来的。谢谢你的提示。我不知道如何去询问后续,我正在使用这个帖子:meta.stackexchange.com/questions/10243/… 作为指导。另外,我可能不小心删除了您对后续的回答,我会尽力解决这个问题。
-
是的,很好找。我同意 Shog 的“如果后续问题的答案可以很容易地转化为现有答案,那么应该在评论中提出并通过对该答案的编辑来回答。”问题是您无法真正知道扩展是否容易(否则您不需要询问它:))。因此,我会在轮询所有回答者方面犯错,如果有人说“不,我不想为此编辑”,那么请考虑提出一个新问题,因为您的编辑将使现有答案无效/不完整。
标签: r combinations