【发布时间】:2021-12-16 01:58:33
【问题描述】:
我有一个看起来像这样的 data.frame:
df <- data.frame (names = LETTERS[1:10],
rep1 = sample(1:5, 10, replace=TRUE),
rep2 = sample(1:5, 10, replace=TRUE),
rep3 = sample(1:5, 10, replace=TRUE),
rep4= sample(1:5, 10, replace=TRUE))
print(df)
names rep1 rep2 rep3 rep4
1 A 2 2 5 4
2 B 5 5 5 1
3 C 3 4 2 5
4 D 5 3 5 3
5 E 2 3 2 4
6 F 5 5 2 4
7 G 1 3 1 3
8 H 2 2 3 3
9 I 1 1 4 3
10 J 3 1 3 5
我需要知道的: 某些名称(“样本”)是否在不同的代表中组合在一起(按数字)?
但是,数字(1到5)是否不同无关紧要,只要特定名称属于同一组(例如A,E,H属于rep1中的第2组。它们是否在另一个rep中分组在一起?)。我想知道是否有分组的“模式”,例如某些名称是否更频繁地同时出现/出现在一个集合中?
有人知道如何实现这一目标吗?
【问题讨论】:
-
您的预期输出如何?
-
说实话,这已经是我的第一次挣扎了。我想知道获得重叠印象的最佳方式是什么。也许是一个表,其中行名和列名都为“名称”,还有一个数字表示该名称与另一个名称在同一组中的次数?或者有没有情节或集群解决方案?
标签: r dataframe split cluster-computing overlap