【发布时间】:2015-09-18 20:38:43
【问题描述】:
考虑以下数据集:
id = c(rep("aa", 3), rep("bb", 3), rep("cc", 3))
item = rep(c("run", "jump", "clap"), 3)
day = paste0('Day',1:5)
df = data.frame(id, item)
df[,day] <- c(rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5),
rbinom(5, 1, 0.5)
)
产生这个:
id item Day1 Day2 Day3 Day4 Day5
1 aa run 0 1 0 0 0
2 aa jump 0 1 0 1 0
3 aa clap 0 0 0 0 0
4 bb run 0 0 1 1 1
5 bb jump 1 1 0 1 1
6 bb clap 0 1 0 1 1
7 cc run 1 1 1 1 1
8 cc jump 0 1 1 1 1
9 cc clap 0 1 0 1 0
我想确定三个受试者(aa、bb、cc)中哪一个在日常拍手、跑步和跳跃习惯方面具有相似的模式。
我在寻找某种聚类方法吗?我尝试过的一件事是分离出每个二进制序列并将它们变成 5 个字符串,然后排序。这提供了一个不错的视觉效果,但我正在寻找更多程序化和更少手动的东西。
有什么想法吗?谢谢!
【问题讨论】:
标签: r math statistics