【发布时间】:2015-04-21 14:27:46
【问题描述】:
我目前正在使用 TraMiner 进行聚类练习。我有一个频率表df.seq,我使用以下代码将其分成了四个集群:
library(cluster)
df.om <- seqdist(df.seq, method='OM', indel=1, sm='TRATE', with.missing=TRUE)
clusterward <- agnes(df.om, diss=TRUE, method="ward")
df.cl4 <- cutree(clusterward, k=4)
cl4.lab <- factor(df.cl4, labels=paste("Cluster", 1:4))
然后,我绘制了四个集群的序列频率图。
seqfplot(df.seq, group=cl4.lab, pbarw=FALSE, border=NA, withlegend = FALSE, yaxis = "pct", cpal=palette(rainbow(length(unique(df.new$cart)))))
虽然seqfplot 提供了良好的视觉效果,但我希望看到每个单独集群的频率表。例如,我可以这样做:
seqtab(df.seq)
并得到以下输出:
Sequence Frequency %
Item #1 10 30%
Item #2 9 25%
Item #3 8 20%
任何帮助将不胜感激!
【问题讨论】:
-
要在这里使用
table,我们首先需要用一个值来表示每个序列。此外,table无法处理分配给对象df.seq中状态序列的可能权重。为此,您必须使用xtabs。
标签: r sequence cluster-analysis traminer