【发布时间】:2017-07-05 08:57:19
【问题描述】:
假设我有这些数据。我的目标是提取序列组合。
我有一个约束,两个事件之间的时间可能不超过 5,我们称之为maxGap。
User <- c(rep(1,3)) # One users
Event <- c("C","B","C") # Say this is random events could be anything from LETTERS[1:4]
Time <- c(c(1,12,13)) # This is a timeline
df <- data.frame(User=User,
Event=Event,
Time=Time)
如果想将这些序列用作二元解释变量进行分析。
给定这个数据框,结果应该是这样的。
res.df <- data.frame(User=1,
C=1,
B=1,
CB=0,
BC=1,
CBC=0)
(CB) 和 (CBC) 将为 0,因为 maxGap > 5。
我试图为此使用许多for循环编写一个函数,但是如果序列变得更大并且不同数量的事件也变得更大,它会变得非常复杂。如果不同用户的数量增长到 100 000。
是否有可能在 seqeconstraint 的帮助下在 TraMineR 中执行此操作?
【问题讨论】:
标签: r sequence sequences traminer pattern-mining