【问题标题】:R: Creating new clustering variable from subject id's [duplicate]R:从主题ID的[重复]创建新的聚类变量
【发布时间】:2018-08-25 02:38:28
【问题描述】:

我正在尝试创建一个变量来识别每个独特的主题并将他们的访问“聚集”在一起。例如:

ID   Visit  Cluster
S101  0      1
S101  6      1
S101  12     1
S102  0      2
S105  0      3
S105  6      3

如何创建这个新变量“Cluster”?我主要使用 dplyr 包。

【问题讨论】:

    标签: r dplyr


    【解决方案1】:

    先创建一个因子列,然后转换为整数。

    library(dplyr)
    
    dat2 <- dat %>%
      mutate(Cluster = as.integer(factor(ID)))
    
    dat2
    #     ID Visit Cluster
    # 1 S101     0       1
    # 2 S101     6       1
    # 3 S101    12       1
    # 4 S102     0       2
    # 5 S105     0       3
    # 6 S105     6       3
    

    或使用group_indices

    dat2 <- dat %>%
      mutate(Cluster = group_indices(., ID))
    dat2
    #     ID Visit Cluster
    # 1 S101     0       1
    # 2 S101     6       1
    # 3 S101    12       1
    # 4 S102     0       2
    # 5 S105     0       3
    # 6 S105     6       3
    

    数据

    dat <- read.table(text = "ID   Visit
    S101  0
                      S101  6 
                      S101  12
                      S102  0
                      S105  0
                      S105  6",
                      header = TRUE, stringsAsFactors = FALSE)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-08-09
      • 2012-02-02
      • 2015-08-17
      • 2014-12-30
      • 1970-01-01
      • 2012-01-03
      • 1970-01-01
      • 2019-05-13
      相关资源
      最近更新 更多