【问题标题】:rename all rows in a column based upon row with a different name根据具有不同名称的行重命名列中的所有行
【发布时间】:2018-03-02 18:30:19
【问题描述】:

我有一个这样的数据框:

 df <- setNames(data.frame(matrix(c(rep(1,8),c(1,2,3,1,2,3,4,1),
                               rep("useless",3),"label1",
                               rep("useless",3),"label2",
                               floor(runif(8,100,400))),8,4)),
                               c("subject","trial","block","data"))

     subject trial   block data
   1       1     1 useless  144
   2       1     2 useless  380
   3       1     3 useless  118
   4       1     1  label1  323
   5       1     2 useless  250
   6       1     3 useless  292
   7       1     4 useless  375
   8       1     1  label2  358

我想将所有“无用”行变成它们之后的“标签”行。

输出:

   subject trial   block data
 1       1     1  label1  144
 2       1     2  label1  380
 3       1     3  label1  118
 4       1     1  label1  323
 5       1     2  label2  250
 6       1     3  label2  292
 7       1     4  label2  375
 8       1     1  label2  358

我是这么想的,但不知道怎么做:

 df %>%
   mutate(block = ifelse(block == "useless", "make it the end label", block))

我知道必须有一个非常简单的解决方案,但我没有看到它。我更喜欢tidyverse 的回答,但会接受任何可行的方法。

【问题讨论】:

    标签: r dataframe dplyr rows r-factor


    【解决方案1】:

    useless 值替换为NA,然后进行反向填充:

    library(tidyverse)
    df %>% 
        mutate(block = ifelse(grepl('label', block), as.character(block), NA)) %>% 
        fill(block, .direction = 'up')
    
    #  subject trial  block data
    #1       1     1 label1  108
    #2       1     2 label1  391
    #3       1     3 label1  201
    #4       1     1 label1  239
    #5       1     2 label2  332
    #6       1     3 label2  239
    #7       1     4 label2  363
    #8       1     1 label2  267
    

    或者使用na_if,如果你只有一个无用的值:

    library(tidyverse)
    df %>% 
        mutate(block = na_if(block, 'useless')) %>% 
        fill(block, .direction = 'up')
    
    #  subject trial  block data
    #1       1     1 label1  108
    #2       1     2 label1  391
    #3       1     3 label1  201
    #4       1     1 label1  239
    #5       1     2 label2  332
    #6       1     3 label2  239
    #7       1     4 label2  363
    #8       1     1 label2  267
    

    【讨论】:

    • 谢谢!我最终选择了第二种解决方案,它就像一个魅力。
    【解决方案2】:

    基本的 R 解决方案是:

    df$block <- ave(
        df$block, rev(cumsum(rev(df$block != 'useless'))),
        FUN = function(x) x[length(x)])
    
    df
    #   subject trial  block data
    # 1       1     1 label1  138
    # 2       1     2 label1  380
    # 3       1     3 label1  376
    # 4       1     1 label1  111
    # 5       1     2 label2  124
    # 6       1     3 label2  231
    # 7       1     4 label2  215
    # 8       1     1 label2  361
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-11-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-09-30
      • 2011-01-27
      • 2016-12-29
      • 1970-01-01
      相关资源
      最近更新 更多