【问题标题】:Group By Non-Missing Values Dplyr按非缺失值分组 Dplyr
【发布时间】:2017-06-13 03:39:29
【问题描述】:

我有一个包含许多重复项的大型数据框(≈ 2M 观察值)。我将删除这些重复项,但我需要将非重复值保留为以另一个不丢失的值 (NA) 为条件。它可以是任何可以想象的值,只要有一个非 NA。例如:

 data <- airquality
 data[4:10,3] <- rep(NA,7)
 data[1:5,4] <- NA

 library(dplyr)

 new.data <- data %>% 
    group_by(Ozone) %>% 
    filter(Wind==????))

在这里您可以看到我不确定要过滤什么,如“Wind==????”注释。只要 Wind 列中有任何值(数字或名义),那么我想保留这些唯一值,同时删除非缺失值的条件值。

谢谢!

【问题讨论】:

  • 你想要data %&gt;% group_by(Ozone) %&gt;% filter(!duplicated(Wind) &amp; !is.na(Wind))

标签: r dplyr


【解决方案1】:

我们可以的

data %>% 
     group_by(Ozone) %>%
     filter(!duplicated(Wind) & !is.na(Wind))

【讨论】:

    猜你喜欢
    • 2013-04-27
    • 2017-03-23
    • 2021-09-03
    • 2016-12-04
    • 2019-12-28
    • 1970-01-01
    • 1970-01-01
    • 2020-08-28
    相关资源
    最近更新 更多