【问题标题】:Why is `select_if(., is_double)` returning dates? [duplicate]为什么 `select_if(., is_double)` 返回日期? [复制]
【发布时间】:2020-06-25 20:40:27
【问题描述】:

is_doubleselect_if 一起使用时,返回值包括lubridate 的date 数据类型的列。这是为什么呢?

这是一个使用today() 函数的简单示例。

library(tidyverse)
library(lubridate)

mtcars %>% 
    as_tibble() %>% # Convert to tibble
    mutate(today = today()) %>% # Create a date column
    select_if(is_double) # Select double columns

输出:

# A tibble: 32 x 12
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb today     
   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <date>    
 1  21       6  160    110  3.9   2.62  16.5     0     1     4     4 2020-06-25
 2  21       6  160    110  3.9   2.88  17.0     0     1     4     4 2020-06-25
 3  22.8     4  108     93  3.85  2.32  18.6     1     1     4     1 2020-06-25
 4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1 2020-06-25
 5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2 2020-06-25
 6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1 2020-06-25
 7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4 2020-06-25
 8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2 2020-06-25
 9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2 2020-06-25
10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4 2020-06-25
# ... with 22 more rows

希望我遗漏了一些简单的东西,日期是否被识别为双精度类型?

【问题讨论】:

标签: r dplyr lubridate


【解决方案1】:

因为,date 在内部存储为 double

typeof(today())
#[1] "double"

虽然它的class 是“日期”

class(today())
#[1] "Date"

一个选项是在select_if中添加另一个条件

library(dplyr)
mtcars %>% 
     as_tibble %>%
     mutate(today = today()) %>% 
     select_if(~ is_double(.) && !inherits(., "Date"))
# A tibble: 32 x 10
#     mpg  disp    hp  drat    wt  qsec    vs    am  gear  carb
#   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# 1  21    160    110  3.9   2.62  16.5     0     1     4     4
# 2  21    160    110  3.9   2.88  17.0     0     1     4     4
# 3  22.8  108     93  3.85  2.32  18.6     1     1     4     1
# 4  21.4  258    110  3.08  3.22  19.4     1     0     3     1
# 5  18.7  360    175  3.15  3.44  17.0     0     0     3     2
# 6  18.1  225    105  2.76  3.46  20.2     1     0     3     1
# 7  14.3  360    245  3.21  3.57  15.8     0     0     3     4
# 8  24.4  147.    62  3.69  3.19  20       1     0     4     2
# 9  22.8  141.    95  3.92  3.15  22.9     1     0     4     2
#10  19.2  168.   123  3.92  3.44  18.3     1     0     4     4
# … with 22 more rows

dplyr 1.0.0 中,我们还可以使用whereselect

mtcars %>% 
   as_tibble %>% 
   mutate(today = today()) %>%
   select(where(~is_double(.) && !inherits(., "Date")))

【讨论】:

  • 感谢您简洁明了的回答!我最终使用is.numeric 来实现相同的结果。这是不好的做法吗?
  • @MokeEire 它正在使用当前版本的dplyr。不过,不能说它是否会在未来的版本中成为一个错误
猜你喜欢
  • 2017-02-10
  • 2018-03-10
  • 1970-01-01
  • 1970-01-01
  • 2014-10-05
  • 2014-02-02
  • 1970-01-01
  • 1970-01-01
  • 2015-06-22
相关资源
最近更新 更多