【问题标题】:Why the tidyselect helper function "where" can be detected inside the dplyr helper function "across"?为什么可以在 dplyr 辅助函数“across”中检测到 tidyselect 辅助函数“where”?
【发布时间】:2020-11-13 06:39:05
【问题描述】:

“tidyselect”包提供了一个选择帮助函数wherewhere 用于选择具有自定义功能的数据框列。它是“tidyselect”的一个内部函数。这意味着where 不会加载到您的命名空间中,您只能通过tidyselect:::where 调用它。

但是,我从dplyr vignettes: columnwise operations 看到了以下示例。

starwars %>% 
  summarise(across(where(is.character), ~ length(unique(.x))))
#> # A tibble: 1 x 8
#>    name hair_color skin_color eye_color   sex gender homeworld species
#>   <int>      <int>      <int>     <int> <int>  <int>     <int>   <int>
#> 1    87         13         31        15     5      3        49      38

在此示例中,where 的编写没有前缀“tidyselect:::”,但很明显,代码中没有错误,它产生了有意义的结果。这对我来说似乎很奇怪。我想知道为什么代码正常运行。

我猜这是由于“代码引用”,这是 tidyeval 方法的一部分。粗略地说,代码引用将代码作为表达式挂起,然后在“内部环境”中评估表达式。这只是一个直观的猜测,我不知道如何测试它。

我希望有人可以帮助我解决“哪里”问题,或者为我留下一些关于代码如何运行的参考。

【问题讨论】:

  • dplyr 包导入 tidyselect 包,因此 tidyselect 函数可用于 dplyr 代码,但不附加到全局搜索路径。
  • @MrFlick 自从我制作最后一个 R 包以来已经有一段时间了,但是在描述文件中导入包只确保包可用。如果你想使用其中的函数,你仍然需要通过它们的限定名来调用它们——即使是包内部代码。
  • @AEF 用户需要使用命名空间来限定函数,但如果包使用非标准评估,则包可以在他们喜欢的任何环境/命名空间中评估这些符号。因此,他们可以将未计算的表达式传递给适当的 tidyselect 函数,并且 tidyselect 将可以访问其命名空间中的所有函数。

标签: r dplyr tidyverse tidyselect


【解决方案1】:

您没有说明示例中附加了哪些包,但我们假设唯一附加的包是 dplyr

library(dplyr)

首先,我们注意到函数 where 没有附加,即当前 R 会话不知道。我们可以通过在控制台中输入它的名字(不带括号)来检查。如果附加了该函数,我们现在将看到它的源代码。相反,我们得到一个错误,即找不到对象 where

但是,我们注意到dplyr 附加了来自tidyselect 的其他函数,starts_with 就是一个例子。如果我们重复在控制台输入名称的实验,我们现在可以看到源代码,并且这些函数源自 tidyselect 命名空间:

> starts_with
function (match, ignore.case = TRUE, vars = NULL) 
{
    check_match(match)
    vars <- vars %||% peek_vars(fn = "starts_with")
    if (ignore.case) {
        vars <- tolower(vars)
        match <- tolower(match)
    }
    flat_map_int(match, starts_with_impl, vars)
}
<bytecode: 0x0000027338e5f8e8>
<environment: namespace:tidyselect>

在这种情况下,函数 starts_with 由 dplyr 使用 NAMESPACE 文件附加,您可以在该文件中列出应与您的包一起附加的其他包中的函数。您可以签入dplyrsource code

但是正如我们已经看到的那样,where 并没有以这种方式提供。在这种情况下,该函数确实被引用并且仅在 tidyselect 包中进行评估。如果您查看source code for across,您会注意到在第82 行,列规范被传递给在同一文件中定义的函数across_setup。在此函数中,列规范被引用(第 174、175 行),然后发送到 tidyselect 函数 tidyselect::eval_select(第 177 行)。这个函数是 tidyselect 包的一部分,可以访问where

【讨论】:

  • 很好的解释!很高兴知道 为什么 where 的处理方式与其他选择帮助程序不同(即不重新导出),但这可能只能来自开发人员自己。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2014-12-02
  • 2021-01-03
  • 1970-01-01
  • 2014-01-23
  • 2021-05-24
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多