【问题标题】:Understanding ddply error message - argument "by" is missing, with no default了解 ddply 错误消息 - 缺少参数“by”,没有默认值
【发布时间】:2015-11-19 15:12:46
【问题描述】:

我试图弄清楚为什么我在使用 ddply 时收到错误消息。

示例数据:

data<-data.frame(area=rep(c("VA","OC","ES"),each=4),
    sex=rep(c("Male","Female"),each=2,times=3),
    year=rep(c(2009,2010),times=6),
    bin=c(110,120,125,125,110,130,125,80,90,90,80,140),
    shell_length=c(.4,4,1,2,.2,5,.4,4,.8,4,.3,4))

bin7<-ddply(data, .(area,year,sex,bin), summarize,n_bin=length(shell_length))

错误信息: .fun(piece, ...) 中的错误:缺少参数“by”,没有默认值

我昨天收到了这个错误信息。我重新启动 R 并重新运行代码,一切都很好。今天早上我再次收到错误消息,重新启动 R 并没有解决问题。

我还尝试运行一些示例 code 并得到相同的错误消息。

  # Summarize a dataset by two variables
require(plyr)
dfx <- data.frame(
  group = c(rep('A', 8), rep('B', 15), rep('C', 6)),
  sex = sample(c("M", "F"), size = 29, replace = TRUE),
  age = runif(n = 29, min = 18, max = 54)
)

# Note the use of the '.' function to allow
# group and sex to be used without quoting
ddply(dfx, .(group, sex), summarize,
 mean = round(mean(age), 2),
 sd = round(sd(age), 2))

R 信息

R version 3.2.1 (2015-06-18)
Platform: i386-w64-mingw32/i386 (32-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1

locale:
[1] LC_COLLATE=English_United States.1252 
[2] LC_CTYPE=English_United States.1252   
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C                          
[5] LC_TIME=English_United States.1252    

attached base packages:
[1] grid      stats     graphics  grDevices utils     datasets 
[7] methods   base     

other attached packages:
 [1] Hmisc_3.17-0        ggplot2_1.0.1       Formula_1.2-1      
 [4] survival_2.38-1     car_2.0-26          MASS_7.3-40        
 [7] xlsx_0.5.7          xlsxjars_0.6.1      rJava_0.9-7        
[10] plyr_1.8.3          latticeExtra_0.6-26 RColorBrewer_1.1-2 
[13] lattice_0.20-31  

如果有人能解释为什么会发生这种情况,我将不胜感激。

谢谢

【问题讨论】:

  • 无法使用相同版本的 plyr 重现错误。您是否同时加载了plyrdplyr
  • 我没有收到错误。但我将数据框命名为d。该公式也有效:ddply(d, ~ area+year+sex+bin, summarize,n_bin=length(shell_length))
  • dplyrplyr 都有名为 summarize 的函数。你可能也加载了dplyrdetach 两个包,然后在加载 dplyr 之前加载 plyr
  • 看起来你最后加载了Hmisc,它还有一个summarize函数(在你的错误中有一个by参数)。加载包时注意这些消息 - 你会得到有关屏蔽的重要信息。
  • 您也可以指定plyr::summarize(...)以确保安全

标签: r plyr


【解决方案1】:

正如 Narendra 对该问题的评论中所述,此错误可能是由于加载了其他具有称为 summarize(或 summarise)的函数的包,该函数不能用作 plyr 中的函数。例如:

library(plyr)
library(Hmisc)

ddply(iris, "Species", summarize, mean_sepal_length = mean(Sepal.Length))
#> Error in .fun(piece, ...) : argument "by" is missing, with no default

一种解决方案是使用:: 和正确的命名空间调用正确的函数:

ddply(iris, "Species", plyr::summarize, mean_sepal_length = mean(Sepal.Length))
#> Species mean_sepal_length
#> 1     setosa             5.006
#> 2 versicolor             5.936
#> 3  virginica             6.588

或者,可以分离具有错误功能的包:

detach(package:Hmisc)
ddply(iris, "Species", summarize, mean_sepal_length = mean(Sepal.Length))
#> Species mean_sepal_length
#> 1     setosa             5.006
#> 2 versicolor             5.936
#> 3  virginica             6.588

最后,如果一个人同时需要这两个包并且不想打扰::,可以按另一种顺序加载它们:

library(Hmisc)
library(plyr)

ddply(iris, "Species", summarize, mean_sepal_length = mean(Sepal.Length))
#> Species mean_sepal_length
#> 1     setosa             5.006
#> 2 versicolor             5.936
#> 3  virginica             6.588

【讨论】:

    【解决方案2】:

    我遇到了类似的问题(使用不同的数据集,但错误消息相同),但我发现 ddplyr 使用了英国拼写“summarise”。一旦我进行了拼写更改,代码就起作用了。

    这是我使用的代码。当我使用“z”拼写时,我收到错误消息Error in .fun(piece, ...) : argument "by" is missing, with no default;但改成“s”就解决了。

    library(plyr)
    ddply(InsectSprays,.(spray),summarise,sum=sum(count))
    

    【讨论】:

    【解决方案3】:

    @CoderGuy123 的回答很好,但我想再添加一个我更喜欢建议的解决方案。

    如果你想加载两个有名字冲突的包,你可以通过简单的赋值来控制使用哪个特定的函数:summarize &lt;- plyr::summarize

    例子:

    library(plyr)
    library(Hmisc)
    
    ddply(iris, "Species", summarize, mean_sepal_length = mean(Sepal.Length))
    #> Error in .fun(piece, ...) : argument "by" is missing, with no default
    
    summarize <- plyr::summarize
    
    ddply(iris, "Species", summarize, mean_sepal_length = mean(Sepal.Length))
    #> Species mean_sepal_length
    #> 1     setosa             5.006
    #> 2 versicolor             5.936
    #> 3  virginica             6.588
    

    【讨论】:

      猜你喜欢
      • 2016-06-08
      • 2017-12-09
      • 2020-07-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-06-29
      • 1970-01-01
      相关资源
      最近更新 更多