【发布时间】:2014-02-20 00:00:02
【问题描述】:
我收到以下错误:
'pattern' must be a non-empty character string
尝试运行以下内容时:
rapply(as.list(Database1), function(x) agrep(x,Database2, max.distance=c(cost=1), value=T))
拥有大型数据库
> length(Database1)
[1] 15876500
> length(Database2)
[1] 605
但是当我用小的运行它时不是
> length(Database1)
[1] 29
> length(Database2)
[1] 8
我知道我应该提供可重现的代码,这样数据库就只有 15-25 个随机字母的字符串,可以使用以下方法生成:
Database1<- unlist(replicate(n, paste0(sample(LETTERS, m), collapse="")))
其中“n”是长度,“m”是 15-25 之间的整数。
【问题讨论】:
-
代码是可重现的,但是数据集丢失了,所以错误无法重现。