【发布时间】:2015-06-26 18:48:43
【问题描述】:
我有一个 df:
df <- data.frame(
x=c("ABC Inc", "DCV", "FGZ", "JH7 j11"),
y=c("ABC - fasjdlkjs", "DCV . (INC) .. kdhkfhksf", "FGZ / qiuwy72gs", "JH7 j11 dhd"),
target=c("fasjdlkjs", "inc kdhkfhksf", "qiuwy gs", "dhd")
)
其中x 是y 的接近子集,但不是精确子集
我想将x 中的所有内容gsub() 到y 中的""(空白),同时删除数字/标点符号。
我想要的输出存储在target
我认为这会奏效,但它没有:
df <- mutate(target = gsub(pattern=x, replacement="", y))
编辑:
分类:Y - X = Target
【问题讨论】: