【发布时间】:2018-05-13 15:48:08
【问题描述】:
我一直在寻找其他主题的解决方案,但没有找到。我正在寻找几个部分字符串匹配。字符串在数据框中,但我也在(字符)向量中尝试过。
示例输入:
authors <- c("Edward","Kelly","Simon")
df <-
Text Date
Edward was the king of ... 2011
Kelly has .. 2014
Last year Simon.. 2009
Did you know Edward.. 1999
我想要的输出是:
Author Count
Edward 2
Kelly 1
Simon 1
同样重要的是,列文本中的每一行只匹配一次。因此,如果名称在输入单元格中被提及两次,它仍然应该只匹配一次。
我尝试过类似的方法:
sum(str_count(df$Text,c("Edward")))
这适用于一个输入名称,但不适用于多个。我希望有人可以帮助我解决这个问题
【问题讨论】:
标签: r string count pattern-matching