【发布时间】:2016-11-26 07:44:32
【问题描述】:
我有一个给定的单词列表,例如:
words <- c("breast","cancer","chemotherapy")
我有一个非常大的数据框、1 个变量和超过 10,000 个条目(行)。
我想选择“单词”中包含任何单词的所有行。不仅是某个单词,“单词”中的任何单词都很重要。包含“words”中的多个单词也很重要。
如果我知道“单词”是什么,我可以多次提取字符串。然而,“字”每时每刻都在变化,看不出来。有什么直接的方法吗?
此外,我是否可以选择“单词”中包含 2 个或更多单词的所有行?例如。只包含“cancer”不算,但包含“breast”和“cancer”算。再一次,“词”每次都在变化,而且看不到。有什么直接的方法吗?
【问题讨论】: