【发布时间】:2018-09-28 17:33:19
【问题描述】:
我有一个这样的字符串向量:
"I love Mangoes." , "I love Mangoes and Apples." , "Apples are good for health" , "I live in America" , "I love Mangoes and Apples and Strawberries." , "Mangoes and Apples." , "Mangoes and Apples and Honey"
我想要一个字符串向量,它将过滤掉输入向量的任何元素的任何完整子字符串匹配。 也就是说,结果会是这样的:
"Apples are good for health" , "I live in America" , "I love Mangoes and Apples and Strawberries." , "Mangoes and Apples and Honey"
顺序无关紧要。 在这里,前两个条目被删除,因为它们是倒数第三个条目的子字符串。删除倒数第二个条目,因为它也是先前条目的子字符串。
任何帮助将不胜感激。这是我对语料库进行的短语检测的一部分。
【问题讨论】: