【发布时间】:2021-03-13 20:44:48
【问题描述】:
我想将 X1 列中的文本与 X2 列中的文本进行比较 和 生成出现在 X1 但不在 X2 中的单词列表,反之亦然。例如:
df <- data.frame("X1" = c("the fox ate grapes", "the cat ate"), "X2" = c("the fox ate watermelon", "the cat ate backwards"))
我正在尝试生成列,例如 X3 - 葡萄西瓜 X4 - 向后
数据框有数百行,部分单元格中的文本最多50个字左右。
【问题讨论】:
标签: r string text iteration corpus