【发布时间】:2018-11-02 00:16:44
【问题描述】:
目标是在每一行的数据框中的名为“text”的文本列中查找和替换来自 pdf 解析的工件。
"<U+FB01>" 将替换为 "fi" &
"<U+FB02>" 将被替换为 "fl"
df<-data.frame(text=c('Das neue P<U+FB02>ege<U+FB01>nanzierungsgesetz','Die Kon<U+FB02>ikte zwischen Spitalrat und','Im neuen Spital<U+FB01>nanzierungsgesetz, welches'))
应该是:
df2<-data.frame(text=c('Das neue Pflegefinanzierungsgesetz','Die Konflikte zwischen Spitalrat und','Im neuen Spitalfinanzierungsgesetz, welches'))
数据框截图:https://i.imgur.com/UvFIrNg.png
我能找到最接近的解决方案(但无法使其工作):Searching text within a column and completely replace
感谢您的宝贵时间!
【问题讨论】:
-
请包含一个有代表性的、最少的文本和代码示例。屏幕截图没有帮助,因为我们无法复制和粘贴数据。
标签: r