【发布时间】:2022-01-21 19:43:39
【问题描述】:
我有从html_text()得到的字符串
感到酸痛 — болеть感到酸痛 — страдать; мучиться
但应该是这样的
感到疼痛 — болеть
感到疼痛 — страдать; мучиться
问题是,rvest 无法区分空格和换行符,但我只需要以某种方式获取第一行“feel sore — болеть”。
我尝试使用stringr::str_extract(),但失败了。我该怎么办?
UPD:好的,我发现有html_text2(),但仍然可以使用正则表达式吗?
【问题讨论】:
-
试试
html_text2()而不是html_text() -
这是来自我们可以访问的网站吗?
-
@QHarr 确定 wooordhunt.ru/word/feel%20sore