【发布时间】:2021-06-29 07:24:46
【问题描述】:
我正在查看一个从网站抓取文本数据并努力从特定部分获取所有文本的示例,特别是该文本框有一个名为“阅读更多”的字段。
我尝试了不同的 css 选择器(使用 Selector Gadget 识别)但没有成功,并且捕获的文本不是所有可用的文本。
关于如何获取完整文本字段的任何想法?
谢谢!
library(rvest)
link = "https://www.property24.com/for-sale/camps-bay/cape-town/western-cape/11014/109734849"
html_link = read_html(link)
# Method 1
text1 = html_link %>%
html_nodes(css = ".js_readMoreText") %>%
html_text()
text1
# Method 2
text2 = html_link %>%
html_nodes(css = ".js_readMore") %>%
html_text()
text2
# Method 3
text3 = html_link %>%
html_nodes(css = ".expanded , .js_readMoreText") %>%
html_text()
text3
【问题讨论】:
标签: r web-scraping css-selectors rvest