【发布时间】:2018-04-09 04:00:14
【问题描述】:
您好,我正在尝试通过使用包 rvest 以 R 语言抓取网页来获取有关此网页的少量信息。我得到了名字和一切,但我无法获得电子邮件 ID,即 info@brewhemia.co.uk。如果我在 read_html 中看到文本,我在 html 解析文本中看不到电子邮件 ID。有人可以帮忙吗?我是网络抓取的新手。但我知道 R 语言。
link <- 'https://food.list.co.uk/place/22191-brewhemia-edinburgh/'
page <- read_html(link)
name_html <- html_nodes(page,'.placeHeading')
business_adr <- html_text(adr_html)
tel_html <- html_nodes(page,'.value')
business_tel <- html_text(tel_html)
【问题讨论】:
-
因为是js动态创建的。检查页面来源。
-
很想听听是否有帮助!
标签: r screen-scraping