【发布时间】:2018-07-17 05:40:04
【问题描述】:
我正在尝试使用 rvest 从本网站 http://www.napo.net/search/newsearch.asp 中获取专业人士的姓名、城市、州、电子邮件等,但我似乎无法使用选择器小工具获取 CSS 选择器,并且电子邮件受到保护使用 JavaScript。
我查看了论坛,没有看到任何类似的问题。
【问题讨论】:
-
该搜索结果页面上的成员详细信息通过鼠标悬停显示。似乎有指向这些单个成员详细信息页面的链接。如果您访问这些页面中的每一页并从那里刮掉它会怎样?您可以通过 id 'SearchResultsGrid' 抓取每个成员的 id 链接
-
您对各个会员页面很感兴趣,但我无法抓取指向他们个人资料的链接。我使用“SearchResultsGrid”作为“html_nodes”(rvest 包)中的选择器,它返回一个空列表
-
实际的搜索结果页面使用 iframe 元素嵌入到您发布的链接中。我发布下面的代码以使用实际搜索结果链接获取成员列表。
标签: javascript r web-scraping css-selectors