【发布时间】:2017-12-08 06:09:54
【问题描述】:
我正在尝试创建一个包含以下列的数据框:名字、姓氏、政党、州、会员 ID。这是我的代码
library('rvest')
candidate_url <- 'https://www.congress.gov/help/field-values/member-bioguide-ids'
candidate_page <- read_html(candidate_url)
candidate_nodes <- html_nodes(candidate_page, 'table')
candidate_list <- html_text(candidate_nodes)
我的主要问题是获取成员 ID。示例 ID 为 A000009。当我使用 gsub 函数时,我在这个例子中失去了前导 A。 A 来自该候选人的姓氏 (Abercrombie),但我不知道如何将 A 添加回会员 ID。当然,如果有更好的方法,我愿意接受任何建议。
【问题讨论】:
标签: r web-scraping html-parsing rvest