【发布时间】:2014-11-13 23:06:24
【问题描述】:
您好:我想取消联邦选举区 - 2003 年子表“安大略省”的代表令。网址在这里:http://www.elections.ca/content.aspx?section=res&dir=cir/list&document=index&lang=e#list
我已经尝试过这段代码,它让我很接近,但并不完全在那里。
doc<-htmlParse('http://www.elections.ca/content.aspx?section=res&dir=cir/list&document=index&lang=e#list', useInternalNodes=TRUE)
doc2<-getNodeSet(doc, "//table/caption[text()='Ontario']")
我知道我可以使用 readHTMLTable 来简单地执行此操作,只需找到特定的表,但我也想知道如何选择与 Ontario 相同的标题节点的兄弟节点。 谢谢
【问题讨论】:
标签: xml r xpath web-scraping