【发布时间】:2013-04-07 00:06:32
【问题描述】:
我需要解析网页中的表格。我在使用 Ruby 和 Nokogiri 之前已经这样做了,但是这次我的方法不起作用。这就是我正在做的:
response = RestClient.get "http://www.webpage.com?page=0"
doc = Nokogiri::HTML(response.body,nil,'utf-8')
doc.remove_namespaces!
table = doc.xpath(".//*[@id='contsinderecha']/form/table/tbody/tr[4]/td/table/tbody/tr[5]/td/table")
table 只是一个空数组。响应很好,如果我执行put response.body,我会得到网页的正文。
另外,为了获得我正在使用 firebug 的 XPath。
知道会发生什么吗?
【问题讨论】:
-
除了 xPath 看起来很长(彼此之间有 3 个表格,是表格设计吗?),我在您的代码中看不到任何明显的错误。您页面的 HTML(或 URL)会有所帮助。
-
也许这个 StackOverflow 问题有助于解决您的问题:stackoverflow.com/questions/9156650/…
-
remove_namespaces!和xpath用于 xml。对 html 使用 css。
标签: ruby web-scraping nokogiri