【问题标题】:Ruby Nokogiri extract HTML tab valueRuby Nokogiri 提取 HTML 选项卡值
【发布时间】:2016-06-13 06:49:20
【问题描述】:
有一个包含许多页面的网页。我想知道每次搜索的总页数。
如下图所示。由于最后一页是第 41 页,因此它变得不可点击。所以我想从这两个跨度标签中提取值 41 。
有什么帮助吗?
我尝试使用 xpath。但更喜欢 CSS 解决方案
谢谢
page_temp = Nokogiri::HTML(browser.html)
page_temp.xpath('tr[@td = "colspan="32""]').each do |node|
puts node.text
Click here to view the snapshot
【问题讨论】:
标签:
html
css
ruby
xpath
nokogiri
【解决方案1】:
由于您使用的是 Ruby,这里有一个简单的代码,您可以使用
page_temp = Nokogiri::HTML(browser.html)
all_pages = page_temp.search("td[colspan='32'] tr td")
puts all_pages.map{|p| p.text} # list all page numbers
puts all_pages.last.text # list the last page number