【发布时间】:2011-01-06 01:14:43
【问题描述】:
我没有找到任何文档或教程。有这样的东西吗?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
上面的代码将在任何地方为我提供任何tbody 子级且属性id 等于“threadbits_forum_251”的table。但是为什么它以双//开头?为什么最后有/tr?详情请参阅“Ruby Nokogiri Parsing HTML table II”。
谁能告诉我如何使用 Nokogiri 提取 href、id、alt、src 等?
td[3]/div[1]/a/text()' <--- extracts text
我怎样才能提取其他东西?
【问题讨论】: