【问题标题】:Scanning each HTML node with nokogiriScanning each HTML node with nokogiri
【发布时间】:2010-12-16 12:00:36
【问题描述】:

我们如何使用 Nokogiri 扫描 HTML 文档的每个元素和子元素,并测试当前标签是否为块?

根据http://wiki.github.com/tenderlove/nokogiri/examples,我们可以使用以下方法测试一个元素是否是一个块:

element[:class] == "block"

但我不知道如何扫描和测试每个 HTML 文件...

谢谢。

【问题讨论】:

  • “是块”是什么意思?您是在谈论“块元素”(如w3.org/TR/html4/sgml/dtd.html#block)吗?如果是这样,我认为您只需要检查每个已知的标记名。
  • 是的,每个块元素:div、p、h1、h2等。谢谢你的回答。

标签: ruby nokogiri


【解决方案1】:

非常有用的traverse 函数可以让您遍历文档的每个元素。 See the doc.

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-09-25
    • 2012-12-15
    • 2012-12-27
    • 2012-07-16
    • 1970-01-01
    • 2018-10-28
    • 2014-09-27
    • 2018-01-15
    相关资源
    最近更新 更多