【问题标题】:HTML Parser into DOM in Ruby在 Ruby 中将 HTML 解析器转换为 DOM
【发布时间】:2012-11-27 07:48:52
【问题描述】:

Ruby 中是否有任何 HTML 解析器可以将 HTML 文档读入 DOM 树并将 HTML 标签表示为 DOM 元素?

我知道 Nokogiri,但它不会将 HTML 解析为 DOM 树。

【问题讨论】:

  • Nokogiri 的默认设置在我看来非常像 DOM 树,你为什么说它不是?

标签: html ruby dom html-parsing nokogiri


【解决方案1】:

尽管你这么说,Nokogiri 是要走的路:

doc = Nokogiri::HTML('<body><p>Hello, worlds!</body>')

它甚至会解析无效的 HTML 并返回一个 DOM 树:

>> doc.class
=> Nokogiri::HTML::Document
>> doc.root.class
=> Nokogiri::XML::Element
>> doc.root.children.class
=> Nokogiri::XML::NodeSet
>> doc.root.children.first.content
=> "Hello, worlds!"

【讨论】:

  • 我会更深入地研究它。谢谢。
  • @qlinux 不客气!如果您遇到更多问题,只需将它们发布在 SO 上并用 nokogiri 标记它们,我正在关注该标记。 Nokogiri 是一个强大而有趣的宝石!
  • @the-tin-man 感谢您的编辑!既然你已经准备好了,你能不能重新打开stackoverflow.com/questions/13769217,这样我就可以为那位先生提供他正在寻找的答案? :)
  • 你需要gem install nokogiri(如果还没有)(随rails分发),并在你的代码中require 'nokogiri'
猜你喜欢
  • 2011-01-12
  • 1970-01-01
  • 2011-01-04
  • 2016-10-18
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-08-25
  • 1970-01-01
相关资源
最近更新 更多