【问题标题】:put each text surrounded via html tag, into an array?将通过 html 标签包围的每个文本放入一个数组中?
【发布时间】:2009-10-03 15:18:47
【问题描述】:

使用nokogiri,

doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_s

这可以完成工作,但是,它将所有内容都放在一个平面文本中。

我需要通过 html 标签获取每个文本

<b> text</b>
<h1>text3</b>

并将它们放入数组中。 [“文本”,“文本3”]

推荐的操作是什么?

我想过做

doc.xpath("*").text

但不知道如何遍历所有内容。

【问题讨论】:

  • 你最好保留同一个老问题并添加评论。
  • 是的,我知道,但它不会认出我是最初的提问者。

标签: ruby xpath nokogiri


【解决方案1】:
doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_a

【讨论】:

  • 哇这真的很好用!它甚至可以处理仅由
    标签
    分隔的事物
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-03-21
  • 2013-11-13
  • 2013-06-16
  • 1970-01-01
相关资源
最近更新 更多