将通过 html 标签包围的每个文本放入一个数组中？答案

【问题标题】：put each text surrounded via html tag, into an array?将通过 html 标签包围的每个文本放入一个数组中？
【发布时间】：2009-10-03 15:18:47
【问题描述】：

使用nokogiri，

doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_s

这可以完成工作，但是，它将所有内容都放在一个平面文本中。

我需要通过 html 标签获取每个文本

<b> text</b>
<h1>text3</b>

并将它们放入数组中。 [“文本”，“文本3”]

推荐的操作是什么？

我想过做

doc.xpath("*").text

但不知道如何遍历所有内容。

【问题讨论】：

【解决方案1】：

doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_a

【讨论】：