【发布时间】:2009-10-03 15:18:47
【问题描述】:
使用nokogiri,
doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_s
这可以完成工作,但是,它将所有内容都放在一个平面文本中。
我需要通过 html 标签获取每个文本
<b> text</b>
<h1>text3</b>
并将它们放入数组中。 [“文本”,“文本3”]
推荐的操作是什么?
我想过做
doc.xpath("*").text
但不知道如何遍历所有内容。
【问题讨论】:
-
你最好保留同一个老问题并添加评论。
-
是的,我知道,但它不会认出我是最初的提问者。