【发布时间】:2018-09-21 11:09:38
【问题描述】:
我正在使用“Scrapes”wordpress 插件。
我想从特定的 div 中提取所有段落。
<div id="main" class="col-md-9 col-sm-8">
<div class="inside-post">
<p>One</p>
<p>Two</p>
<p>Three</p>
</div>
</div>
下面的代码只返回第一项:
//div[@id="main"]/div[contains(concat(" ", normalize-space(@class), " "), " inside-post ")]/p[1]
One
但我想要所有三个:
One
Two
Three
请帮忙。提前谢谢。
【问题讨论】:
-
只是为了让您知道您的 XML 示例对您发布的 XPath 没有帮助,因为您的 XPath 期望另一个
div的 id 为main作为div的父级在你的例子中。最好发布实际与您询问的 XPath 一起使用的 XML 示例。 -
我认为没有必要。这是可以理解的。
-
如果您希望人们确定您的问题,这是必要的。另外,请在您的问题中添加更多信息,因为我在回答中给您的 XPath 返回所有 3 个
p元素。 -
您的代码未返回所有元素。谢谢。如果您的回答未被其他人接受,请不要将任何人的问题降级。
-
我正在尝试提供帮助 - 我提供的 XPath 选择了您提供的 XML 示例中的所有三个
p元素。如果您仍然只得到第一个,那么问题可能出在其他地方 - 例如您实际上是如何使用此 XPath 的。如果没有这些信息,就很难知道您的问题是什么,因此如果您在问题中添加更多详细信息,它将帮助人们帮助您。
标签: wordpress xpath web-scraping domxpath