【发布时间】:2011-02-12 23:16:15
【问题描述】:
您好,我有一个文档,我正在尝试从中提取日期。但问题出在节点内,而且日期也是一些文本。类似的东西
<div class="postHeader">
Posted on
July 20, 2009 9:22 PM PDT
</div>
从这个标签我只想要日期项目而不是发布在文本上。类似的东西
./xhtml:div[@class= 'postHeader']
正在得到一切。准确地说,我拥有的文档基本上是这些元素的节点列表,例如,我将获得这些元素的 10 个具有不同日期值的节点,但更糟糕的是,问题有时在这些标签内,一些随机的其他标签也会像锚一样弹出我们等等。我可以写一个通用的 expath 来获取 div 标签中的日期吗?
【问题讨论】:
-
那么,所有
postHeader内部文本节点可以完全不同? -
是的,但很细微。他们可能有一个额外的
<a>标签或<br>,但就是这样,所有 postHeader 都有一个日期
标签: xml xhtml function xpath substring