【问题标题】:Extract date from text inside html tags using XPATH使用 XPATH 从 html 标签内的文本中提取日期
【发布时间】:2019-05-22 14:37:04
【问题描述】:

使用 xpath 子字符串提取 html 标签内的日期

我尝试在 xpath 中使用子字符串

<span id="latestReplyLine"><a href="#comment-965609" class="lastScroll js-latest-reply">Latest reply</a> on May 22, 2019 by John Stoltzfus</span>

我正在使用下面的 xpath 查询来提取文本

/span[@id="latestReplyLine"]/text()[substring-after(substring-before(.,' by '), ' on ')]

预期结果 -

"May 22, 2019"

但我明白了,

"on May 22, 2019 by John Stoltzfus"

有什么想法吗?

【问题讨论】:

    标签: html xml xpath extract


    【解决方案1】:

    您缺少一个空格的正确字符串(on 而不是on)。
    改进后的 XPath 表达式如下:

    normalize-space(substring-after(substring-before(string(/span[@id='latestReplyLine']),'by'), 'on'))
    

    这会给你正确的结果。

    【讨论】:

    • substring(/span,21,14) 怎么样?
    猜你喜欢
    • 2013-03-16
    • 2023-03-14
    • 1970-01-01
    • 2021-08-08
    • 2015-07-12
    • 1970-01-01
    • 2021-10-21
    • 2021-05-05
    相关资源
    最近更新 更多