【发布时间】:2017-02-03 16:28:33
【问题描述】:
我在 python 中使用 xpath 从 html 文件中解析表。我正在使用这个 xpath:
//td//text()
这给了我两个字符串的输出:
['australia', '$3333.99']
我想要的输出:
['australia', '3333.99']
但我想去掉 $ 符号,我一般如何使用 xpath 来做到这一点?我试过substring-after,但它不起作用。
我就是这样尝试的:
//td//text()[substring-after(.,'$')]
但我得到了这个输出:
['$3333.99']
结果中缺少Australia
【问题讨论】:
-
您尝试的表达式在 XPath 2.0 中很好,但在 XPath 1.0 中不行。您应该指定正在使用的 XPath 版本。虽然它不能完全满足您的要求:尝试
//td//text()/substring-after(.,'$')