【发布时间】:2018-12-05 13:38:12
【问题描述】:
我正在尝试从网页收集信息,但无法获得正确的 XPath 来找到它。以下是网站上的一段:
<div class="posted">
<div>
June 20, 2018
</div>
</div>
我想在每个页面中搜索显示“已发布”的分割类,然后将其下的所有内容作为字符串返回。 (一个凌乱的字符串是可以的;我将在“possibleDate”中使用“if”2018“来搜索年份)这是我正在尝试的:
possibleDate = str(tree.xpath("//div[contains(@class, ’posted’)]//@text"))
它说这是一个无效的表达式。
我做错了什么?
【问题讨论】:
-
请注意
[contains(@class, 'posted')]没有错,但我怀疑您的意图是[@class = 'posted']。 “包含”版本将匹配@class="signposted"; "=" 版本不会。