【发布时间】:2018-03-13 08:15:49
【问题描述】:
例如这个 HTML
<div>
<span></span> I want to find this <b>this works ok</b>.
</div>
我想找到一个包含I want to find this 的 DIV,然后抓取该 DIV 中的整个文本,包括子元素
我的 XPATH,//*[contains(text(), 'I want to find this')] 根本不起作用。
如果我这样做 //*[contains(text(), 'this works')] 它可以工作,但我想根据 I want to find this 文本找到任何 DIV
但是,如果我从该 HTML 中删除 <span></span>,它会起作用,这是为什么呢?
【问题讨论】:
-
将标题更新为 “为什么这个 Xpath 不起作用?” 根本没有提供任何信息。另请注意,
//*[contains(text(), 'this works')]实际上不起作用。只能返回b,不能返回div -
@Umair,如果您想使用 css 选择器找到解决方案,那么这项工作有一个解决方案。
-
@Shahin 我实际上使用包含选择器
标签: parsing xpath web-scraping html-parsing