【发布时间】:2012-12-27 07:44:56
【问题描述】:
假设我们有以下html:
<html>
<body>
<a href="/1234.html">TEXT A</a>
<a href="/3243.html">TEXT B</a>
<a href="/7445.html">TEXT C</a>
<body>
</html>
如何让它找到包含“TEXT A”的元素“a”?
到目前为止,我得到了:
root = lxml.html.document_fromstring(the_html_above)
e = root.find('.//a')
我试过了:
e = root.find('.//a[@text="TEXT A"]')
但这不起作用,因为“a”标签没有属性“text”。
有什么方法可以以与我尝试过的方法类似的方式解决这个问题?
【问题讨论】:
-
你试过
:contains吗? -
参考unutbu的回答