【发布时间】:2020-08-25 19:43:12
【问题描述】:
我一直试图从网页https://www.list-org.com/company/11665809 中获取托管在<div> 元素中的全文。
该元素应包含一个子字符串“Арбитраж”。
确实如此,因为我的代码
for div in tree.xpath('.//div[contains(text(), "Арбитраж")]'):
print(div)
返回响应
Element div at 0x15480d93ac8
但是当我尝试使用方法div.text 获取全文本身时,它返回None
我认为这是一个奇怪的结果。
我该怎么办?
任何帮助将不胜感激。
以及关于学习 HTML 基础知识的源建议(不是一个精明的程序员),以避免将来出现这样简单的问题。
【问题讨论】:
标签: python html lxml lxml.html