【发布时间】:2016-05-05 05:09:25
【问题描述】:
我在使用 xpath 获取网页中的元素时遇到了很多麻烦。我需要获取左侧和右侧的文本。 有 7 个类,所以会有 7 个。
我只需要与第一张照片相对应的文字。 以下只是一次尝试
result = session_requests.get(url, headers = dict(referer = url))
tree = html.fromstring(result.content)
grades = tree.xpath(".//div[@class='AssignmentClass'][1]//text()")
print grades
【问题讨论】:
-
哪个文本? 标签中的文本?整个 div dom?
-
对于动态生成的内容,您可以使用 selenium+phantomjs/Firefox 或 Splash。如果您正在寻找速度,请查看 scrapyJS
标签: python html xpath web-scraping