【发布时间】:2017-03-19 17:24:56
【问题描述】:
(Python 新手和第一篇文章)
请参阅下面的代码,但问题是: 我正在尝试在代码中抓取页面上所有职位名称的网页,但是当我打印列表时,我没有得到任何值。我尝试使用不同的 xpath 来查看是否可以打印一些东西,但每次我的列表总是空的。
有谁知道这是我的代码有问题,还是我没有考虑到网站结构的问题?
提前致谢!
from lxml import html
import requests
page = requests.get("https://careers.homedepot.com/job-search-results/?location=Atlanta%2C%20GA%2C%20United%20States&latitude=33.7489954&longitude=-84.3879824&radius=15&parent_category=Corporate%2FOther")
tree = html.fromstring(page.content)
Job_Title = tree.xpath('//*[@id="widget-jobsearch-results-list"]/div/div/div/div[@class="jobTitle"]/a/text()')
print (Job_Title)
【问题讨论】:
-
忘记跟进这一点,但我想我会指出 Selenium 做到了。有关更多信息,请参见下文。
标签: python python-3.x xpath web-scraping lxml