【发布时间】:2017-02-22 14:07:06
【问题描述】:
我需要一些帮助。我的输出似乎是错误的。如何正确附加 dept、job_title、job_location 的值。并且有带有dept值的html标签。我怎样才能删除这些标签。
我的代码
response = requests.get("http://hortonworks.com/careers/open-positions/")
soup = BeautifulSoup(response.text, "html.parser")
jobs = []
div_main = soup.select("div#careers_list")
for div in div_main:
dept = div.find_all("h4", class_="department_title")
div_career = div. find_all("div", class_="career")
title = []
location = []
for dv in div_career:
job_title = dv.find("div", class_="title").get_text().strip()
title.append(job_title)
job_location = dv.find("div", class_="location").get_text().strip()
location.append(job_location)
job = {
"job_location": location,
"job_title": title,
"job_dept": dept
}
jobs.append(job)
pprint(jobs)
应该是这样的
{'job_dept':咨询,
'job_location':'伊利诺伊州芝加哥'
'job_title':高级顾问 - Central'
每个变量有 1 个值。
【问题讨论】:
-
请显示你得到的输出...
-
输出将显示,job_dept:所有部门,job_location:所有位置,job_title:所有标题
标签: python-3.x beautifulsoup append