【发布时间】:2020-12-24 21:24:45
【问题描述】:
首先要做的是,已经有一段时间了,所以我正在努力重新投入我的游戏。
我正在申请工作,并希望通过将其刮掉来跟踪我申请的工作。只是,最后的位仍然被索引,我只想包含与该列相关的内容。我似乎在努力工作。
从网站上提取后,我申请日期的索引如下所示: Date_Applied:[[[我申请]],[今天]]
我的桌子最终如下所示。你可以看到括号以及为什么我不想添加,“我申请”,“申请提交”:
+---------------------------------------------------+--------------------------------------+--------------------------------------+----------------------+
| Position | Company | Date_Applied | Number_of_Applicants |
+---------------------------------------------------+--------------------------------------+--------------------------------------+----------------------+
| Renovation/Construction Underwriter | Ignite Human Capital | Remote | [[[I applied]], [Today]] | [1-10 applicants] |
| Scientific Computing | CG-VAK Softwares USA Inc | Remote | [[[Application submitted]], [Today]] | [1-10 applicants] |
| Data Analytics Engineer | Delta Defense LLC | West Bend, WI | [[[I applied]], [Today]] | [1-10 applicants] |
| Data Analyst - Tableau - Alteryx - Insurance e... | Grapevine Technology | United States | [[[Application submitted]], [Today]] | [100+ applicants] |
| Technology Integration Specialist | KAGE Innovation | Osceola, WI | [[[Viewed by employer]], [Today]] | [1-10 applicants] |
+---------------------------------------------------+--------------------------------------+--------------------------------------+----------------------+
我希望有一种方法可以选择最后一个元素而不删除第一个元素。 有没有人有任何想法?抱歉,我的措辞可能很尴尬。
我的 For 循环如下所示:
import pandas as pd
data = []
for i in soup.find_all('div', {'class': 'atw-AppCard-mainContainer'}):
job_title = i.find('a', {'class': 'atw-JobInfo-jobTitle'}).text.strip()
company_name = i.find('div', {'class': 'atw-JobInfo-companyLocation'}).text.strip()
number_of_applicants = i.find('span', {'class': 'atw-JobInfo-applicantCount'})
date= i.find('div', {'class': 'atw-Disposition-value'})
mytable = {'Position': job_title,
'Company': company_name,
'Date_Applied':date,
'Number_of_Applicants': number_of_applicants}
data.append(mytable)
df = pd.DataFrame(data)
df.head()
【问题讨论】:
-
您能否编辑您的问题以包含问题的最简单形式以及预期输出的示例?
-
可以分享网址吗?
标签: python pandas web-scraping datatables jupyter-notebook