【发布时间】:2017-10-30 12:10:47
【问题描述】:
我正在从网站上抓取数据,所有数据都在表中。我想为所有表格信息创建一个数据框。
我正在使用下面的代码来获取表格信息。
all_table_info = html_soup.find('table', class_ = "views-table cols-4")---to get all the table info
for name in all_table_info.find_all('td',class_ = "views-field views-field-field-lastname active"):
print (name.text)
for organization in all_table_info.find_all('td', class_ = "views-field views-field-field-employer") :
print (organization.text)
我需要创建一个数据框,为名称和组织创建 2 个列。
name Organization
abcv fgvf
dfdf ghgjh
dfgdg hgjh
fgfg hkh
有没有办法做到这一点。
【问题讨论】:
-
您是否有任何示例网站正在尝试使用这些类名进行抓取?
标签: python pandas web-scraping beautifulsoup