【发布时间】:2019-04-15 14:26:44
【问题描述】:
目前,我的数据框正在打印出 2 个数据框,但我希望它只是一个数据框,其中包含从 omp_name_lists and comp_rating_lists 传递的所有值。我知道该函数正在逐页传递值,所以我想知道如何告诉 python 等待所有页面值追加,然后 create_dataframe。
def get_data(get_comp_name,get_comp_rating):
comp_name_lists, comp_rating_lists = [],[]
for i, v in zip(get_comp_name, get_comp_rating):
comp_name_lists.append(i.a.text)
comp_rating_lists.append(v.text)
return create_dataframe(comp_name_lists,comp_rating_lists)
def create_dataframe(comp_name_lists,comp_rating_lists): # This is where
"""This gets all of our data that we scraped and stores into a pandas dataframe"""
df = pd.DataFrame({'CompanyName' : comp_name_lists, 'CompanyRating' : comp_rating_lists})
df = df.reset_index(drop=True)
print(df)
期望的输出:
A B
0 a 3
1 b 7
2 c 1
3 d 2
4 e 8
5 f 9
6 g 7
7 h 8
【问题讨论】:
标签: python python-3.x web-scraping beautifulsoup request