【发布时间】:2020-10-16 05:01:23
【问题描述】:
与我的上一个问题类似,我遇到了迭代问题。我正在使用代码
df1 = pd.DataFrame({'Username': [name.text for name in (soup.findAll('p',{'class':'profile-name'}))]})
从一个网页中获取名称列表。但是,当我对所有页面尝试此操作时,它会为每个页面创建新表,而不是将每个页面的输出附加在一起。
所以对于第 1 页,我会得到
Username
0 Alice
1 Bob
2 Carl
第 2 页:
Username
0 Sandra
1 Paula
2 Tim
等等。但我希望我的输出是:
Username
0 Alice
1 Bob
2 Car
3 Sandra
4 Paula
5 Tim
以下是我用于遍历所有页面的完整代码(省略了 url)
for pageno in range(0,99):
page=requests.get('full url'+ str(pageno))
soup=BeautifulSoup(page.text, 'html.parser')
df1 = pd.DataFrame({'Username': [name.text for name in (soup.findAll('p',{'class':'profile-name'}))]})
我该如何解决这个问题?
谢谢。
【问题讨论】:
标签: python pandas dataframe web-scraping