【发布时间】:2019-06-08 17:35:08
【问题描述】:
我正在尝试在每个循环中附加一个数据框。不幸的是,创建的列表总是被新的输出覆盖......
for x in link_href_list:
urllib.request.urlopen(x)
html = urlopen(x)
bs = BeautifulSoup(html, "lxml")
table=bs.find('tbody')
rows = table.tr.next_siblings
list_rows = []
for row in rows:
a=row.find('td').get_text().strip()
list_rows.append(a)
list_rows = pd.Series(list_rows)
list_rows.to_frame()
我需要一个数据框,在每次迭代中创建一个带有熊猫的新列...
【问题讨论】:
-
它被覆盖了,因为你的空列表的变量名 (
list_row) 在第一个 for 循环中。for x in link_href_list:x 的任何迭代都会覆盖list_rows
标签: pandas loops dataframe beautifulsoup overwrite