【发布时间】:2021-03-10 15:58:54
【问题描述】:
我试图制作一个 python 脚本来从几个页面上的 html 表中检索我的所有数据(我有一个链接数组) 我希望将表中的这些数据放入 csv 中。 我该如何进行? 我做了类似的事情,但是数据被放入而不是在列和行中,并且在之后立即删除,然后放入下一个。 我怎样才能以最干净的方式进行? 这是桌子
<div class="table-responsive">
<table class="table table-striped product-page-specifications">
<tbody><tr>
<td class="col-xs-4 text-muted">Product type</td>
<td class="col-xs-8">1</td>
</tr><tr>
<td class="col-xs-4 text-muted">Tip2</td>
<td class="col-xs-8">MMA
TIG/WIG
</td>
</tr><tr>
<td class="col-xs-4 text-muted">Material</td>
<td class="col-xs-8">Metal </td>
</tr><tr>
<td class="col-xs-4 text-muted">Size</td>
<td class="col-xs-8">Universal </td>
</tr><tr>
<td class="col-xs-4 text-muted">Color</td>
<td class="col-xs-8">Black</td>
</tr><tr>
<td class="col-xs-4 text-muted">Content</td>
<td class="col-xs-8">Material made of a material as resistant as possible</td>
</tr></tbody>
</table>
</div>
这是代码:
for a_link in all_links:
res = requests.get(a_link).text
soup = BeautifulSoup(res, 'html.parser')
table = soup.select_one("table")
output_rows = []
for table_row in table.findAll('tr'):
columns = table_row.findAll('td')
output_row = []
for column in columns:
output_row.append(column.text)
output_rows.append(output_row)
df = pd.DataFrame(output_rows)
print(df)
【问题讨论】:
标签: python beautifulsoup