【发布时间】:2018-07-02 18:57:31
【问题描述】:
SO 新手,在使用 beautifulsoup 从网站上抓取表格时遇到了一些困难。
表格的源 html 是这样的(每个艺术家/歌曲/专辑都重复令人作呕):
<td class="subject">
<p title="song">song</p>
<p class="singer" title="artist | album">artist<span class="bar">|</span>album</p>
</td>
我正在尝试使用所有这些信息创建一个输出文件。我使用的代码是:
with open('output.txt', 'w', encoding='utf-8') as f:
for tr in soup.find_all('tr')[1:]:
tds = tr.find_all('td')
f.write("Information: %s" % tds[3].text)
这让我得到这样的输出:
Information:
song
singer | album
如何将其更改为将所有内容放在一条线上,并正确分开?理想情况下,我的输出应该是这样的:
Song Title: song
Artist: singer
Album Name: album
【问题讨论】:
标签: python html web-scraping beautifulsoup