【发布时间】:2013-09-15 12:49:37
【问题描述】:
我正在做一些python程序来提取歌词
我使用的代码:
import urllib
from bs4 import BeautifulSoup
url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/22143075")
soup = BeautifulSoup(url.read())
print soup.find('pre', itemprop='description')
结果让我得到了我需要的东西,但带有额外的标签
例如:<pre item="description> 然后是歌词
有谁知道如何只获取歌词?
该结构将歌词放在 pre 标签之间
提前致谢
【问题讨论】:
-
您在寻找
soup.find('pre', itemprop='description').contents[0]吗? -
@DavidRobinson 非常感谢我所需要的~~!!
-
你知道我怎样才能把这歌词写成一个文件吗?
标签: python beautifulsoup