【问题标题】:python with beautifulsoup - remove tagspython with beautifulsoup - 删除标签
【发布时间】:2013-09-15 12:49:37
【问题描述】:

我正在做一些python程序来提取歌词

我使用的代码:

    import urllib
    from bs4 import BeautifulSoup
    url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/22143075")
    soup = BeautifulSoup(url.read())
    print soup.find('pre', itemprop='description')

结果让我得到了我需要的东西,但带有额外的标签 例如:<pre item="description> 然后是歌词 有谁知道如何只获取歌词? 该结构将歌词放在 pre 标签之间 提前致谢

【问题讨论】:

  • 您在寻找soup.find('pre', itemprop='description').contents[0]吗?
  • @DavidRobinson 非常感谢我所需要的~~!!
  • 你知道我怎样才能把这歌词写成一个文件吗?

标签: python beautifulsoup


【解决方案1】:

使用您找到的节点的文本属性

import urllib
from BeautifulSoup import BeautifulSoup
url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/2
2143075")
soup = BeautifulSoup(url.read())
desc=soup.find('pre', itemprop='description')
print desc.text

【讨论】:

    猜你喜欢
    • 2020-03-08
    • 1970-01-01
    • 2014-04-25
    • 2011-02-01
    • 2014-12-01
    • 2013-10-19
    • 1970-01-01
    • 2020-02-26
    • 1970-01-01
    相关资源
    最近更新 更多