【发布时间】:2016-08-29 07:38:16
【问题描述】:
所以我正在做一个小项目,因为我是一个初学者,我正在做一些网页抓取。我想在python中使用beautifulsoup在一行上打印一首歌曲的歌词,但它是这样打印的:
今天早上我向外看,太阳已经消失打开一些音乐开始我的一天我迷失在一首熟悉的歌曲中我闭上眼睛我溜走了这不仅仅是一种感觉(不仅仅是一种感觉)当我听到那首老歌他们曾经玩过(不仅仅是一种感觉)我开始做梦(不仅仅是一种感觉)直到我看到玛丽安走开我看到我的玛丽安走开那么多人来了又走了他们的脸随着岁月的流逝而褪色但我仍然记得我徘徊on像夏日天空中的太阳一样清澈不仅仅是一种感觉(不仅仅是一种感觉)当我听到他们曾经演奏的那首老歌(不仅仅是一种感觉)我开始做梦(不仅仅是一种感觉)直到我看到玛丽安走路离开我看到我的玛丽安走开当我累了,心想冷了我躲在我的音乐里,忘记了白天和我曾经认识的一个女孩的梦我闭上眼睛,她溜走了她溜走了这不仅仅是一种感觉(不仅仅是一种感觉)当我听到他们曾经演奏的那首老歌(不仅仅是一种感觉)我开始做梦(不仅仅是一种感觉)直到我看到玛丽安走开
这是我的代码:
import urllib
from bs4 import BeautifulSoup
html = urllib.urlopen("http://www.metrolyrics.com/more-than-a-feeling-lyrics-boston.html")
bsObj = BeautifulSoup(html, "lxml")
namelist = bsObj.find_all("div", {"id": "lyrics-body-text"})
print("".join([p.get_text(strip=True) for p in namelist]))
【问题讨论】:
标签: python html python-3.x web-scraping beautifulsoup