【发布时间】:2016-12-09 10:04:27
【问题描述】:
我是一名 Python 初学者,学习网络爬虫。
在这个项目中,我必须检索一些hrefs,然后打印出每个href 链接中的文本内容。到目前为止,这是我的代码:
import requests, bs4, os, webbrowser
url = 'http://www.constructeursdefrance.com/resultat/?dpt=53'
res = requests.get(url)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text,'html.parser')
for a in soup.select('.link'):
links = a.find('a').attrs['href']
我用链接尝试了很多东西,但它会说“unicode is not callable”。 我如何使用这些链接并最终遍历它们以提取其中的文本?
谢谢
【问题讨论】:
标签: python-2.7 beautifulsoup web-crawler python-unicode