【发布时间】:2020-03-12 04:19:03
【问题描述】:
我正在尝试在 python 中解析带有 BS 的页面。
这是我的代码:
years = range(2010,2021)
urls = []
for year in years:
yr = str(year)
url = 'https://www.spotrac.com/nba/contracts/breakdown/'+yr+'/'
webpage = requests.get(url)
content = webpage.content
soup = BeautifulSoup(re.sub("<!--|-->","", content.decode('utf-8')),'lxml')
a = soup.find('table',{'class':'datatable'})
urls.append(a)
我没有得到任何结果。我已经两次和三次检查了页面源中表格的类。我相信(尽管我认为这是错误所在) - 我已经正确编码了 soup 变量以解释页面源的注释部分。
【问题讨论】:
-
你检查过你从请求中得到的结果吗?
re.sub("<!--|-->","", content.decode('utf-8'))是怎么回事?
标签: python web-scraping beautifulsoup