【发布时间】:2017-07-31 05:37:57
【问题描述】:
我需要通过抓取从 Github 获取里程碑信息。
里程碑信息嵌入在 2 种类型的 div 类中:
table-list-item milestone notdue 和 table-list-item milestone。
如何检索两个类中包含的信息?
我有:
milestones = soup.find_all('div', {'class': 'table-list-item milestone'})
但是这一行返回table-list-item milestone notdue的空列表
现在我正在做以下事情(丑陋的黑客):
milestones = soup.find_all('div', {'class':'table-list-item milestone'})
milestones.extend(soup.findAll('div', {'class': 'table-list-item milestone notdue'}))
有什么优雅的解决方案吗?
根据this 问题,BeautifulSoup 应该返回所有匹配的。我的问题正好相反!
【问题讨论】:
标签: github beautifulsoup