【发布时间】:2016-02-11 16:39:12
【问题描述】:
我希望使用 beutifulsouop 提取具有特定 class 值的 span 部分中的文本,以及具有不同 class 值的 div 部分中的文本,同时保留顺序。
以下内容除外,它不保留顺序 [即该列表的末尾包含所有div 元素,而不是它们出现在页面中时]
extract = soup.findAll('span', {"class": "value1"})
extract += soup.findAll('div', {"class": "value2"})
注意 - 这与问题相似,但略有不同 - BeautifulSoup findAll() given multiple classes? 因为我专门查看 span 和 div 代码。
【问题讨论】:
标签: python python-2.7 beautifulsoup