【发布时间】:2015-10-22 01:21:10
【问题描述】:
我尝试了几个小时来寻找解决方案,我找到的代码要么返回包含我尝试匹配的类之一的所有标签,要么包含我的所有类但其中包含一些额外的类,但我希望这些类完全匹配。
以下解决方案对我不起作用:
您也可以搜索类属性的确切字符串值:
css_soup.find_all("p", class_="body strikeout")
我可以在本地从HTML sample 获取以下标签,但对于我在Complete code 部分中请求的页面却不能:
<ul class="mvn listInline">..</ul>
HTML 示例:
<ul class="mvn listInline">
<li class="mbn h4 typeEmphasize">$325,000</li>
<li class="mbn h7">
3 bd 2 ba 2,080 sqft
</li>
</ul>
<ul class="mvn listInline withotherclasses">
<li class="mbn h4 typeEmphasize">$325,000</li>
<li class="mbn h7">
3 bd 2 ba 2,080 sqft
</li>
</ul>
<ul class="mvn onlymvn">
<li class="mbn h4 typeEmphasize">$325,000</li>
<li class="mbn h7">
3 bd 2 ba 2,080 sqft
</li>
</ul>
完整代码:
page = requests.get('http://www.trulia.com/for_sale/Anchorage,AK/2_p')
soup_page = BeautifulSoup(page.text,'html.parser')
for ul in soup_page.find_all("ul", class_="mvn listInline"):
print ul
【问题讨论】:
-
您能否提供一个您遇到问题的示例 html?
-
- $325,000
- 3 bd 2 ba 2,080 sqft
- $325,000
- 3 bd 2 ba 2,080 sqft
- $325,000
- 3 bd 2 ba 2,080 sqft
-
请在问题中更新。另外,更新你的 beautifulsoup 版本
-
我试图只获取第一个 ul 标签(
- ..
-
您确定您使用的是上面给出的确切代码吗?我对此没有任何疑问。
标签: python python-2.7 beautifulsoup