【发布时间】:2014-11-04 20:50:17
【问题描述】:
我很难让 BeautifulSoup 为我抓取一些数据。从此代码示例中访问日期(实际数字,2008 年)的最佳方法是什么?这是我第一次使用 Beautifulsoup,我已经知道如何从页面上刮掉 url,但我不能把它缩小到只选择单词 Date,然后只返回后面的任何数字日期(在 dd括号)。我问的可能吗?
<div class='dl_item_container clearfix detail_date'>
<dt>Date</dt>
<dd>
2008
</dd>
</div>
【问题讨论】:
-
显示您尝试过的内容?
-
我尝试过以各种方式使用soup.find_all,还有soup.select("dt"),它获取所有标签,但我想要它们在dd括号中的标签,但如果没有标签,如果我 soup.select("dd"),我会得到大量我不想要的值,我只想要特定于我正在寻找的标签的值。
标签: python web-scraping beautifulsoup html-parsing