【发布时间】:2021-02-09 06:58:14
【问题描述】:
我正在尝试从具有不同 div 但类名相同的站点中抓取数据。
<div class="release-date-text-wrapper" >
<div class='release-date-title'><a href="/pharrell-x-adidas-nmd-hu-sesame">Pharrell x adidas NMD Hu Sesame</a></div>
<div class='release-date-style'>Sesame/Sand-Bright Red</div>
</div>
</div>
</div>
<div class='col-xs-6 col-sm-3 col-md-3 release-date-item-continer clear-padding'>
<div class='release-date-item-wrapper'>
<div class="release-event-date-wrapper">
<div class="event-date ">
<div>
25 Oct </div>
<div>2020</div>
</div>
</div>
<div class='release-date-image-wrapper'>
<a href="/pharrell-x-adidas-nmd-hu-crystal-white" class='thumbnail'>
<img src="https://4app.kicksonfire.com/kofapp/upload/events_master_images/thumb_ipad_pharrell-x-adidas-nmd-hu-crystal-white.jpg" alt="Pharrell x adidas NMD Hu Crystal White" class="img-responsive imagecache imagecache-kofapp_list" width="250" height="200" />
</a>
</div>
<div class="release-date-text-wrapper" >
<div class='release-date-title'><a href="/pharrell-x-adidas-nmd-hu-crystal-white">Pharrell x adidas NMD Hu Crystal White</a></div>
<div class='release-date-style'>Crystal White/Clear Mint-Shock Yellow</div>
我正在尝试从 2 个 div 中提取“发布日期标题”,它们应该显示如下
Pharrell x adidas NMD Hu Sesame
Pharrell x adidas NMD Hu Crystal White
这是我当前使用的代码。
Name = soup.find('div',attrs={'class':'release-date-title'}).text
这给了我第一个没有问题,我遇到的麻烦是获得第二个。我尝试了 .find_next("div") 但它显示了类 'release-date-style'。
编辑: 我需要能够单独选择它们,因为稍后我会将它们添加到不和谐嵌入中,为每个标题添加颜色和日期。
【问题讨论】:
标签: python beautifulsoup