【发布时间】:2018-04-10 20:09:49
【问题描述】:
使用 beautifulsoup 从 div 标签中提取单个数据字符串很简单。但是如果我需要来自同一个 div 类标签的更多结果怎么办? “参考编号:”之后的数字,“日期:”之后的日期和“注册日期:”日期?那是来自同一个 div 标签“right-col”的三个字符串。
你会推荐什么? - 正则表达式? - 使用 beautifulsoup 可以获得多个“兄弟姐妹”吗?
<div class="right-col">
<div>Reference no: 2017-598760</div>
<div>date:<span class="label label-info">2017-12-15</span>
</div>
<div>RegistrationDate: 2017-10-29</div>
</div>
【问题讨论】:
-
主 div 中的内容是动态的吗?内部变化的div数量?您可以使用 beautifulsoup 循环浏览内容。
-
没有。内容不是动态的。都是静态信息。但每页有 10 个“right-col”,信息不同。
-
能否提供页面链接?
-
当然。 doffin.no/Notice。我为你翻译了英文“right-col”div标签里面的内容,所以请注意你现在看到的不是英文。
标签: python regex web-scraping beautifulsoup