【发布时间】:2019-05-12 13:11:21
【问题描述】:
我正在学习使用 Beautiful Soup 从网站上抓取一些信息。该网站有多个我想要抓取的搜索结果页面。
这很简单,因为每个页面的 URL 都会改变:
website.com/page1
website.com/page2
.
.
但我事先不知道会有多少页。所以我不想尝试抓取website.com/page13,如果没有,或者website.com/page13 只显示可能是website.com/page9 的最后一个结果页面。
有什么方法可以在我到达最终结果页面时停止抓取?
【问题讨论】:
标签: python beautifulsoup