【发布时间】:2016-05-09 20:09:08
【问题描述】:
有没有办法遍历格式为的页面档案
'http://base_url/page=#' - 其中 # 是第 2 个页码?
理想情况下,我想在“base_url”之后的每个连续页面上部署我的爬虫
是python中的一个函数或for循环,其中base_url将被迭代:
page = i in range(nth)
base_url ='http://base_url/page={}'
例如http://www.businessinsider.com/?page=3 与 http://www.businessinsider.com/
【问题讨论】:
标签: python loops web-scraping iteration