【发布时间】:2019-08-31 07:01:33
【问题描述】:
我想在动态href 上创建一个循环。事实上,我每页下载一组文件。在每一页上,我下载 100 个文本文件,但我必须下载 200 000 个文件。所以,我必须在 2000 年点击下一个按钮。为此,我得到了下一个按钮的 href 地址,但不幸的是,这个链接中的两个对象发生了变化,页码 1、2、3 等以及一串人物。请参阅附件中更改的下一个按钮的示例。
https://search.proquest.com/something/E6981FD6D11F45E8PQ/2?accountid=12543#scrollTo
https://search.proquest.com/something/E6981FD6D11F45E8PQ/3?accountid=12543#scrollTo
https://search.proquest.com/something/61C27022597C4092PQ/4?accountid=12543#scrollTo
https://search.proquest.com/something/E431552DC6554BF7PQ/5?accountid=12543#scrollTo
我是 Python 的新用户。我的水平很差。
#Before I add selenium setup for scraping.
n=2000
for i in range(1,n):
href="https://search.proquest.com/something/715376F5A5AF44BBPQ/" + str(i) + "?accountid=12543#scrollTo"
driver.get(href)
#Here, I add the code which allows downloading for each page.
【问题讨论】:
标签: python selenium dynamic href