【发布时间】:2017-06-13 15:32:47
【问题描述】:
我正在尝试在 Python 中使用 Selenium 进行抓取,我正在尝试通过单击递增数字按钮来循环访问 bigkinds.or.kr 上的登录页面。
根据 Chrome Inspector,下一页位于以下 HTML 中:
<div class="newsPage">
<div class="btmDelBtn">
...</div>
<span>
<a href="javascript:void(0);" class="current">1</a>
<a href="javascript:void(0);" onclick="getSearchResultNew(2)">2</a>
<a href="javascript:void(0);" onclick="getSearchResultNew(3)">3</a>
<a href="javascript:void(0);" onclick="getSearchResultNew(4)">4</a>
<a href="javascript:void(0);" onclick="getSearchResultNew(5)">5</a>
<a href="javascript:void(0);" onclick="getSearchResultNew(6)">6</a>
</span>
我没有通过单击下一页来成功抓取。请帮我。 这是我的代码:
url = "https://www.bigkinds.or.kr/main.do"
browser.get(url)
...
currentPageElement = browser.find_element_by_xpath("//*[@id='content']/div/div/div[2]/div[7]/span/a[2]")
print(currentPageElement)
currentPageNumber = int(currentPageElement.text)
print(currentPageNumber)
在 xpath 中,“/span/a[2]”是页码。如何为这个 xpath 制作循环。
【问题讨论】:
-
1.您正在尝试将元素的文本转换为整数:int(currentPageElement.text)。 2. 即使问题是关于点击,你也永远不会在代码的任何地方调用
click()方法。 -
在 xpath 中,“/span/a[2]”是页码。如何为这个 xpath 制作循环。
标签: python selenium pagination