【发布时间】:2020-10-25 22:10:42
【问题描述】:
我正在以 python 开发人员的身份开始我的第一个项目。我正在抓取一个零售网页。该站点具有无限滚动,但有时您无需调用无限滚动,只需单击此路径内的按钮即可:
<a href="" class="ver-mas-productos btn meanbee-infinitescroll-button" style="display: block;">VER más PRODUCTOS</a>
我试过通过 xpath 来寻找元素:
/html/body/div[1]/div[1]/div[1]/div[8]/div/div/div[2]/a
//*[@id="top"]/body/div[1]/div[1]/div[1]/div[8]/div/div/div[2]/a
//*[contains(concat( " ", @class, " " ), concat( " ", "meanbee-infinitescroll-button", " " ))]
也在寻找 css 连接器:
.meanbee-infinitescroll-button
或通过文字查看:
driver.find_elements_by_partial_link_text('PRODUCTOS')
driver.find_elements_by_link_text('VER más PRODUCTOS')
也尝试按类,部分文本,但我没有设法得到它并点击它。我对这个世界真的很陌生,所以我假设这是因为路径的目标是比按钮更大的框架,我不能直接引用它,但我不确定。
谢谢!
【问题讨论】:
标签: python css selenium xpath screen-scraping