【发布时间】:2021-02-17 05:38:27
【问题描述】:
我正在尝试抓取这个website
但是看到它的元素,我对如何提取位于两个 h3 标签之间的数据感到困惑。 h3 标签元素包含一个国家名称。在下一个 h3 标签(具有另一个国家名称)之前,有些帖子包含截止日期文本和与该截止日期相关的文件链接。事实上,它们中的每一个都是针对该国家/地区发布的商业招标机会。
检查元素:
获取数据后,我将它们存储到数据库中。
请注意,我们无法预测未来 h3 元素中的国家名称和拼写可能是什么,但我们绝不希望错过任何新发布在网站上的机会。
任何人都可以帮助我解决 XPath 或 selenium 解决方案。非常感谢您的帮助。 在过去的几个小时里,我试图弄清楚,但想不出任何好主意。提前谢谢你
【问题讨论】:
-
如何选择位于两个 h3 标签之间的所有 h4
-
发布您的 HTML Dom 代码而不是屏幕截图。我们如何调试 xpath?
-
嗨@MohamedSulaimaanSheriff,你是对的,如果有人试图检查,我已经给出了链接。谢谢
标签: python selenium-webdriver xpath css-selectors webdriverwait