【发布时间】:2019-01-13 21:22:19
【问题描述】:
我对网络抓取真的很陌生,我正在做一个项目,我需要从加载并需要滚动以获取所有值的网格中抓取数据。
网页是(https://applipedia.paloaltonetworks.com/)。
我需要网格内的所有数据——(包含NAME , CATEGORY, SUBCATEGORY, RISK, TECHNOLOGY 的数据)。
谁能指导我解决这个问题的方法。我研究并发现带有 js 或 phantomjs 的 selenium 可能是一个很好的解决方案,但并不确定。编程部分我将使用 Python。
【问题讨论】:
-
是的。使用无头浏览器是可行的方法。除此之外;根据help center中的指导方针,这个问题的范围太广了
-
谢谢。我如何在此处进行向下滚动?
标签: javascript python selenium web-scraping phantomjs