【发布时间】:2021-06-23 13:43:09
【问题描述】:
我目前正在研究如何在单页应用程序 (SPA) 中使用 python 在由 javascript 驱动的分页中抓取网页内容。
例如, https://angular-8-pagination-example.stackblitz.io/
我搜索了一下,发现使用 Scrapy 无法抓取 javascript / SPA 驱动的内容。 它需要使用 Splash。我是 Scrapy 和 Splash 的新手。 这是正确的吗?
另外,如何调用javascript分页方法?我检查了元素,它只是一个没有 href 和 javascript 事件的锚。
请指教。
谢谢,
哈杰
【问题讨论】:
-
你听说过 Selenium 吗?
-
也通过 Selenium 进行研究。但是,我们想先探索 Scrapy。
标签: javascript python scrapy scrapy-splash