【发布时间】:2021-07-25 17:40:02
【问题描述】:
使用普通浏览器在无头(谷歌浏览器或火狐浏览器)模式下获取 JavaScript 呈现的 HTML 页面并将其保存在基于 URL 的驱动器上的最快和最不消耗(CPU、RAM)的方法是什么? 想法是也可以根据请求更改浏览器中的代理选项。
我非常了解 Selenium、Puppeteer、PhantomJS 和类似的解决方案。这需要使用 REAL 浏览器完成,通过 Linux 环境中的一些 API 进行远程管理。
我只找到了用于构建插件的 JS API 实现,但除了 Remote browser 之外没有找到任何解决方案,我不确定天气是否会再更新。
任何指针、sn-ps 或其他任何东西都非常受欢迎,因为我找不到任何东西。
【问题讨论】:
标签: javascript python api