【问题标题】:Get rendered HTML page file from URL input with browser使用浏览器从 URL 输入中获取呈现的 HTML 页面文件
【发布时间】:2021-07-25 17:40:02
【问题描述】:

使用普通浏览器在无头(谷歌浏览器或火狐浏览器)模式下获取 JavaScript 呈现的 HTML 页面并将其保存在基于 URL 的驱动器上的最快和最不消耗(CPU、RAM)的方法是什么? 想法是也可以根据请求更改浏览器中的代理选项。

我非常了解 Selenium、Puppeteer、PhantomJS 和类似的解决方案。这需要使用 REAL 浏览器完成,通过 Linux 环境中的一些 API 进行远程管理。

我只找到了用于构建插件的 JS API 实现,但除了 Remote browser 之外没有找到任何解决方案,我不确定天气是否会再更新。

任何指针、sn-ps 或其他任何东西都非常受欢迎,因为我找不到任何东西。

【问题讨论】:

    标签: javascript python api


    【解决方案1】:

    是否需要 JavaScript 渲染的 HTML 页面保存后还能正常使用吗?

    只需使用 Python 截取屏幕截图并将其保存在驱动器上。

    【讨论】:

    • 不,我不需要 JS 代码,我只需要用 JS 呈现的 HTML。如果通过屏幕截图您的意思是 .html 文件,那很好。但我不需要图像文件。
    猜你喜欢
    • 2013-09-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-11-01
    • 1970-01-01
    • 2013-02-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多