【问题标题】:Run selenium script that handles files remotely运行远程处理文件的 selenium 脚本
【发布时间】:2021-09-30 18:49:01
【问题描述】:

我正在使用 selenium 来提取一些数据(作为 json 文件)。这个 json 是脚本的最终输出。

到目前为止,我已经通过两种不同的方式在本地完成了这项工作:

  • 使用本地网络驱动程序(适用于 Chrome)。
  • 使用 Docker 容器。

但是,我需要在没有安装 webdrivers/Docker 的系统中从任何地方访问它。

我曾考虑将脚本部署到 Heroku 并解决这个想法,但我不知道在这种情况下如何处理数据。

【问题讨论】:

  • 在网络服务器上本地运行。您的客户端可以是浏览器。
  • 我已经考虑过了,但是生成的文件会保留在服务器上。我需要的是考虑到它是如何完成的,将输出导出到服务器(我对网络服务器/客户端的使用不是很熟悉,你可能有一点)。你能详细说明一下评论吗?
  • 另外,如果脚本不能在本地执行会更好,因为我运行的地方会发生很大变化
  • 我不确定我是否完全理解您的要求...但如果客户端没有可用的 webdrivers,则排除使用 remote-webdrivers。因此,只需创建一个可从浏览器获得的基于 HTML 的界面。服务器将运行脚本(这就是我在本地的意思......服务器将运行 webdriver),然后将 JSON 文件发送回浏览器。 (简单的http请求/响应发送文件下载...)

标签: python json docker selenium deployment


【解决方案1】:

我认为云服务适用于这些情况。

存储帐户(Amazon 中的S3 或 Azure 的 Blob Storage)允许您使用其 API 或使用其 SDK 从任何地方访问数据,几乎不受任何空间限制。 如果您的数据不应公开访问,您还可以指定访问策略。

由于您已经将脚本开发成 Docker 容器,因此您可以在几乎所有云提供商中运行它(例如在 Amazon ECR)。

【讨论】:

    猜你喜欢
    • 2013-02-18
    • 1970-01-01
    • 2017-02-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多