【问题标题】:What is the difference between using BeautifulSoup and Geckodriver on selenium?在 selenium 上使用 BeautifulSoup 和 Geckodriver 有什么区别?
【发布时间】:2019-01-30 03:37:11
【问题描述】:

我目前对使用 selenium 3 的漂亮汤和 geckodriver 都很陌生。我正在做一个项目,我必须从网页中抓取 URL。

我发现它们都用于网页抓取,但无法区分它们之间的区别。 BeautifulSoup 和 Geckodriver 有什么区别?感谢您的帮助。

【问题讨论】:

    标签: python-3.x selenium beautifulsoup geckodriver


    【解决方案1】:

    BeautifulSoup 专为网页抓取而设计。

    用于从 HTML 和 XML 文件中提取数据的 Python 库。有用 使用您最喜欢的解析器来提供惯用的导航方式, 搜索和修改解析树。它通常可以节省程序员 几小时或几天的工作。

    Geckodriver 是 Firefox 的驱动程序,通常用于在 Selenium 中进行测试。

    本程序提供WebDriver协议描述的HTTP API 与 Gecko 浏览器(例如 Firefox)进行通信。它翻译 通过充当代理调用 Firefox 远程协议 本地和远程端。

    Selenium 常用于:

    1. 创建强大的、基于浏览器的回归自动化套件和测试
    2. 跨多个环境扩展和分发脚本

    Selenium 使浏览器自动化。而已!你用这种力量做什么 完全取决于你。主要用于自动化 Web 应用程序 用于测试目的,但当然不仅限于此。 无聊的基于 Web 的管理任务可以(而且应该!)自动化 也是。

    【讨论】:

    • 你说的是Gecko浏览器,Gecko浏览器下除了火狐还有什么浏览器?
    • Gecko 是一个开源浏览器引擎,其中最明显的浏览器是 Firefox。另一个例子是叫做“SeaMonkey”的东西。但如果你愿意,你可以自己写! developer.mozilla.org/en-US/docs/Gecko/FAQ(顺便说一句,上面的引用直接来自 geckodriver GitHub 页面)
    【解决方案2】:

    我只是对 GeckoDriver 进行了更多说明

    Firefox 驱动程序实现已在 Selenium 3.0更改。从 Firefox 版本 47.0+ 开始,我们需要使用单独的驱动程序来与 Firefox 浏览器进行交互,类似于 ChromeDriver。 Firefox 的新驱动程序称为 Geckodriver

    Geckodriver 提供由 W3CWebDriver 协议描述的 HTTP API 来与 Gecko 浏览器(例如 Firefox)进行通信。它通过充当本地端和远程端之间的代理,将调用转换Firefox 远程协议(木偶)

    Geckodriver 发布可以被追踪here

    【讨论】:

      猜你喜欢
      • 2021-02-16
      • 2015-05-30
      • 2019-10-21
      • 2016-05-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-03-12
      相关资源
      最近更新 更多