【发布时间】:2019-01-30 03:37:11
【问题描述】:
我目前对使用 selenium 3 的漂亮汤和 geckodriver 都很陌生。我正在做一个项目,我必须从网页中抓取 URL。
我发现它们都用于网页抓取,但无法区分它们之间的区别。 BeautifulSoup 和 Geckodriver 有什么区别?感谢您的帮助。
【问题讨论】:
标签: python-3.x selenium beautifulsoup geckodriver
我目前对使用 selenium 3 的漂亮汤和 geckodriver 都很陌生。我正在做一个项目,我必须从网页中抓取 URL。
我发现它们都用于网页抓取,但无法区分它们之间的区别。 BeautifulSoup 和 Geckodriver 有什么区别?感谢您的帮助。
【问题讨论】:
标签: python-3.x selenium beautifulsoup geckodriver
BeautifulSoup 专为网页抓取而设计。
用于从 HTML 和 XML 文件中提取数据的 Python 库。有用 使用您最喜欢的解析器来提供惯用的导航方式, 搜索和修改解析树。它通常可以节省程序员 几小时或几天的工作。
Geckodriver 是 Firefox 的驱动程序,通常用于在 Selenium 中进行测试。
本程序提供WebDriver协议描述的HTTP API 与 Gecko 浏览器(例如 Firefox)进行通信。它翻译 通过充当代理调用 Firefox 远程协议 本地和远程端。
Selenium 常用于:
Selenium 使浏览器自动化。而已!你用这种力量做什么 完全取决于你。主要用于自动化 Web 应用程序 用于测试目的,但当然不仅限于此。 无聊的基于 Web 的管理任务可以(而且应该!)自动化 也是。
【讨论】:
我只是对 GeckoDriver 进行了更多说明
Firefox 驱动程序的实现已在 Selenium 3.0 中更改。从 Firefox 版本 47.0+ 开始,我们需要使用单独的驱动程序来与 Firefox 浏览器进行交互,类似于 ChromeDriver。 Firefox 的新驱动程序称为 Geckodriver。
Geckodriver 提供由 W3CWebDriver 协议描述的 HTTP API 来与 Gecko 浏览器(例如 Firefox)进行通信。它通过充当本地端和远程端之间的代理,将调用转换到 Firefox 远程协议(木偶)。
Geckodriver 发布可以被追踪here
【讨论】: