如何从网站上获取数据[重复]答案

【问题标题】：How to grab data off a website [duplicate]如何从网站上获取数据[重复]
【发布时间】：2017-07-28 12:28:37
【问题描述】：

我正在构建一个图像数据库，并希望自动化该过程。我对 HTML 有点熟悉，我的核心程序是用 C# 构建的。有什么好的库可以帮助我将页面下载为 HTML，并将页面上的 URL 链接获取到所需的图像？我已经熟悉如何从 URL 下载图像，因此不需要解决。

（库或其他语言。建库和程序不需要结合。）

【问题讨论】：

【解决方案1】：

您想构建一个 crawler 或 website spider 来抓取网站上的内容。有一个名为 HtmlAgilityPack 的解析库可以帮助您轻松完成这项工作。 This post will tell you how to use this library.

希望对你有帮助！

【讨论】：