【发布时间】:2017-07-28 12:28:37
【问题描述】:
我正在构建一个图像数据库,并希望自动化该过程。我对 HTML 有点熟悉,我的核心程序是用 C# 构建的。有什么好的库可以帮助我将页面下载为 HTML,并将页面上的 URL 链接获取到所需的图像?我已经熟悉如何从 URL 下载图像,因此不需要解决。
(库或其他语言。建库和程序不需要结合。)
【问题讨论】:
-
提问前请先研究一下。
标签: c# html url web-crawler
我正在构建一个图像数据库,并希望自动化该过程。我对 HTML 有点熟悉,我的核心程序是用 C# 构建的。有什么好的库可以帮助我将页面下载为 HTML,并将页面上的 URL 链接获取到所需的图像?我已经熟悉如何从 URL 下载图像,因此不需要解决。
(库或其他语言。建库和程序不需要结合。)
【问题讨论】:
标签: c# html url web-crawler
您想构建一个 crawler 或 website spider 来抓取网站上的内容。有一个名为 HtmlAgilityPack 的解析库可以帮助您轻松完成这项工作。 This post will tell you how to use this library.
希望对你有帮助!
【讨论】: