【问题标题】:How to grab data off a website [duplicate]如何从网站上获取数据[重复]
【发布时间】:2017-07-28 12:28:37
【问题描述】:

我正在构建一个图像数据库,并希望自动化该过程。我对 HTML 有点熟悉,我的核心程序是用 C# 构建的。有什么好的库可以帮助我将页面下载为 HTML,并将页面上的 URL 链接获取到所需的图像?我已经熟悉如何从 URL 下载图像,因此不需要解决。

(库或其他语言。建库和程序不需要结合。)

【问题讨论】:

  • 提问前请先研究一下。

标签: c# html url web-crawler


【解决方案1】:

您想构建一个 crawlerwebsite spider 来抓取网站上的内容。有一个名为 HtmlAgilityPack 的解析库可以帮助您轻松完成这项工作。 This post will tell you how to use this library.

希望对你有帮助!

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2011-10-28
    • 2021-08-29
    • 2019-06-13
    • 1970-01-01
    • 2015-08-04
    • 2014-06-27
    • 1970-01-01
    相关资源
    最近更新 更多