【问题标题】:Automated download of website content using ASP.net使用 ASP.net 自动下载网站内容
【发布时间】:2010-03-24 20:20:31
【问题描述】:

使用 ASP.net,我可以使用哪些方法来执行以下操作:

  1. 打开与给定 URL 的连接以读取 HTML 内容
  2. 为超链接解析给定的 URL,并将它们放在一个数组中
  3. 遍历每个超链接(仅向下一级),打开每个超链接,将 HTML 内容保存在表格中,然后移动到下一个超链接直到完成。

如果 ASP.net 不能胜任这项任务,其他语言或免费脚本/工具包也是可以接受的。

谢谢。

【问题讨论】:

    标签: asp.net web-applications parsing screen-scraping


    【解决方案1】:

    我省略了明显的内容,例如“循环遍历 DataTable”等。更深入的答案可能不会来自该站点。这个问题有点太大了,在这里无法完整回答。

    【讨论】:

    • 听起来不错 - 只是几个后续问题: 1. System.Net.WebClient 是否像文件流一样工作?一个好的教程的任何链接,也许? 2. 我是否正确假设循环中超链接上的模拟“单击”基本上是将 WebClient 变量指向该数组项的 URL?我是新手,所以请耐心等待 - 谢谢。
    • 1.是的,我相信该方法是 DownloadFile(),但我不确定。检查“方法”部分中的文档。 2. 是的。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-08-05
    • 2014-07-03
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多