【问题标题】:wget download aspx pagewget下载aspx页面
【发布时间】:2011-09-11 16:43:06
【问题描述】:

我想使用 wget 下载网页http://www.codeproject.com/KB/tips/ModelViewController.aspx,所以我只使用了非常基本的命令:

wget http://www.codeproject.com/KB/tips/ModelViewController.aspx

我收到的是一个带有.aspx 扩展名的文件,它无法在常规浏览器中正确显示。

如何下​​载该网页?

【问题讨论】:

    标签: download webpage wget


    【解决方案1】:

    该文件实际上会正确显示,您可以将其重命名为 .html 文件,您将能够确认这一点。网络服务器使用的服务器端技术不影响 wget

    编辑:我在此下方的cmets是错误的,感谢评论者指出,已将其删除以供将来的读者使用

    【讨论】:

    • 这是不正确的,wget 可以很容易地做到这一点(-p --convert-links,这个功能已经存在多年了)。另请注意,wget 可以为您重命名 (-E)。参见手册:gnu.org/software/wget/manual/wget.html#Advanced-Usage
    • @Haz,我做了重命名的事情,但就像我在@Piskvor 的回答的评论中所说的那样,代码突出显示和几张图片丢失了,而且字体很糟糕。
    • @Piskvor,通过使用选项-p和--convert-links(相当于-k),我得到的只是一个包含与下载页面相关的文件的文件夹,但是,仍然有一个aspx 扩展文件有同样的问题,我在挖掘文件夹后找不到一个很好的普通 html 页面。
    • @Tracy:嗯,你有没有试过,你知道,组合开关? -E -p --convert-links(顺便说一句,该手册中有更多好东西)
    • @Piskvor,似乎我错过了 -E 选项,对此感到抱歉,非常感谢您的帮助!
    【解决方案2】:

    感谢wget manual page(关于“wget options”的网络搜索的第一个结果,顺便说一句):

    wget -E http://whatever.url.example.com/x/y/z/foo.aspx
    

    如果您还希望下载所有相关媒体(CSS、图像等),请使用-p,可能还使用--convert-links(重写页面以供离线查看):

    wget -Ep --convert-links http://whatever.url.example.com/x/y/z/foo.aspx
    

    【讨论】:

    • 我试过你的答案,似乎wget只是下载页面并在html中附加后缀,仍然无法正确显示下载的“html”页面,虽然比什么都不做,特别是代码高亮和几张图片丢失了。
    • @Tracy:你没有提到你还想下载相关的图像和其他数据。
    【解决方案3】:
    $ wget \
         --recursive \
         --no-clobber \
         --page-requisites \
         --html-extension \
         --convert-links \
         --restrict-file-names=windows \
         --domains example.org \
         --no-parent \
             www.example.org/tutorials/html/
    

    从此页面:http://www.linuxjournal.com/content/downloading-entire-web-site-wget

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-07-05
      • 2012-06-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多