【问题标题】:Encoded page downloaded with wget?使用 wget 下载的编码页面?
【发布时间】:2018-04-20 20:27:55
【问题描述】:

我正在尝试使用以下方式镜像站点:

wget --header 'accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' --header 'upgrade-insecure-requests: 1' --header 'user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36' --header 'dnt: 1' --header 'accept-encoding: gzip, deflate, br' --header 'accept-language: en-US,en;q=0.9' --header 'cookie: _ga=GA1.2.3865356.1523153047; ........'  -N -m -p -w 3 --convert-links  'mysite.com/

我添加了几个标头并注意到递归下载没有发生。只下载了初始 index.html 页面。当我查看页面时,我看到了屏幕截图。这里下载的是什么。我怎样才能下载常规的 html 文件?

【问题讨论】:

    标签: wget


    【解决方案1】:

    如果您添加选项--server-response,您会在响应的Content-Type 标头中看到什么?是不是类似于text/html

    P.S.:由于您使用了-m(即--mirror)选项,因此您也不需要指定标志-N

    【讨论】:

      猜你喜欢
      • 2011-09-11
      • 2019-12-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-06-02
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多