【问题标题】:wget can not save asp pageswget不能保存asp页面
【发布时间】:2012-10-27 13:48:25
【问题描述】:

似乎wget 无法获取asp 文件,而html 没有问题。我编写了一个脚本来获取一些 URL 并将它们保存为 csv 格式。 脚本是

wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv

【问题讨论】:

  • 你能发布你的整个剧本吗?另外:wgeting 该页面对我来说很好。但是服务器返回的页面不是 CSV 格式 - 有多余的 &lt;br&gt; 标签,每一行似乎都以不必要的逗号结尾。

标签: asp.net wget


【解决方案1】:

您必须在该 URL 周围加上引号!如果不加引号,Bash(或您正在使用的任何 shell)将 &amp; 视为在后台运行 wget 的请求 - 并且在 &amp; 之后出现的格式参数永远不会发送到服务器。试试这个:

wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv

请注意,我也调整了您的 sed 命令 - 您得到的 &lt;br&gt;s 没有终止斜线。另外:删除那些&lt;br&gt;s 意味着只有每个 other 行都有数据。希望这不会成为问题,因为使用 sed 删除换行符有点痛苦,但如果是这样,请参阅 this question 了解如何操作。

希望有帮助!

【讨论】:

    猜你喜欢
    • 2019-06-27
    • 1970-01-01
    • 1970-01-01
    • 2023-03-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-09-11
    • 1970-01-01
    相关资源
    最近更新 更多