【发布时间】:2012-10-27 04:07:29
【问题描述】:
我使用的是 Ubuntu,并且有一个 known URL,我需要下载/保存为 CSV。 URL基于一个参数并且经常为项目更改,所以我想编写一个脚本来进行下载,这样我就不必每次都手动保存它。
我尝试使用 wget 获取文件,但网站将内容显示为 CSV,而文件本身是 HTML。如何将页面内容保存为纯 csv?
wget -O my.csv [url]
谁能帮忙?
【问题讨论】:
我使用的是 Ubuntu,并且有一个 known URL,我需要下载/保存为 CSV。 URL基于一个参数并且经常为项目更改,所以我想编写一个脚本来进行下载,这样我就不必每次都手动保存它。
我尝试使用 wget 获取文件,但网站将内容显示为 CSV,而文件本身是 HTML。如何将页面内容保存为纯 csv?
wget -O my.csv [url]
谁能帮忙?
【问题讨论】:
似乎文件中唯一的 HTML 是每行末尾的<br />。要删除它,您只需
wget -O- "$URL" | sed 's#<br />$##' > my.csv
【讨论】: