linux curl是通过url语法在命令行下上传或下载文件的工具软件,它支持http,https,ftp,ftps,telnet等多种协议,常被用来抓取网页和监控Web服务器状态。
curl命令参数介绍请参考:http://aiezu.com/article/linux_curl_command.html

一、Linux curl用法举例:
1. linux curl抓取网页:

抓取百度:

1
//www.baidu.com

 

 

如发现乱码,可以使用iconv转码:

 

1
iconv -fgb2312

 

 

iconv的用法请参阅:在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

 

2. Linux curl使用代理

linux curl使用http代理抓取页面:

 
1
2
//iframe.ip138.com/ic.asp|iconv -fgb2312
//www.baidu.com

 

 

使用socks代理抓取页面:

 
1
2
//iframe.ip138.com/ic.asp|iconv -fgb2312
//iframe.ip138.com/ic.asp|iconv -fgb2312

 

 

代理服务器地址可以从爬虫代理上获取。

 

3. linux curl处理cookies

 

接收cookies:

 
1
//www.baidu.com #cookies保存到/tmp/cookies文件

 

 

发送cookies:

 
1
2
//www.baidu.com #发送cookies文本
//www.baidu.com #从文件中读取cookies

 

 

 
4. linux curl发送数据:

linux curl get方式提交数据:

 
1
//www.baidu.com

 

 

linux curl post方式提交数据:

 
1
2
3
//www.baidu.com #post数据
curl -d '{"is_real":1,"end_time":0,}' https://www.fuyin.con #post数据
//www.baidu.com  #post文件

 

 

 

以表单的方式上传文件:

 
1
//www.aiezu.com

 

 

相当于设置form表单的method="POST"和enctype='multipart/form-data'两个属性。

 
5. linux curl http header处理:

 

设置http请求头信息:

 
1
2
3
//www.baidu.com #设置http请求头User-Agent
//www.baidu.com #设置http请求头Referer
//www.aiezu.com

 

 

 

设置http响应头处理:

 
1
2
//www.aiezu.com #仅仅返回header
//www.aiezu.com #将http header保存到/tmp/header文件

 

 

 
6. linux curl认证:
1
2
//www.aiezu.com #用户名密码认证
//www.baidu.com #采用证书认证

 

 

 

7. 其他:

1
2
# http://www.baidu.com #以“#”号输出进度条
//www.baidu.com #保存http响应到/tmp/aiezu

 

 

 

注意:

http请求地址的url要使用""括起来

原文地址:

http://www.aiezu.com/system/linux/linux_curl_syntax.html

相关文章: