这里写自定义目录标题
选取网页-iwatch京东官方自营店
https://item.jd.com/100008348586.html
如图所示
我们将爬取该界面的信息
编译器选择了Python自带的编译器IDLE,
首先打开IDLE,
利用import requests语句加载requests库(安装Python后,需要在命令提示符后安装requests库,安装方式会在后面说明)
然后用requests库中的get方法,获取该链接的内容
用一行代码测试其状态码的信息
“200”证明连接状态正常,且获得了相应的内容,其他数字则为连接错误
用encoding获得其编码方式
用text方法获得该页面文本信息
以上即为整个过程,是最简单的Python实例
只访问了一次,属于类人行为,亦符合Robots协议。