这里写自定义目录标题

选取网页-iwatch京东官方自营店

https://item.jd.com/100008348586.html

如图所示
书写第一个Python小项目:京东商品页面的爬取
我们将爬取该界面的信息

编译器选择了Python自带的编译器IDLE,
首先打开IDLE,
利用import requests语句加载requests库(安装Python后,需要在命令提示符后安装requests库,安装方式会在后面说明)
书写第一个Python小项目:京东商品页面的爬取
然后用requests库中的get方法,获取该链接的内容
书写第一个Python小项目:京东商品页面的爬取
用一行代码测试其状态码的信息
书写第一个Python小项目:京东商品页面的爬取
“200”证明连接状态正常,且获得了相应的内容,其他数字则为连接错误
encoding获得其编码方式
书写第一个Python小项目:京东商品页面的爬取
text方法获得该页面文本信息
书写第一个Python小项目:京东商品页面的爬取
以上即为整个过程,是最简单的Python实例
只访问了一次,属于类人行为,亦符合Robots协议。

相关文章:

  • 2021-10-16
  • 2022-01-03
  • 2021-11-17
  • 2021-12-05
  • 2021-11-12
  • 2021-07-09
  • 2021-07-20
  • 2021-10-31
猜你喜欢
  • 2021-11-30
  • 2022-01-07
  • 2021-11-30
  • 2021-08-28
  • 2022-01-14
  • 2021-10-03
  • 2022-12-23
相关资源
相似解决方案