用python撰写一只爬图片的爬虫

在开始制作爬虫前，我们应该做好前期准备工作，找到要爬的网站，然后查看它的源代码

用python撰写一只爬图片的爬虫

我们这次爬豆瓣美女网站，网址为：https://www.dbmeinv.com/

用到的工具：pycharm ,这是它的图标

用python撰写一只爬图片的爬虫

打开后，进入它的界面

用python撰写一只爬图片的爬虫

接下来就是创建一个项目，

用python撰写一只爬图片的爬虫

用python撰写一只爬图片的爬虫

用python撰写一只爬图片的爬虫

我们给它命名为Demo,准备工作做好后，就可以撰写一只爬虫了

1，我们先把这次需要用到的三个包先给它导进去

用python撰写一只爬图片的爬虫

2，用request包获取网页数据，我们通过调用函数的方法实现操作

用python撰写一只爬图片的爬虫

3，在网页上查看源代码，发现每张图片都是img标签，每个img标签又对应着一个src路径

用python撰写一只爬图片的爬虫

4，用Beautifulsoup创建对象解析网页，找到所有img标签。

用python撰写一只爬图片的爬虫

5，获得所有img的src路径

用python撰写一只爬图片的爬虫

6，用urllib将获取的Src路径里的图片下载下来

用python撰写一只爬图片的爬虫

但运行后出现错误

用python撰写一只爬图片的爬虫

最后一行报错[Errno 2] No such file or directory: './image/0.jpg'没有这样的文件或目录，所以我们应先建一个文件来存放下载的图片

用python撰写一只爬图片的爬虫

用python撰写一只爬图片的爬虫

然后再次运行

用python撰写一只爬图片的爬虫

可能觉得爬一个网页不过瘾，毕竟美女那么多

用python撰写一只爬图片的爬虫

可以看出豆瓣网不止一页，接下来，我们就来爬取多个网页的美女图片

用python撰写一只爬图片的爬虫

整体代码有部分改动，等等再一一细解

用python撰写一只爬图片的爬虫

改动部分

用python撰写一只爬图片的爬虫

把x=0移到第四行，是为了避免X=0被循环调用，以致图片被覆盖。

page=1,表示初次调用的是该网站的第一页，而.format(page)和最下面的.format(i)合起来就是page=i,就是显示网站的第i页。

7，查看我们是否成功爬到图片

用python撰写一只爬图片的爬虫

答案就在这里啦，显而易见，是不是很动心呢，赶紧学起来吧，各种各样的美女图片都可以爬哦。

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode