python爬爬乐——目录

花了近两个月的时间,整理了一份爬虫相关的学习目录,后期先根据这个目录来更新博客。

总体内容分为三大块:python入门、python进阶、python爬虫。

一、python入门

包含七个知识链:

第一章:Python简介,包含三小节,1.1Python历史,1.2Python语言特点,1.3搭建开发环境

第二章:基础语法,包含六小节,2.1数据类型和变量,2.2标识符和关键字,2.3运算符与表达式,2.4注释,2.5包,2.6编码规范。

第三章:流程控制语句,包含三小节,3.1条件分支语句,3.2循环语句,3.3循环控制语句

第四章:结构类型,包含五小节,4.1列表,4.2元组,4.3字典,4.4集合,4.5迭代器与生成器

第五章:函数和函数式编程,包含四小节,5.1函数介绍,5.2内置函数,5.3自定义函数,5.4函数式编程

第六章:模块,包含三小节,6.1import语句,6.2常用模块,6.3第三方模块

第七章:面向对象编程,包含六小节,7.1面向对象概述,7.2类和对象,7.3属性和方法,7.4继承,7.5多态,7.6枚举类型

二、python进阶

包含六个知识链:

第八章:正则表达式,包含四小节,8.1元字节,8.2量词,8.3分组,8.4re模块

第九章:文件操作,包含四小节,9.1OS模块,9.2File模块,9.3CSV文件操作,9.4JSON文件操作

第十章:数据库操作,包含两小节,10.1MySql操作,10.2SQLite操作

第十一章:网络编程,包含三小节,11.1网络基础,11.2Socket编程,11.3internet模块

第十二章:多线程,包含两小节,12.1多线程基础知识,12.2threading模块

第十三章:异常处理,包含三小节,13.1错误和异常,13.2异常处理,13.3调试

三、python爬虫

包含六个知识链:

第十四章:爬虫基础,包含六小节,14.1HTTP协议,14.2HTML网页基础,14.3javascript基础,14.4爬虫基本原理,14.5Cookie和Session,14.6网络代理

第十五章:静态页面爬虫,包含三小节,15.1urllib用法,15.2requests用法,15.3BeautifulSoup用法

第十六章:动态数据爬虫,包含四小节,16.1如何得到JSON数据(ajax),16.2爬取当天连板股数据,16.3selenium用法,16.4使用selenium爬取分页数据

第十七章:代理的使用,包含三小节,17.1设置代理,17.2代理池,17.3使用代理爬取微信公众号文章

第十八章:手机APP爬虫,包含五小节,18.1Charles用法,18.2mitmproxy用法,18.3mitmdump爬取“得到”APP,18.4appium用法,18.5appium+mitmdump爬取“财联社”APP

第十九章:爬虫框架,包含三小节,19.1pyspider框架,19.2Scrapy框架,19.3分布式爬虫

 

总体学习周期大概是2个月,文章更新的速度根据学习时间来调整,12月之前应该每周1~2篇文章,12月之后每周可以2篇以上,尽量在过年前全部学完并写完,等学习完后,再对于大家比较关心的网站写一个实战系列的文章。

相关文章:

  • 2021-11-23
  • 2021-12-02
  • 2021-06-08
  • 2021-09-07
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2021-08-13
  • 2021-07-07
  • 2021-08-05
  • 2021-12-21
  • 2022-01-01
  • 2022-12-23
  • 2022-01-07
相关资源
相似解决方案