daniumiqi

学爬虫,需要理论与实践相结合,Python生态中的爬虫库多如牛毛,urllib、urllib2、requests、beautifulsoup、scrapy、pyspider都是爬虫相关的库,但是如果没有理论知识,纯粹地学习如何使用这些API如何调用是不会有提升的。所以,在学习这些库的同时,需要去系统的学习爬虫的相关原理。
你需要懂的技术包括但不限于Python编程语言、HTTP协议(TCP/IP协议栈)、数据库、Linux等知识

Python入门:《A Byte of Python》
HTTP入门:《图解HTTP》
数据库入门:《MySQL必知必会》
Linux入门:《快乐的 Linux 命令行》
正则入门:《精通正则表达式 》
还有一本专门讲爬虫的书:《用Python写网络爬虫》

分类:

技术点:

相关文章:

  • 2021-11-05
  • 2021-08-27
  • 2021-08-27
  • 2021-12-23
  • 2021-09-07
  • 2021-10-01
  • 2021-08-06
猜你喜欢
  • 2021-12-28
  • 2021-10-16
  • 2021-08-27
  • 2021-11-04
  • 2021-12-29
相关资源
相似解决方案