Python爬虫始于此（二）

WebScraping (Day 2)
*** get and post request ***
Preparation: python 3.7, requests， re
主要任务：爬取豆瓣电影 Top 250里的内容包括名次、影片名称、国家、导演等字段。

查看豆瓣电影网页
2. 尝试爬取网页，获取前25部电影名

Python爬虫始于此（二）
3. 正式开爬

4. 总结
regex 之变幻让人为之惊叹。本想返回所有top250，但最后一个导演的问题无法爬取。最终只返回top200。
5. 文献
http://funhacks.net/2016/12/27/regular_expression/#匹配中文
 https://www.cnblogs.com/carpenterworm/p/6042210.html

相关文章：

2021-05-23
2021-12-18
2021-08-03
2021-06-03
2022-01-13

猜你喜欢

2021-04-12
2022-01-10
2021-06-25
2021-09-13
2022-01-05
2021-07-06
2021-10-28

相关资源

下载 2022-12-17
下载 2022-12-29
下载 2021-06-06

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode