Python爬虫实例--新浪热搜榜[正则表达式]

1.基础环境配置:

requests-->版本:2.12.4

re-->:Python自带,无需安装

Python爬虫实例--新浪热搜榜[正则表达式]

2.网页分析

很容易从html源码中看到,热搜内容在html的<a></a>标签内,热度在<span></span>标签内,我们可以利用这一点用正则表达式进行数据抓取。

Python爬虫实例--新浪热搜榜[正则表达式]

3.代码编写

Python爬虫实例--新浪热搜榜[正则表达式]

Python爬虫实例--新浪热搜榜[正则表达式]

4.结果保存:

将提取结果保存在excel里面。

Python爬虫实例--新浪热搜榜[正则表达式]

 

 

 

 

 

 

 

 

相关文章:

  • 2021-12-06
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-04-05
  • 2021-08-11
  • 2022-01-15
猜你喜欢
  • 2021-10-10
  • 2021-10-01
  • 2021-04-23
  • 2021-09-23
  • 2021-08-04
  • 2021-05-19
  • 2021-10-21
相关资源
相似解决方案