招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条 2.数据处理: 采用pandas对爬取的数据进行清晰和处理 2.数据分析: 采用flask后端获取mongodb数据,前端使用bootstrap3.echarts以及D3的词云图

###注意:1. pymongo安装版本 <=3.0 建议 pip install pymongo==2.8### 2. 如果scrapy安装不上,在这上面查找https://www.lfd.uci.edu/~gohlke/pythonlibs/ 先安装对应版本 twisted ,再安装scrapy就没问题。 3.mongodb启动,进入安装mongodb的文件夹的bin目录下面,输入 mongod --dbpath= data文件夹路径

关于项目启动

  1. 爬虫:

    1.cd 目录 2. pip install pymongo==2.8 3. scrapy crawl zlzp

  2. 数据可视化

    1. **虚拟环境 cd venv/Scripts activate
    2. python zlzpView.py

项目源码:https://github.com/Frank-qlu/recruit 

51job招聘爬虫&数据分析

51job招聘爬虫&数据分析

51job招聘爬虫&数据分析

51job招聘爬虫&数据分析

51job招聘爬虫&数据分析

相关文章:

  • 2021-08-27
  • 2021-11-07
  • 2021-11-06
  • 2022-01-07
  • 2021-11-21
  • 2021-09-08
  • 2021-12-05
猜你喜欢
  • 2021-08-27
  • 2021-08-27
  • 2018-11-09
  • 2021-08-27
  • 2021-11-24
  • 2021-12-26
  • 2021-08-19
  • 2021-08-27
相关资源
相似解决方案