Python个爬虫常用库的安装

工具库:

请求库:request seleinum

解析库:beautifulsoup pyquery lxml

存储库:mogodb,mysql,redis

 

1.urllib / re

[内置的]

import urllib

import re

2.request

第三方安装:pip

pip install requests

Python爬虫 安装库

不要使用尖括号

3.selenium

 

有js渲染的网站,可用selenium驱动浏览器

 

4.Chromedriver【将exe放在已配置好环境变量的目录下,或添加环境变量】

from selenium import webdriver

driver = webdriver.Chrome

driver.get('http://www.baidu.com')

driver.page_source//打印源码

 

5.phantomjs

from selenium import webdriver

driver = webdriver.PhantomJS()

driver.get('http://www.baidu.com')

driver.page_source//打印源码

6.lxml

7.beautifulsoup

8.pyquery

from pyquery import PyQuery as pq

doc = pq('<html>hello</html>')

result = doc('html').text()

result

//输出为hello

9.pymysql

10.pymongo

11.redis

12.flask

13.django

14.jupyter

jupyter notebook【可在网页运行Python】

以上几个模块都可以用pip install +库名来安装

相关文章:

  • 2022-01-30
  • 2021-09-11
  • 2022-12-23
  • 2021-08-25
  • 2021-11-13
  • 2021-05-06
  • 2021-08-10
  • 2022-01-07
猜你喜欢
  • 2021-11-19
  • 2021-07-01
  • 2022-12-23
  • 2021-08-21
  • 2022-01-07
  • 2021-05-11
相关资源
相似解决方案