1.什么是网页解析器

从网页中提取有价值数据的工具,网页解析器会通过html网页字符串提取出有价值的数据和新URL列表


2.Python的几种网页解析器

Python爬虫基础-网页解析器-02

模糊匹配:针对字符串来匹配
结构化解析:DOM树

2.1网页解析器--beautiful soup

Python第三方库,用于从HTML 或XML中提取数据

2.2 安装beautiful soup 

通过cmd切换到python3.6\Scripts目录下执行pip install beautifulsoup4进行下载安装

2.3beautiful soup语法


html网页---->创建BeautifulSoup对象 -->搜索节点(find_all、find 可以按照节点名称、属性、文字来搜索)-->访问节点名称、属性、文字





















相关文章:

  • 2021-04-10
  • 2021-05-29
  • 2021-12-19
  • 2021-09-10
  • 2021-12-01
  • 2021-08-30
  • 2022-12-23
  • 2022-01-12
猜你喜欢
  • 2022-12-23
  • 2021-11-27
  • 2021-05-19
  • 2023-04-10
  • 2021-09-14
  • 2021-08-15
  • 2022-12-23
相关资源
相似解决方案