课程视频地址:
https://edu.csdn.net/course/detail/28645

BeautifulSoup库的对象

Beautiful库用于将一个复杂的HTML文档转换成一个复杂的树形结构,每个节点都是一个Python对象,根据功能划分,将BeautifulSoup库的对象可分为4类。包括Tag、NavigableString、BeautifulSoup、Comment。
Tag
Tag相当于HTML中的一个标签:
【四二学堂】BeautifulSoup库的对象
【四二学堂】BeautifulSoup库的对象
关于Tag,有name和attrs两个重要的属性,使用方法分别如下。

1)name:标签本身的名字
2)attrs:每个Tag对象的attrs属性就是一个字典,包含了标签的全部属性。
【四二学堂】BeautifulSoup库的对象
NavigableString
用于获取标签内部文字。具体用法如下:

【四二学堂】BeautifulSoup库的对象
【四二学堂】BeautifulSoup库的对象
BeautifulSoup
BeautifulSoup对象表示的是一个文档的全部内容。大部分时候,可以把它当作Tag对象,是一个特殊的Tag,我们可以分别取它的名称、类型以及属性。

【四二学堂】BeautifulSoup库的对象
【四二学堂】BeautifulSoup库的对象
Comment
Comment对象是一个特殊类型的NavigableString对象。
【四二学堂】BeautifulSoup库的对象

加上注释,我们来看一下。

【四二学堂】BeautifulSoup库的对象
【四二学堂】BeautifulSoup库的对象
由上述示例代码运行结果可知,其注释输出只显示其中的内容。

相关文章:

  • 2022-01-06
  • 2021-09-16
  • 2021-06-23
  • 2022-01-08
  • 2021-09-28
  • 2021-03-30
  • 2021-06-28
  • 2021-09-18
猜你喜欢
  • 2021-06-20
  • 2022-01-15
  • 2021-08-27
  • 2021-05-17
  • 2021-07-23
  • 2021-07-29
  • 2022-12-23
相关资源
相似解决方案