1.HTML基本格式
基于bs4库的HTML
下行遍历:根节点向叶子节点遍历
上行
平行

2.标签树的下行遍历
.contents 子节点的列表,将所有子节点存入列表
.children 子节点的迭代类型,用于循环遍历
.descendants 子孙节点的迭代类型,包含所有子孙节点,用于循环遍历
基于bs4库的HTML

3.标签树的上行遍历基于bs4库的HTML

标签树的平行遍历
基于bs4库的HTML
所有平行遍历必须发生在同一个父亲节点下!!

循环遍历
基于bs4库的HTML
2.基于bs4库的HTML格式化和编码
如何让html的内容更加友好的显示?
2.1prettify()方法
可以使得HTML编码显示的更加整洁,如下:
基于bs4库的HTML
具体方法:
基于bs4库的HTML

相关文章: