【发布时间】:2019-01-15 20:26:52
【问题描述】:
我使用 lxml 执行 xpath 以获取类型为 etree._Element 的节点。 我也有一些 bs4.Tag 类型的节点。
然后我想知道这两个节点是否指的是同一个 HTML 元素。最好的方法是什么?
我目前做的是一种非常简单的方法来检查以下事物(例如)的相等性:
- 标签名称
- HTML 属性,例如 id、class 等
- 字符串内容 ...
或者只是从根到该节点的规范路径。
但是,这并不方便。
【问题讨论】:
-
这些都不能帮助您确定它们是否引用相同的 HTML 元素。您必须比较引导您到达它们的路径。
-
@intentionallyleftblank 确定....
-
为什么不选择一个库并坚持下去?
-
@pguardiario 我想用bs4提供的约定函数来处理DOM树,但是不能执行xpath。
-
契约函数?我认为你编造了。
标签: python beautifulsoup lxml