【发布时间】:2014-11-01 15:56:19
【问题描述】:
假设我有this 网页,我正在考虑包含字符串Doe 的表的td 元素。使用 Google Chrome,我可以获得该元素的 CSS 路径:
#main > table:nth-child(6) > tbody > tr:nth-child(3) > td:nth-child(3)
使用它作为 Jsoup CSS Query 返回我正在考虑的元素,如您所见 here。
Jsoup 是否可以从 Element 获取上述 CSS 路径 或者我必须手动遍历树来创建它?
我知道我可以使用 CSS 查询 :containsOwn(text) 使用 Element 自己的文本,但这也可以选择其他元素,路径只包含类、id 和 @987654329 @。
这对于在 JSoup 中编写能够提取相似元素的语义解析器非常有用。
【问题讨论】:
-
不支持您的要求。不过,这将是一个不错的功能。
-
@alkis 现在 jsoup 支持它;)
-
+1。干得好,恩里科。
标签: css path html-parsing jsoup