【发布时间】:2013-06-13 15:29:47
【问题描述】:
我想从 HTML 文档中获取值列表。我正在使用 HTMLUnit。
类主题有很多span元素。我想提取跨度标签内的内容:
<span class="topic">
<a href="http://website.com/page/2342" class="id-24223 topic-link J_onClick topic-info-hover">Lean Startup</a>
</span>
我的代码如下所示:
List<?> topics = (List)page.getByXPath("//span[@class='topic']/text()");
但是,每当我尝试遍历列表时,我都会得到一个NoSuchElementException。任何人都可以看到一个明显的错误吗?还可以提供优秀教程的链接。
【问题讨论】:
-
您可以添加错误附带的行吗?从 xpath 中删除 text() 并使用 HtmlElement.getTextContent() 是一种更好、更安全的解决方案。