【发布时间】:2011-05-03 17:52:52
【问题描述】:
我有以下几点:
<th>
Q4/10
<br>
<span> Nov 30, 2010 </span>
</th>
我想得到Q4/10,但不是接下来的日期。我不确定如何在 HtmlUnit 中执行此操作。我知道我可以用空格分割这两个元素,然后取第一个空格之前的所有内容,但我正在寻找基于标签本身的东西。
【问题讨论】:
我有以下几点:
<th>
Q4/10
<br>
<span> Nov 30, 2010 </span>
</th>
我想得到Q4/10,但不是接下来的日期。我不确定如何在 HtmlUnit 中执行此操作。我知道我可以用空格分割这两个元素,然后取第一个空格之前的所有内容,但我正在寻找基于标签本身的东西。
【问题讨论】:
如果你知道你想要的文本在任何子元素之前,你可以抓住它的第一个子元素,它会包含你的文本和一些空格:
HtmlTableHeaderCell th = ...
System.err.println( th.getFirstChild().toString().trim() ) ;
更通用的解决方案是循环遍历th 的子元素,寻找文本节点,并忽略子元素。
【讨论】: