【发布时间】:2011-10-19 20:32:31
【问题描述】:
谁能解释我如何从<th> 具有内容值的<td> 标签中抓取内容(实际上在这种情况下,我需要<b> 标签的内容进行匹配操作)“Row1 标题”,但不抓取@ 987654324@ 标签(或其任何内容)正在处理中?这是我的测试 HTML:
<table class="table_class">
<tbody>
<tr>
<th>
<b>
Row1 title
</b>
</th>
<td>2.660.784</td>
<td>2.944.552</td>
<td>Correct, has 3 td elements</td>
</tr>
<tr>
<th>
Row2 title
</th>
<td>2.660.784</td>
<td>2.944.552</td>
<td>Correct, has 3 td elements</td>
</tr>
</tbody>
</table>
我要提取的数据应该来自这些标签:
<td>2.660.784</td>
<td>2.944.552</td>
<td>Correct, has 3 td elements</td>
我设法创建了返回表的全部内容的函数,但我想从结果中排除 <th> 节点,并只返回来自 <td> 节点的数据,我可以使用这些内容进行进一步解析.谁能帮我解决这个问题?
【问题讨论】:
标签: clojure screen-scraping enlive