【发布时间】:2016-03-04 07:43:33
【问题描述】:
拥有这个 html 表格:
<table class="info">
<tbody>
<tr><td class="name">Year</td><td>2011</td></tr>
<tr><td class="name">Area</td><td>45 m<sup>2</sup></td></tr>
<tr><td class="name">Condition</td><td>Renovated</td></tr>
</tbody>
</table>
我正在尝试从每行的第二个单元格中提取数据(它是:2011, 45 m, Renovated)
我使用这个 Xpath 表达式:
//table[@class="info"]//td[2]//text()
收到的输出(错误):
2011
45 m
2
Renovated
期望的输出:
2011
45 m
Renovated
如您所见,从第二行中,我收到了包含在 <sup> 标记中的值。我想排除这个值。
我知道我可以使用这个代替我当前的 Xpath 代码(最后删除了 1 个斜杠):
//table[@class="info"]//td[2]/text()
它会解决问题,但我需要在 <td> 中排除这个特定的 <sup> 标签。因为有时我在 <td> 中有一些我不想排除的标签。
所以,我想从每行的第二个单元格中获取数据并排除 <sup> 标签中的值
【问题讨论】: