【发布时间】:2012-08-11 11:58:10
【问题描述】:
我想提取 HTML 页面中特定表格单元格中存在的一些文本。
现在,问题是,这个单元格存在于一个没有 ID/名称的表格标签中。
我正在使用 HTML::TreeBuilder::XPath 通过 XPATH 表达式提取值。
HTML 内容如下所示:
<table border="0">
<tr>
<td>Some Text</td>
<td>The Text I want comes here</td>
</tr>
这就是我的 XPATH 表达式的样子:
@nodes=$tree->findnodes(q{//table[8]/tr/td[2]/text()});
print $_->string_value."\n" foreach(@nodes); # corrected, thanks mirod.
它不显示输出。
我用过,上面的table[8],因为这是HTML页面中的8个table标签(假设索引从1开始)。
另外,我使用了 td[2],因为我想要第二个 td 标记之间的 innerHTML。
谢谢。
【问题讨论】: