【发布时间】:2014-11-25 21:20:49
【问题描述】:
我有一个 html 表格,其中第一行是标题,接下来的行代表表格的主体。我想从每行的第 3 列中提取值。我该如何继续?
【问题讨论】:
我有一个 html 表格,其中第一行是标题,接下来的行代表表格的主体。我想从每行的第 3 列中提取值。我该如何继续?
【问题讨论】:
试试下面的 awk 命令,
awk 'NR>1{print $3}' file
这将打印除标题中的第三列之外的第三列的值。
更新:
awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file
【讨论】:
awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file