【问题标题】:Extract values from a specific column of an html table using bash使用 bash 从 html 表的特定列中提取值
【发布时间】:2014-11-25 21:20:49
【问题描述】:

我有一个 html 表格,其中第一行是标题,接下来的行代表表格的主体。我想从每行的第 3 列中提取值。我该如何继续?

【问题讨论】:

    标签: html bash awk sed


    【解决方案1】:

    试试下面的 awk 命令,

    awk 'NR>1{print $3}' file
    

    这将打印除标题中的第三列之外的第三列的值。

    更新:

    awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file
    

    【讨论】:

    • 没有。它不起作用。我认为在这种情况下应该使用分隔符()。
    • 您能否提供一个示例以及预期的输出?
    • awk -v RS='' -v F='' '{print $3}' - 这将打印 value。如何从这里提取价值?
    • awk -v RS='&lt;/tr&gt;' -v F='&lt;td&gt;' '{$3=gsub(/&lt;[^&lt;&gt;]*&gt;/,"",$3);print $3}' file
    猜你喜欢
    相关资源
    最近更新 更多
    热门标签