【问题标题】:Summing rows in a file对文件中的行求和
【发布时间】:2015-06-16 22:31:08
【问题描述】:

我想根据一个列字段添加行。是否可以通过 awk 命令或任何简单的方式来完成?

Date    Hour  Requests   Success  Error
10-Apr  11      1           1       0
10-Apr  13      1           1       0
10-Apr  14      1           1       0
10-Apr  18      1           1       0
10-Apr  9       1           1       0
10-Apr  11      1           1       0
10-Apr  12      3           3       0
10-Apr  13      2           1       1
10-Apr  14      2           2       0
10-Apr  15      1           1       0
10-Apr  16      1           1       0
10-Apr  12      3           3       0
10-Apr  13      4           1       3
10-Apr  14      1           1       0
10-Apr  16      2           2       0
10-Apr  18      1           1       0
10-Apr  10      3           3       0
10-Apr  11      1           1       0
10-Apr  12      3           3       0
10-Apr  13      1           1       0
10-Apr  14      2           2       0
10-Apr  15      2           2       0
10-Apr  16      2           2       0
10-Apr  17      2           2       0

从上表中,我想根据小时添加行(请求、成功、错误),并且 o/p 应该如下所示

Date   Hour  Requests Success Error
10-Apr  9       1       1       0
10-Apr  10      3       3       0
10-Apr  11      3       3       0
10-Apr  12      9       9       0
10-Apr  13      8       4       4
10-Apr  14      6       6       0
10-Apr  15      3       3       0
10-Apr  16      5       5       0
10-Apr  17      2       2       0
10-Apr  18      2       2       0

【问题讨论】:

  • 仅供参考,您的意思是 sum fields 不是 add rows

标签: arrays shell unix awk sed


【解决方案1】:

使用 GNU awk 处理真正的多维数组并排序 in

$ cat tst.awk
NR==1 { print; next }
!seen[$1]++ { dates[++numDates] = $1 }
{ for (i=3;i<=NF;i++) sum[$1][$2][i] += $i }
END {
    PROCINFO["sorted_in"] = "@ind_num_asc"
    for (dateNr=1; dateNr<=numDates; dateNr++) {
        date = dates[dateNr]
        for (hr in sum[date]) {
            printf "%s %s ", date, hr
            for (i=3;i<=NF;i++) {
                printf "%s%s", sum[date][hr][i], (i<NF?OFS:ORS)
            }
        }
    }
}
$ awk -f tst.awk file | column -t
Date    Hour  Requests  Success  Error
10-Apr  9     1         1        0
10-Apr  10    3         3        0
10-Apr  11    3         3        0
10-Apr  12    9         9        0
10-Apr  13    8         4        4
10-Apr  14    6         6        0
10-Apr  15    3         3        0
10-Apr  16    5         5        0
10-Apr  17    2         2        0
10-Apr  18    2         2        0

我不确定您的字段是空格还是制表符分隔,因此没有尝试在 awk 中格式化输出。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-07-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-01-16
    • 1970-01-01
    相关资源
    最近更新 更多