【发布时间】:2013-07-09 18:51:34
【问题描述】:
我有一个包含两列的 csv 日志文件,每列都有请求(第一列)和响应(第二列)的时间戳。
这是一些示例数据:
2013-07-11 08:39:08.748,2013-07-11 08:39:08.748
2013-07-11 08:39:08.826,2013-07-11 08:39:08.826
2013-07-11 08:39:08.860,2013-07-11 08:39:08.860
2013-07-11 08:39:08.919,2013-07-11 08:39:08.919
2013-07-11 08:39:08.941,2013-07-11 08:39:08.941
2013-07-11 08:39:09.390,2013-07-11 08:39:09.390
2013-07-11 08:39:09.594,2013-07-11 08:39:09.594
2013-07-11 08:39:09.619,2013-07-11 08:39:09.619
2013-07-11 08:39:09.787,2013-07-11 08:39:09.787
2013-07-11 08:39:10.006,2013-07-11 08:39:10.006
2013-07-11 08:39:10.017,2013-07-11 08:39:10.017
2013-07-11 08:39:10.088,2013-07-11 08:39:10.088
2013-07-11 08:39:10.214,2013-07-11 08:39:10.214
我想计算完整文件的两列(响应 - 请求)差异的平均值。该文件一天可以包含数百万个条目。
我正在寻找一种使用 shell 脚本的方法。 请帮忙。
感谢 Fedorqui,我试过你的脚本:
while read line;
do
d1=$(echo $line | cut -d, -f1);
d2=$(echo $line | cut -d, -f2);
ds1=$(date -d"$d1" "+%s");
ds2=$(date -d"$d2" "+%s");
echo "$ds2 - $ds1 = $(( $ds1 - $ds2))";
done < requestResponse.csv
它给了我以下结果:
1373543260 - 1373543260 = 0
1373543260 - 1373543260 = 0
1373543260 - 1373543260 = 0
1373543260 - 1373543260 = 0
1373543260 - 1373543260 = 0
1373543260 - 1373543260 = 0
1373543260 - 1373543260 = 0
1373543261 - 1373543261 = 0
1373543262 - 1373543262 = 0
1373543262 - 1373543262 = 0
我需要以毫秒为单位的差异。
【问题讨论】:
-
awk 可以通过 mktime() 或外部
date做到这一点。但是我可以在不编写任何代码的情况下立即告诉您的示例的输出。 :),它们都是“零”。 :D -
是的,确实是零。这就是为什么在这里发布它。 :(
-
while read line; do d1=$(echo $line | cut -d, -f1); d2=$(echo $line | cut -d, -f2); ds1=$(date -d"$d1" "+%s"); ds2=$(date -d"$d2" "+%s"); echo "$ds2 - $ds1 = $(( $ds1 - $ds2))"; done < file将在转换为 UNIX 标记后为您提供“date1 - date2 = diff”。使用此输出,您可以轻松计算平均值。 -
@fedorqui 我认为您应该将其放在答案中。我也猜想(不确定)OP 可能希望得到毫秒级别的结果。 (只是从示例数据中猜测)
-
@LearnMore 使用当前数据将始终为 0。但是,我将答案更新为以毫秒级别显示。
标签: file shell csv awk log-analysis