【问题标题】:Unable to concatenate bash variables无法连接 bash 变量
【发布时间】:2017-12-17 04:22:15
【问题描述】:

我收集了数据(5000 行 CSV 数据),我想制作一张图表,但出现了问题。在我的匆忙和兴奋中,我忘记了数据收集是什么时候开始的。 Arduino 程序每秒测量一次温度和光照水平(一分钟内更多),并在该观察结果上标记一个相对时间戳。时间戳是程序启动后的毫秒数。 幸运的是,由于文件上的 Linux 时间戳,我也知道程序结束的时间。所以从结束时间倒推,我就能得到开始时间。

这是开始的数据:(使用 head 命令)

10510707,PV1,1,753.00,PV2,2,129.00,TS1,5,114.13,TS2,7,97.70,WWVB,0,213.00
10512621,PV1,1,753.00,PV2,2,130.00,TS1,5,114.57,TS2,7,97.70,WWVB,0,212.00
10514536,PV1,1,752.00,PV2,2,128.00,TS1,5,114.69,TS2,7,97.70,WWVB,0,212.00
10516450,PV1,1,752.00,PV2,2,129.00,TS1,5,114.80,TS2,7,97.70,WWVB,0,211.00

这是结束数据(使用 tail 命令)

20067422,PV1,1,700.00,PV2,2,89.00,TS1,5,117.39,TS2,7,96.80,WWVB,0,198.00
20069336,PV1,1,700.00,PV2,2,90.00,TS1,5,116.94,TS2,7,96.80,WWVB,0,198.00
20071248,PV1,1,700.00,PV2,2,90.00,TS1,5,116.94,TS2,7,96.80,WWVB,0,198.00
20073161,PV1,1,700.00,PV2,2,90.00,TS1,5,116.94,TS2,7,96.80,WWVB,0,198.00

根据我的计算,第一行的时间戳应该是:

Mon Aug 21 13:04:42 EDT 2017,10510707,PV1,1,753.00,PV2,2,129.00,TS1,5,114.13,TS2,7,97.70,WWVB,0,213.00

最后一行的时间戳应该是:

Mon Aug 21 15:44:04 EDT 2017,20073161,PV1,1,700.00,PV2,2,90.00,TS1,5,116.94,TS2,7,96.80,WWVB,0,198.00

听到我正在处理的脚本:

#!/bin/bash
while IFS='' read -r line || [[ -n "$line" ]]; do

#step 1. Get the very first millisecond value in a variable
VarFirstMilliSeconds=$ cat newberry_subset.csv | awk -F, '{print $1}'

#Subsequent Milliseconds
VarMilliSeconds=$(echo "$line" |cut -d "," -f 1)

#declaration of 1 second
declare -i x=1000

#August 21 2017 converted into epoch date
VarFirstDate=$(date -j -f "%d-%B-%y" 21-AUG-17 +%s)

# First millisecond time - current milliseconds
VarDifferenceOfMilliSeconds=$(expr "$VarFirstMilliSeconds"-"$VarMilliSeconds")


# Calculated difference of first milliseconds and current milliseconds divide 
by 1000
# to get seconds to add to epoch date
VarDifferenceOfSeconds=$(expr "$VarDifferenceOfMilliSeconds"/"$x")


# epoch date with difference of first date and current milliseconds added
NewEpochDate=$(expr "$VarFirstDate"+"$VarDifferenceOfSeconds")

# converted epoch date to human readable format
ConvertedEpochDate=$(echo "$NewEpochDate" | awk '{ print strftime("%c", $1); 
}')

LineWithOutMili=$(echo "$line" | cut -d "," -f 2-16)

ConvertedEpochTime=$(echo "$ConvertedEpochDate" | cut -d " " -f 4 | cut -d ":" 
-f 1-2)

echo "$ConvertedEpochTime,$LineWithOutMili"


done < "$1"

问题是当我运行脚本时它没有连接变量并且生成 csv 需要很长时间

【问题讨论】:

  • 您想对文件中的所有第一列都执行此操作吗?还是只有第一行和最后一行?
  • 文件中的所有第一列。我也愿意使用 awk
  • 第一列的值是什么? 20067422 不是 EPOCH 时间。你为什么在日期命令中硬编码21-AUG-17
  • 这在第 1 步中中断。您需要在整个命令周围使用 $( ),而不仅仅是在开始时使用 $
  • @Inian : 第一个 col 值是“他的时间戳是程序启动后的毫秒数。” (如第一段所述);-) 祝大家好运!

标签: linux bash csv awk


【解决方案1】:

您可以在一个 Awk 命令中完成所有这些操作。除了修复原始 bash 脚本中的几个语法问题。

作为第一步,在 shell 变量中获取 EPOCH 中的原始时间,然后在Awk 中使用它在第一个字段上进行后续转换。我使用了date 命令的FreeBSD 版本,看到您使用了相同的命令。

origin=$(date -j -f "%a %b %d %T %Z %Y" "Mon Aug 21 13:04:42 EDT 2017" +%s)

现在我们将使用origin 变量并进行所需的计算

awk -v start="$origin" 'BEGIN{FS=OFS=","}{delta=sprintf("%.0f", (start - ($1/1000))); $1=strftime("%a %b %e %H:%M:%S %Z %Y",delta)}1' csv_file

或者,如果您想将时间戳作为新列包含在内,并且之前的所有列也都这样做

awk -v start="$origin" 'BEGIN{FS=OFS=","}{delta=sprintf("%.0f", (start - ($1/1000))); print strftime("%a %b %e %H:%M:%S %Z %Y",delta),$0}' csv_file

【讨论】:

  • 您应该提到,这对于 strftime() 来说是 gawk 专用的,并且由于您使用的是 gawk,因此您不需要外部的 date 调用,只需使用 BEGIN{...;start=mktime("2017 08 21 13 04 42")}
  • 非常感谢,快速提问有没有一种方法可以在单个 awk 脚本中删除 PV1 之前原始 csv 文件的第一列(以获得更清晰的脚本)
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2012-12-28
  • 1970-01-01
  • 1970-01-01
  • 2011-03-27
  • 2013-02-13
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多