【问题标题】:How to manipultate intervals in a three column table如何操作三列表中的间隔
【发布时间】:2020-05-24 01:30:33
【问题描述】:

我有一个文件,整理后我把其中的一部分贴在下面:

area1   38896   39876
area1   39532   40521
area1   55975   56958
area1   73070   74098
area1   79689   79934
area2   43757   46798
area2   44055   47111
area2   54208   54354
area2   57000   59336
area2   69391   72882
area3   49621   50967
area3   49946   51322
area3   53044   53505
area3   65205   66473
area3   66888   68294

我的目标是通过将每个区域的最后一组坐标减去第一个坐标来获得这些区域的一个区间。 根据定义,笛卡尔系统中2点的内部是d= sqrt( (X2 –x1)^2 +(y2 –y1)^2 ) 最初,我试图用bedtool找到解决方案,但没有找到与我的案例相关的任何东西。

我想要的输出:

d area1 =sqrt{ (79689 -38896) ^2 + (79934-39876) ^2}

d area2 =sqrt{ (69391-43757 ) ^2 + (72882-46798)^2}

我写这个提示:

Cat myfile | sort -k1,1 -k2,2n |sort -V  |awk 'NR %5==1 {print $1,$2,$3 } NR%5==0 {print $1,$2,$3}'|awk {for (i=2; i<=$i ;i++) {a[i]=sqrt((p[i]*p[i])+($i*$1))}  } { for(i=2; i<=$i ;i++) {p[i]=$i;}  }  /[0-9]/{ for (i in a) {printf "%s ",a[i]};print "";print "" } 

但我没有做我想做的事。有谁知道如何处理它?

【问题讨论】:

标签: awk command


【解决方案1】:

不是最优化的解决方案,但这应该可以。

sort -k1,1 -k2,2n -k3,3n < your_file_name | \
awk '{if(length(x1[$1])==0) x1[$1]=$2; x2[$1]=$2;\
if(length(y1[$1])==0) y1[$1]=$3; y2[$1]=$3;} END \
{for (i in x1) print i, sqrt((x2[i]-x1[i])^2+(y2[i]-y1[i])^2)}'

解释:

sort -k1,1 -k2,2n -k3,3n  --  Sort data and numeric sort for column 2 and 3
if(length(x1[$1])==0) x1[$1]=$2; x2[$1]=$2;--  Use associate array to get first value for each area name 
END -- Loop through all records 

演示:

$sort -k1,1 -k2,2n -k3,3n < area.txt | awk '{if(length(x1[$1])==0) x1[$1]=$2; x2[$1]=$2;\
if(length(y1[$1])==0) y1[$1]=$3; y2[$1]=$3;} END \
{for (i in x1) print i, sqrt((x2[i]-x1[i])^2+(y2[i]-y1[i])^2)}'
area1 57172.7
area2 36571.5
area3 24461.7
$cat area.txt 
area1 38896 39876
area1 39532 40521
area1 55975 56958
area1 73070 74098
area1 79689 79934
area2 43757 46798
area2 44055 47111
area2 54208 54354
area2 57000 59336
area2 69391 72882
area3 49621 50967
area3 49946 51322
area3 53044 53505
area3 65205 66473
area3 66888 68294
$

$sort -k1,1 -k2,2n -k3,3n < area.txt | awk '{if(length(x1[$1])==0) x1[$1]=$2; x2[$1]=$2;\
if(length(y1[$1])==0) y1[$1]=$3; y2[$1]=$3;} END \
{for (i in x1) print i, x2[i], x1[i], y2[i], y1[i]}'
area1 79689 38896 79934 39876
area2 69391 43757 72882 46798
area3 66888 49621 68294 50967
$

【讨论】:

    猜你喜欢
    • 2016-09-16
    • 1970-01-01
    • 1970-01-01
    • 2023-04-02
    • 2012-03-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-11-13
    相关资源
    最近更新 更多