【发布时间】:2018-08-13 00:14:22
【问题描述】:
我需要将文件 2 的“值”列合并到文件 1,以使 col1-col2 唯一对组合保持不变。可以跳过不匹配的组合。我是 python/awk 的新手。所以,我需要指导方针或想法来解决问题。
我没有使用 python pandas 包的权限,因此希望有其他替代解决方案。
提前感谢您的支持。
文件 1
col1 col2
559 1 558 1
559 0 558 0
558 1 557 1
558 0 557 0
504 2 255 0
504 1 192 0
504 0 367 0
255 0 187 1
227 0 185 0
192 0 187 0
187 0 185 1
185 0 183 1
183 0 171 1
171 0 9 0
1236 1 766 0
1236 0 903 0
文件 2
col1 col2 value
559 1 91987224 2400000000
559 0 91987224 100000000
558 1 64064811 2400000000
558 0 91987224 100000000
557 1 59966218 2400000000
557 0 64064811 100000000
555 0 59966218 2500000000
533 0 87947477 5000000000
504 2 53048833 1000000000
504 1 19225707 100000000
504 0 35811624 5000000000
255 0 1687416 2800000000
227 0 101635574 100000000
192 0 7894664 100000000
187 0 1687416 2900000000
185 0 1687416 3000000000
183 0 1687416 4000000000
171 0 1687416 5000000000
想要的输出:
559 1 2400000000
559 0 100000000
558 1 2400000000
558 0 100000000
557 1 2400000000
557 0 100000000
555 0 2500000000
533 0 5000000000
504 2 1000000000
504 1 100000000
504 0 5000000000
255 0 2800000000
227 0 100000000
192 0 100000000
187 0 2900000000
185 0 3000000000
183 0 4000000000
171 0 5000000000
1236 1 -
1236 0 -
【问题讨论】:
-
输出应该是什么样的?
-
只需将“值”列从 File2 合并到 File1。可以跳过不匹配的值。将很快用所需的输出编辑我的问题。 Tnx @蝙蝠侠
-
@Batman ...我添加了所需的输出
标签: python unix awk merge multiple-columns