【发布时间】:2021-11-14 06:21:56
【问题描述】:
我比较了两个不同长度的文件,我首先发现了文件 1 中存在但文件 2 中不存在的唯一 ID。
但是,现在我想在文件之间找到共同的唯一值,我已经多次看到使用 comm 命令,但是这些文件的长度不同。
示例
文件 1:
2
4
6
8
10
文件 2:
9
8
7
6
5
4
3
2
1
期望的输出:
2
4
6
8
为了寻找独特的差异,我使用了以下命令:
awk 'FNR==NR {a[$0]++; next} !($0 in a)' file1.sorted file2.sorted > diff_values.txt
为了寻找共同值,我尝试使用以下命令,但不完全确定这是否是正确的方法或是否存在任何替代方法:
comm -12 file1.sorted file2.sorted > comm_values.txt
【问题讨论】:
-
a[$0]++中的++除了占用 CPU 周期和可能的内存之外什么都不做。
标签: awk text-processing