查找文件中缺失的数字答案

【问题标题】：Find missing numbers in file查找文件中缺失的数字
【发布时间】：2020-07-28 20:34:55
【问题描述】：

我有一个数据文件，其中包含一堆乱序数字，每行一个。我想看看我遗漏了哪些数字（如果有）。

示例数据：

最佳尝试：

cat myfile | sort -n -u | awk 'NR!=$0'
# output:
6
7
8

这有点工作。它打印出行号与该行内容不匹配的所有数字，这至少告诉我我错过了 5，但只能在之后打印所有数字。

在 awk/sed/bash/sort/etc 中有没有好的方法可以做到这一点，还是我必须拔出 python？

我还想查找文件中的重复项及其数量，但cat file | sort -n | uniq -c -d 似乎非常适合。

【问题讨论】：

标签： bash awk sed

【解决方案1】：

在awk:

awk '{a[$0]++; if ($0 > max) max=$0} 
    END { for (i=1; i < max; i++) if(!(i in a)) print i }' < myfile

a 是一个关联数组，它使用文件中的每个数字作为键。 max 包含文件中的最大数字。

最后，我们只检查从 1 到 max 的每个数字，看看它是否在数组中。

【讨论】：

【解决方案2】：

使用来自GNU coreutils 的bash 和sort、seq、uniq 实用程序，并假设文件numbers.txt 中的每一行都是一个正整数，这个两行程序在“差距”。

nums=$(sort -nu numbers.txt)
{ seq ${nums##*$'\n'}; echo "$nums"; } | sort -n | uniq -u

【讨论】：

【解决方案3】：

好吧，我想我明白了（不过如果我搞砸了，请随时告诉我）

cat file | sort -n -u | \
awk 'BEGIN{range=0};{
     if(++range!=$1){
      for (i=range; i<$1; i++)
        {print i}
      range=$1
      }
    }'

它增加一个以行号开始的计数器，检查该行的值是否等于该值。如果相等，则递增并继续。

如果不是，则遍历预期和实际之间的所有数字，并相应地增加预期

它似乎有效！

【讨论】：