【发布时间】:2014-10-30 22:27:57
【问题描述】:
我有一长串 100k+ 的 IP 地址在某个范围内,这个脚本的一个例子是:
67.0.105.76 0
67.0.123.150 0
67.0.123.150 0
67.0.123.150 0
67.0.123.150 0
67.0.123.150 0
67.0.123.150 0
67.0.123.150 0
67.0.123.150 0
67.0.105.76 0
67.0.123.150 0
67.0.163.127 0
67.0.123.150 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.163.127 0
67.0.105.76 0
67.0.105.76 0
67.0.105.76 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.232.158 0
67.0.105.76 0
67.0.143.13 0
我想从这个列表中删除任何未多次列出的 IP,因此假设我想从上面的列表中删除所有未列出 5 次或更多次的 IP。然后它会输出:
67.0.105.76 0
67.0.123.150 0
67.0.163.127 0
67.0.232.158 0
我尝试在 Linux 中使用 sed/uniq 来完成此操作,但无法找到一种方法来执行此操作,是否需要 python 脚本或类似的方法,或者是否有可能使用 sed/uniq 的方法?
使用 sort -u 100kfile,它能够删除所有重复项,但仍然保留单个 ip。
【问题讨论】:
标签: python linux sorting sed uniq