【发布时间】:2015-04-21 03:31:03
【问题描述】:
我有一个文本文件中的域名列表,它们在电子邮件文件集合中出现了很多次。例如:
598 aol.com
1 aOL.COM
4 Aol.com
1 AOl.com
6 AOL.com
39 AOL.COM
有 598 封电子邮件发送到 aol.com,1 封发送到 aOL.COM,依此类推。我想知道 bash 中是否有一种方法可以将 aol.com 和 aOL.COM 以及所有其他别名结合起来,因为它们实际上是同一个东西。任何帮助将不胜感激!
这是产生该输出的代码行:
grep -E -o -r "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" $ARCHIVE | sed 's/.*@//' | sort | uniq -c > temp2
【问题讨论】: