正则表达式是一种符号表示法,被用来识别文本模式。在某种程度上,它们与匹配文件和路径名的 shell 通配符比较相似,但其规模更大。许多命令行工具和大多数的编程语言都支持正则表达式,以此来帮助解决文本操作问题。

正则表达式元字符由以下字符组成:

^ $ . [ ] { } - ? * + ( ) |
Linux操作系统正则表达式与 grep 命令

例一:利用 Linux 系统自带的字典查找一个五个字母的单词,第三个字母为 j,最后一个字母为 r,/usr/share/dict目录下存放字典文件(若没有可手动建立),可以使用如下命令:

grep ‘^…j.r$’ words

例二:验证固定电话,打印符合条件的电话,固定电话格式基本都是带有 0 的区号+连接符“-”+电话号码,另外还有可能有分机号,区号有 3 位、4 位,电话号码有 7 位和 8 位的,可以使用如下命令:

grep -E “^0[0-9]{2,3}-[0-9]{7,8}(-[0-9]{3,4})?$” telphone.txt

区号:前面一个 0,后面跟 2-3 位数字 0[0-9]{2,3}

电话号码:7-8 位数字 [0-9]{7,8}

分机号:一般都是 3-4 位数字 [0-9]{3,4}
注意执行下面的命令时没有任何匹配输出,这是因为没有加 -E 选项,那例一没加为什么可以呢,这是因为 grep 把.当成 shell 通配符,不是正则表达式的元字符。

相关文章:

  • 2021-06-19
  • 2021-12-14
  • 2021-12-13
  • 2021-12-13
  • 2022-12-23
  • 2021-12-13
  • 2021-12-23
猜你喜欢
  • 2022-12-23
  • 2021-12-12
  • 2021-12-13
  • 2022-01-24
  • 2021-12-13
  • 2021-06-28
  • 2021-08-31
相关资源
相似解决方案