正则表达式和 re 模块

正则表达式究竟是什么？

在一些网站注册的时候需要输入手机号码，当你输入一个错误的手机号码的时候，会提示你输入的手机号码格式错误

那么他究竟是如何判断的呢？

我们用Python代码进行表示：

phone_number = input('please input your phone number ： ')

现在关键问题是如何判断我们输入的号码是否合法，

最后根据手机号码一共11位并且是只以13、14、15、17、18开头的数字这些特点，又用python写了如下代码：

while True:
    phone_number = input('please input your phone number ： ')
    if len(phone_number) == 11 \
            and phone_number.isdigit()\
            and (phone_number.startswith('13') \
            or phone_number.startswith('14') \
            or phone_number.startswith('15') \
            or phone_number.startswith('17') \
            or phone_number.startswith('18')):
        print('是合法的手机号码')
    else:
        print('不是合法的手机号码')

那么有不有简单的判断方法呢？答案是肯定的，以下方法就是使用re模块的正则表达式来匹配手机的合法性的方法

import re
phone_number = input('please input your phone number ： ')
if re.match('^(13|14|15|17|18)[0-9]{9}$',phone_number):
        print('是合法的手机号码')
else:
        print('不是合法的手机号码')

正则表达式究竟是什么？首先谈到正则，就只和字符串相关了。

正则表达式本身和Python没有什么关系，其本身就是匹配字符串内容的一种规则。

官方定义：正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

一些正则表达式的实用工具：在线测试工具 http://tool.chinaz.com/regex/

正则表达式

字符组：

在同一个位置可能出现的各种字符组成了一个字符组，在正则表达式中用 [] 表示

字符分为很多类，比如数字、字母、标点等等

例如现在要求一个位置只能出现一个数字，那么这个位置上的字符只能是0、1、2~9这10个数之一。

正则	待匹配字符	匹配结果	说明
[0123456789]	8	True	在一个字符组里枚举合法的所有字符，字符组里的任意一个字符和"待匹配字符"相同都视为可以匹配
[0123456789]	a	False	由于字符组中没有"a"字符，所以不能匹配
[0-9]	7	True	也可以用-表示范围,[0-9]就和[0123456789]是一个意思
[a-z]	s	True	同样的如果要匹配所有的小写字母，直接用[a-z]就可以表示
[A-Z]	B	True	[A-Z]就表示所有的大写字母
[0-9a-fA-F]	e	True	可以匹配数字，大小写形式的a～f，用来验证十六进制字符

字符：

元字符	匹配内容
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线
\d	匹配数字
\s	匹配任意的空白符
\n	匹配一个换行符
\t	匹配一个制表符
\b	匹配一个单词的结尾
^	匹配字符串的开始
$	匹配字符串的结尾
\W	匹配非字母或数字或下划线
\D	匹配非数字
\S	匹配非空白符
a\|b	匹配字符a或字符b
()	匹配括号内的表达式，也表示一个组
[...]	匹配字符组中的字符
[^...]	非。匹配除了字符组中字符的所有字符

量词：

量词	用法说明
*	贪婪匹配：重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

re 模块下的常用方法

findall

查找所有

*当要从一个字符串中找到所有想要的结果时，使用 findall

import re

ret = re.findall('e', 'evenroot')  # 返回所有满足匹配条件的结果,放在列表里
print(ret) #结果 : ['e', 'e']

import re

ret = re.findall('[a-z]+', 'even root yuan')
    # 返回所有满足匹配条件的结果,放在列表里
print(ret)  #结果['even', 'root', 'yuan']

search

找第一个

*当只需要从一个字符串中找到一个结果的时候，使用 search

import re

ret = re.search('x','eeevvadfae fsdf zzzzc c')
print(ret)
print(ret.group())
#从前往后，找到一个就返回，返回的变量需要调用group才能拿到结果
#如果没有找到，那么返回None，调用group会报错

None
Traceback (most recent call last):
  File "D:/Python Road/re模块.py", line 31, in <module>
    print(ret.group())
AttributeError: 'NoneType' object has no attribute 'group'

显示结果