import re html = \'\'\' <div><p>九霄龙吟惊天变</p></div> <div><p>风云际汇潜水游</p></div> \'\'\' # 贪婪匹配 pattern = re.compile(\'<div><p>.*</p></div>\',re.S) r_list = pattern.findall(html) print(r_list) # 非贪婪匹配 pattern = re.compile(\'<div><p>(.*?)</p></div>\',re.S) r_list = pattern.findall(html) print(r_list)
匹配任意一个字符的正则表达式:
import re # 方法一 pattern = re.compile(\'.\',re.S) # 方法二 pattern = re.compile(\'[\s\S]\')
匹配任意多个字符的正则表达式:
import re # 方法一 pattern = re.compile(\'.*?\',re.S) # 方法二 pattern = re.compile(\'[\s\S]*?\')