爬虫贪婪匹配以及非贪婪匹配

import re

html = \'\'\'
<div><p>九霄龙吟惊天变</p></div>
<div><p>风云际汇潜水游</p></div>
\'\'\'
# 贪婪匹配
pattern = re.compile(\'<div><p>.*</p></div>\',re.S)
r_list = pattern.findall(html)
print(r_list)

# 非贪婪匹配
pattern = re.compile(\'<div><p>(.*?)</p></div>\',re.S)
r_list = pattern.findall(html)
print(r_list)

匹配任意一个字符的正则表达式：

import re
# 方法一
pattern = re.compile(\'.\',re.S)
# 方法二
pattern = re.compile(\'[\s\S]\')

匹配任意多个字符的正则表达式：

import re
# 方法一
pattern = re.compile(\'.*？\',re.S)
# 方法二
pattern = re.compile(\'[\s\S]*？\')

2021-10-22
2021-11-29
2021-11-29
2021-11-29
2021-12-12
2021-11-29
2021-07-04
2021-11-29