【发布时间】:2022-11-11 19:19:14
【问题描述】:
我想要做的是删除我正在使用的文本中随机弹出的某些日期字符串,格式如下:14 Sept 2021 但日、月和年是动态的,因此可以更改。
我试过的是:
def clean_up_answer(answer):
date_pattern = re.search("(\d{2}[.]+\d{4}[.]+\d{4})", answer)
if date_pattern is not None and date_pattern != 'None':
answer = re.sub('(\d{2}[.]+\d{4}[.]+\d{4})', '', answer)
return answer.strip()
else:
return answer.strip()
我认为正则表达式最适合这个,但我的正则表达式不稳定,从我可以看到上面的代码看起来不错,但显然没有删除特定的字符串,任何帮助将不胜感激。
【问题讨论】:
-
您仅使用
digits和dots`` but2021 年9 月14 日` 搜索字符串具有没有数字的字符串Sept。您还必须搜索字母[A-Za-z]或Sept|May|April之类的单词,以及元素之间的空格。也许您应该创建许多分离的正则表达式并在for-loop 中检查它们