【发布时间】:2021-11-24 09:27:30
【问题描述】:
我有以下数据,我想从中只检索消息男孩部分并删除与“转发”标题相关的所有信息。
---------------------- Forwarded by Phillip K Allen/HOU/ECT on 03/21/2000
01:24 PM ---------------------------
Stephane Brodeur
03/16/2000 07:06 AM
To: Phillip K Allen/HOU/ECT@ECT
cc:
Subject: Maps
As requested by John, here's the map and the forecast...
Call me if you have any questions (403) 974-6756.
到目前为止我尝试过的低于正则表达式。 matchObjj = re.search(r'(---.*?)Subject:', tmp_text, re.DOTALL)
当我使用以下命令打印时
print( tmp_text[matchObjj.span()[1]:])
我得到低于输出。
Maps
As requested by John, here's the map and the forecast...
Call me if you have any questions (403) 974-6756.
所以基本上问题是正则表达式没有删除“主题:”的完整行,只有标题主题:被删除,但实际的主题文本仍然存在,在这种情况下是“地图”。 我希望正则表达式检测到主题行末尾的文本,然后将其删除。请分享你的想法。
【问题讨论】: