【问题标题】:Splitting email text to conversation将电子邮件文本拆分为对话
【发布时间】:2013-09-17 01:07:30
【问题描述】:

我正在用 Python 编写一个电子邮件解析器,并寻找一种方法来从电子邮件正文中提取所有以前的电子邮件(转发、回复)。该脚本必须支持尽可能多的电子邮件客户端(gmail、outlook、iphone 等)。例如,如果正文是:

example email text

On Jul 31, 2013, at 5:15 PM, John Doe <jdoe@gmail.com> wrote:

> example email text
>
>
> *From:* Me [mailto:me@gmail.com]
> *Sent:* Thursday, May 31, 2012 3:54 PM
> *To:* John Doe
> *Subject:* RE: subject
>
> example email text

结果应该是一个包含 3 个条目的数组,每个条目包含电子邮件文本和尽可能多的元数据(日期、发件人、主题等)。

是否有任何标准/现代方法可以实现这一目标? 是否有来自不同客户的响应的维护列表? 我已经搜索过类似的问题,但到目前为止还没有令人满意的答案。

【问题讨论】:

  • 尝试正则表达式,以识别邮件中的模式。如果您很灵活,请改用 AWK。
  • 谢谢,但真正的问题是构建这些正则表达式/AWK 代码。我正在寻找现有的代码或算法。

标签: python parsing email email-parsing


【解决方案1】:

我发现这可能有用。

https://github.com/zapier/email-reply-parser

【讨论】:

  • 谢谢。我之前已经检查过这个库。它的功能非常有限且简单,无法涵盖大多数实际情况。
猜你喜欢
  • 2013-05-17
  • 2011-07-08
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-06-19
  • 1970-01-01
  • 2013-07-13
相关资源
最近更新 更多