【问题标题】:Parse all email body html with Python使用 Python 解析所有电子邮件正文 html
【发布时间】:2015-06-29 14:10:28
【问题描述】:

基本上,我想使用 Python 解析来自我的 gmail 的所有电子邮件正文。 StackOverflow 上的解决方案很少,例如我找到的最接近的是here,他在其中使用Python 中的poplib 来解析所有电子邮件。另一个是this one,他使用.get_payload() 获取电子邮件正文

但是,当我使用 poplib 解析电子邮件时(如上例所示),然后我执行 message.get_payload() 获取电子邮件正文的每封电子邮件,我得到的字符串与来自电子邮件本身的 html 不同,即它有3D= \namp; 等字符串在我解析的电子邮件正文中。

我想知道POP 协议是否有问题,所以我需要使用其他协议,例如imaplib(但我不知道如何解析所有电子邮件,例如poplib)。或者,我可以修改给定的example 以获得正确的电子邮件正文。

【问题讨论】:

    标签: python email


    【解决方案1】:

    message.get_payload(decode=True) 将成为你最好的朋友 :)

    根据the docs

    可选解码是一个标志,指示是否应根据 Content-Transfer-Encoding 标头对有效负载进行解码。

    HTH

    【讨论】:

      猜你喜欢
      • 2013-07-12
      • 2018-12-01
      • 2013-09-22
      • 2011-03-04
      • 2013-11-03
      • 1970-01-01
      • 1970-01-01
      • 2012-11-06
      相关资源
      最近更新 更多