【问题标题】:Python3 Parsing Email Body Differently than Python2Python3 解析电子邮件正文的方式与 Python2 不同
【发布时间】:2019-10-14 12:44:03
【问题描述】:

目前我正在开发一个电子邮件解析器,它只使用 imaplib 建立与我的 gmail 帐户的连接并阅读新电子邮件。

这一切正常,使用 python2(即“python myScript.py”)运行我的脚本时结果与预期一致

例如,如果我有一封如下所示的电子邮件:

To: receiver@qwerty.com
From: sender@asdf.com
Subject: Test Subject

Test1
Test2

我的脚本会按预期输出:

To: receiver@qwerty.com
From: sender@asdf.com
Subject: Test Subject
Body: Test1
Test2

但是,当使用 python3(即“python3 myScript.py”)运行时,结果不一样,转义字符显示在消息正文中,见下文:

To: receiver@qwerty.com
From: sender@asdf.com
Subject: Test Subject
Body: b'Test1\r\nTest2\r\n'

以下是用于此过程的代码:

def readMailbox(mail):
    res, data = mail.uid('search', None, 'UNSEEN')
    i = len(data[0].split())

    for x in range(i):
        latestEmailUID = data[0].split()[x]
        result, emailData = mail.uid('fetch', latestEmailUID, '(RFC822)')
        emailMessage = email.message_from_string(emailData[0][1].decode('utf-8'))

        emailFrom = str(email.header.make_header(email.header.decode_header(emailMessage['From'])))
        emailTo = str(email.header.make_header(email.header.decode_header(emailMessage['To'])))
        subject = str(email.header.make_header(email.header.decode_header(emailMessage['Subject'])))

        # Body details
        for part in emailMessage.walk():
            if part.get_content_type() == 'text/plain':
                body = part.get_payload(decode=True)
                print('To: %s' % emailTo)
                print('From: %s' % emailFrom)
                print('Subject: %s' % subject)
                print('Body: %s' % body)

我将需要能够在不显示转义字符的情况下捕获字符串主体以供以后使用。谁能向我解释为什么会发生这种情况,或者我需要在 python3 中做些什么不同的事情才能正常解析电子邮件的正文?

感谢您抽出宝贵时间,我们将不胜感激任何正确方向的指导!

【问题讨论】:

    标签: python python-3.x string python-2.7 imaplib


    【解决方案1】:

    字符串前面的 'b' 表示它仍然是字节数组,尚未解码。

    像其他字符串一样使用 'utf-8' 解码,它应该按预期打印特殊字符

    ...
    body = part.get_payload(decode=True)
    body = body.decode('utf-8')
    print('Body: %s' % body)
    ...
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-12-01
      • 2013-09-22
      • 1970-01-01
      • 2021-08-13
      • 2010-09-21
      • 2011-06-16
      • 2013-11-03
      • 1970-01-01
      相关资源
      最近更新 更多