【问题标题】:Encode MIMEText as quoted printables将 MIMEText 编码为引用的可打印文件
【发布时间】:2013-02-03 01:03:20
【问题描述】:

Python 支持一个非常实用的MIME-Library,称为email.mime

我想要实现的是获得一个包含纯 UTF-8 文本的 MIME 部分,该部分被编码为带引号的可打印文件,而不是 base64。尽管库中提供了所有功能,但我没有设法使用它:

例子:

import email.mime.text, email.encoders
m=email.mime.text.MIMEText(u'This is the text containing ünicöde', _charset='utf-8')
m.as_string()
# => Leads to a base64-encoded message, as base64 is the default.

email.encoders.encode_quopri(m)
m.as_string()
# => Leads to a strange message

最后一条命令导致一条奇怪的消息:

Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: base64
Content-Transfer-Encoding: quoted-printable

GhpcyBpcyB0aGUgdGV4dCBjb250YWluaW5nIMO8bmljw7ZkZQ=3D=3D

这显然没有编码为引用的可打印文件,双 transfer-encoding 标头最后很奇怪(如果不是非法的话)。

如何将我的文本编码为 mime 消息中引用的可打印文件?

【问题讨论】:

标签: python encoding quoted-printable


【解决方案1】:

好的,我得到了一个非常 hacky 的解决方案,但至少它导致了某个方向:MIMEText 假设 base64,我不知道如何更改它。为此我使用MIMENonMultipart:

import email.mime, email.mime.nonmultipart, email.charset
m=email.mime.nonmultipart.MIMENonMultipart('text', 'plain', charset='utf-8')

#Construct a new charset which uses Quoted Printables (base64 is default)
cs=email.charset.Charset('utf-8')
cs.body_encoding = email.charset.QP

#Now set the content using the new charset
m.set_payload(u'This is the text containing ünicöde', charset=cs)

现在消息似乎编码正确:

Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable

This is the text containing =C3=BCnic=C3=B6de

甚至可以构造一个隐藏复杂性的新类:

class MIMEUTF8QPText(email.mime.nonmultipart.MIMENonMultipart):
  def __init__(self, payload):
    email.mime.nonmultipart.MIMENonMultipart.__init__(self, 'text', 'plain',
                                                      charset='utf-8')

    utf8qp=email.charset.Charset('utf-8')
    utf8qp.body_encoding=email.charset.QP

    self.set_payload(payload, charset=utf8qp) 

并像这样使用它:

m = MIMEUTF8QPText(u'This is the text containing ünicöde')
m.as_string()

【讨论】:

    【解决方案2】:

    在 Python 3 中,您不需要 hack:

    import email
    
    # Construct a new charset which uses Quoted Printables (base64 is default)
    cs = email.charset.Charset('utf-8')
    cs.body_encoding = email.charset.QP
    
    m = email.mime.text.MIMEText(u'This is the text containing ünicöde', 'plain', _charset=cs)
    
    print(m.as_string())
    

    【讨论】:

    • 谢谢伙计!上面的例子相当令人筋疲力尽。
    • 公平地说,在 Python 2 中需要 hack。您的答案仅适用于 Python 3。所以基本上您可以说原始问题可以通过切换到 Python 3 来解决。
    【解决方案3】:

    改编自issue 1525919并在python 2.7上测试:

    from email.Message import Message
    from email.Charset import Charset, QP
    
    text = "\xc3\xa1 = \xc3\xa9"
    msg = Message()
    
    charset = Charset('utf-8')
    charset.header_encoding = QP
    charset.body_encoding = QP
    
    msg.set_charset(charset)
    msg.set_payload(msg._charset.body_encode(text))
    
    print msg.as_string()
    

    会给你:

    MIME-Version: 1.0
    Content-Type: text/plain; charset="utf-8"
    Content-Transfer-Encoding: quoted-printable
    
    =C3=A1 =3D =C3=A9
    

    另请参阅来自 Python 提交者的 this response

    【讨论】:

    • 起初我错过了body_encode 的输入必须已经是 utf-8 编码,并且它不会为您进行 utf-8 编码。在这里注意这一点,以防其他人避免同样的误解。
    猜你喜欢
    • 2011-02-09
    • 2017-11-21
    • 2013-11-01
    • 2010-09-22
    • 2019-09-28
    • 2010-11-05
    • 2020-02-17
    • 2013-07-09
    • 2021-01-23
    相关资源
    最近更新 更多