【问题标题】:How to fetch an email body using imaplib in python?如何在 python 中使用 imaplib 获取电子邮件正文?
【发布时间】:2011-01-14 20:39:57
【问题描述】:

我想从 IMAP4 服务器获取整个消息。 在 python 文档中,如果发现这段代码有效:

>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]

我想知道我是否可以始终相信 data[0][1] 返回消息的正文。当我运行 'RFC822.SIZE' 时,我得到的只是一个字符串而不是一个元组。

我浏览了 rfc1730,但无法找出“RFC822”的正确响应结构。从 imaplib 文档中也很难分辨 fetch 结果结构。

这是我在获取RFC822 时得到的结果:

('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])

但是当我获取RFC822.SIZE 时,我得到了:

('OK', ['1 (RFC822.SIZE 847403)'])

我应该如何正确处理 data[0] 列表? 我可以相信,当它是一个元组列表时,元组正好有 3 个部分,而第二部分是有效负载?

也许你知道任何更好的 imap4 库?

【问题讨论】:

    标签: python imaplib


    【解决方案1】:

    不...imaplib 是一个相当不错的库,它的 imap 太难以理解了。

    您可能希望检查t == 'OK',但data[0][1] 在我使用它的情况下按预期工作。

    这是我用来提取我通过电子邮件收到的签名证书的一个简单示例,不是防弹的,但适合我的目的:

    import getpass, os, imaplib, email
    from OpenSSL.crypto import load_certificate, FILETYPE_PEM
    
    def getMsgs(servername="myimapserverfqdn"):
      usernm = getpass.getuser()
      passwd = getpass.getpass()
      subject = 'Your SSL Certificate'
      conn = imaplib.IMAP4_SSL(servername)
      conn.login(usernm,passwd)
      conn.select('Inbox')
      typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
      for num in data[0].split():
        typ, data = conn.fetch(num,'(RFC822)')
        msg = email.message_from_string(data[0][1])
        typ, data = conn.store(num,'-FLAGS','\\Seen')
        yield msg
    
    def getAttachment(msg,check):
      for part in msg.walk():
        if part.get_content_type() == 'application/octet-stream':
          if check(part.get_filename()):
            return part.get_payload(decode=1)
    
    if __name__ == '__main__':
      for msg in getMsgs():
        payload = getAttachment(msg,lambda x: x.endswith('.pem'))
        if not payload:
          continue
        try:
          cert = load_certificate(FILETYPE_PEM,payload)
        except:
          cert = None
        if cert:
          cn = cert.get_subject().commonName
          filename = "%s.pem" % cn
          if not os.path.exists(filename):
            open(filename,'w').write(payload)
            print "Writing to %s" % filename
          else:
            print "%s already exists" % filename
    

    【讨论】:

    • 很高兴知道这对您有用。但是有什么想法为什么它会像描述的那样工作吗?
    • 返回值是标记化的 IMAP 服务器响应。
    • 可能更高级别的 imap 库需要处理不同 imap 实现之间的弱点,或者不兼容。
    • 我目前正在体验 data[0] 实际上只是一个 bytes 对象而不是 (bytes, bytes) 的元组。我的应用程序不断地从 IMAP 服务器轮询新的(看不见的)消息,当我从 Web 界面将消息标记为未读时,就会发生这种行为。该服务位于web.de。更具体地说,通常数据格式是[(bytes, bytes), bytes],但是当消息被手动标记为看不见时,格式是[bytes, (bytes, bytes), bytes]
    • 如果我想阅读转发的电子邮件正文怎么办?
    【解决方案2】:

    IMAPClient 包更容易使用。来自描述:

    易于使用、Pythonic 且完整 IMAP 客户端库。

    【讨论】:

    • 我支持。 IMAPClient 非常好用且面向对象。它比 imaplib 更容易使用,并且没有大问题。
    【解决方案3】:

    这是我提取有用信息的解决方案。到目前为止它是可靠的:

    import datetime
    import email
    import imaplib
    import mailbox
    
    
    EMAIL_ACCOUNT = "your@gmail.com"
    PASSWORD = "your password"
    
    mail = imaplib.IMAP4_SSL('imap.gmail.com')
    mail.login(EMAIL_ACCOUNT, PASSWORD)
    mail.list()
    mail.select('inbox')
    result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
    i = len(data[0].split())
    
    for x in range(i):
        latest_email_uid = data[0].split()[x]
        result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
        # result, email_data = conn.store(num,'-FLAGS','\\Seen') 
        # this might work to set flag to seen, if it doesn't already
        raw_email = email_data[0][1]
        raw_email_string = raw_email.decode('utf-8')
        email_message = email.message_from_string(raw_email_string)
    
        # Header Details
        date_tuple = email.utils.parsedate_tz(email_message['Date'])
        if date_tuple:
            local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
            local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
        email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
        email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
        subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))
    
        # Body details
        for part in email_message.walk():
            if part.get_content_type() == "text/plain":
                body = part.get_payload(decode=True)
                file_name = "email_" + str(x) + ".txt"
                output_file = open(file_name, 'w')
                output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
                output_file.close()
            else:
                continue
    

    【讨论】:

    • 不,使用email_from_bytes 而不是希望 将原始电子邮件正文转换为字符串不会做意外的事情;无论如何,额外的往返是不必要和浪费的。
    【解决方案4】:

    试试我的包: https://pypi.org/project/imap-tools/

    示例:

    from imap_tools import MailBox
    
    # get list of email bodies from INBOX folder
    with MailBox('imap.mail.com').login('test@mail.com', 'password', 'INBOX') as mailbox:
        bodies = [msg.text or msg.html for msg in mailbox.fetch()]
    

    特点:

    • 已解析的电子邮件属性
    • 用于搜索电子邮件的查询生成器
    • 处理文件夹中的电子邮件(复制、删除、标记、移动、附加)
    • 使用邮箱文件夹(列表、设置、获取、创建、存在、重命名、删除、状态)
    • 无依赖关系

    【讨论】:

    • imap-tools 非常好用
    猜你喜欢
    • 2012-12-11
    • 2014-10-03
    • 2017-09-21
    • 2015-04-29
    • 2012-10-24
    • 2013-11-03
    • 1970-01-01
    • 2017-04-04
    • 2019-04-25
    相关资源
    最近更新 更多