Python 电子邮件

　　从一台计算机编写邮件到对方收到邮件。假设我们自己的电子邮件地址是me@163.com，对方的电子邮件地址是friend@sina.com

　　我们在本地的软件上写好邮件，点击发送，邮件就发送出去了，这些电子邮件被称为MUA（mail user agent）邮件用户代理

　　邮件从本地被发送出去后，并不会被直接送到用户的电脑上，而是被发送到MTA：Mail Transfer Agent 浏览器传输代理，就是那些Email服务提供商，比如网易、新浪等等，由于我们自己的电子邮件是163.com，所以邮件回被最先送到网易提供的MTA，再由网易的MTA发送到对方的MTA，即新浪的MTA，这中间可能还会经过其他服务商的MTA

　　当邮件被送到对方邮箱的服务提供商的MTA，因此新浪的MTA会把邮件投递到邮件的最终目的地：MDA ：Mail Delivery Agent 邮件投递代理。Email到达MDA后，就静静地躺在新浪的某个服务器上，存放在某个文件或特殊的数据库里，我们将这个长期保存邮件的地方称之为电子邮箱。

　　Email不会直接到达对方的电脑，因为对方电脑不一定开机，开机也不一定联网。对方要取到邮件，必须通过MUA从MDA上把邮件取到自己的电脑上。

　　所以，一封电子邮件的旅程就是：

　发件人 -> MUA -> MTA -> MTA -> 若干个MTA -> MDA <- MUA <- 收件人

　　所以要编写程序来发送和接受邮件，最基本的两件事

　　编写MUA将邮件送到MTA，编写MUA从MDA上取邮件

　　协议

　　发邮件时，MUA和MTA使用的协议就是SMTP：Simple Mail Transfer Protocol，后面的MTA到另一个MTA也是用SMTP协议。

　　收邮件时，MUA和MDA使用的协议有两种：POP：Post Office Protocol，目前版本是3，俗称POP3；IMAP：Internet Message Access Protocol，目前版本是4，优点是不但能取邮件，还可以直接操作MDA上存储的邮件，比如从收件箱移到垃圾箱，等等。

　　邮件客户端软件在发邮件时，会让你先配置SMTP服务器，也就是你要发到哪个MTA上。假设你正在使用163的邮箱，你就不能直接发到新浪的MTA上，因为它只服务新浪的用户，所以，你得填163提供的SMTP服务器地址：smtp.163.com，为了证明你是163的用户，SMTP服务器还要求你填写邮箱地址和邮箱口令，这样，MUA才能正常地把Email通过SMTP协议发送到MTA。

　　类似的，从MDA收邮件时，MDA服务器也要求验证你的邮箱口令，确保不会有人冒充你收取你的邮件，所以，Outlook之类的邮件客户端会要求你填写POP3或IMAP服务器地址、邮箱地址和口令，这样，MUA才能顺利地通过POP或IMAP协议从MDA取到邮件。

　　最后特别注意，目前大多数邮件服务商都需要手动打开SMTP发信和POP收信的功能，否则只允许在网页登录。否则我们就不能在自己的程序上登陆

使用SMTP发送邮件

　　参考链接：https://www.liaoxuefeng.com/wiki/1016959663602400/1017790702398272#0

　　SMTP是发送邮件的协议，可以发送纯文本邮件、HTML邮件以及带附件的邮件。Python对SMTP的支持有两个模块：smtplib和email。email负责构造邮件，smtplib负责发送邮件。构造和发送是一起的

　　构造一个邮件对象就是一个Messag对象，如果构造一个MIMEText对象，就表示一个文本邮件对象，如果构造一个MIMEImage对象，就表示一个作为附件的图片，要把多个对象组合起来，就用MIMEMultipart对象，而MIMEBase可以表示任何对象。它们的继承关系如下：

Message
+- MIMEBase
   +- MIMEMultipart
   +- MIMENonMultipart
      +- MIMEMessage
      +- MIMEText
      +- MIMEImage

　　发送文本

#构造
from email.mime.text import MIMEText
msg = MIMEText(\'hello, send by Python...\', \'plain\', \'utf-8\')
#发送
from_addr=\'gao__king@163.com\'
smtp_server=\'smtp.163.com\'
to_addr=\'1903843477@qq.com\'
password=input(\'enter password:\')
#这是因为邮件主题、如何显示发件人、收件人等信息并不是通过SMTP协议发给MTA，而是包含在发给MTA的文本中的，所以，我们必须把From、To和Subject添加到MIMEText中
msg[\'Subject\']=\'hello world\'#编辑邮件主题
msg[\'From\']=from_addr#发信人
msg[\'To\']=to_addr#收信人
server=smtplib.SMTP(smtp_server,25)
server.set_debuglevel(1)
server.login(from_addr,password)login()方法用来登录SMTP服务器，为了验证身份，不向所有人提供服务，所以必须提供用户名和口令
server.sendmail(from_addr,[to_addr],msg.as_string())
server.quit()

　　注意到构造MIMEText对象时，第一个参数就是邮件正文，第二个参数是MIME的subtype，传入\'plain\'表示纯文本，最终的MIME就是\'text/plain\'，最后一定要用utf-8编码保证多语言兼容性。

　　我们用set_debuglevel(1)就可以打印出和SMTP服务器交互的所有信息

　　sendmail()方法就是发邮件，由于可以一次发给多个人，所以传入一个list，邮件正文是一个str，as_string()把MIMEText对象变成str。

　　作者还介绍了通过header对象来编码邮件头

　　遇到的问题：

smtplib.SMTPAuthenticationError: (535, b’Error: authentication failed’)：将发送邮箱开启POP3/SMTP服务,这时163会让我们设置客户端授权码，把登录的密码改成邮箱所设置的授权码即可。

smtplib.SMTPDataError: (554, b’DT:SPM 163 smtp12…)：分两种情况 a、发送的邮件内容存在test或测试，删掉即可；b、代码中缺少msg[‘From’]和msg[‘To’]，加上即可。

脚本运行未报错，但是在接收者邮箱内（一般在垃圾站中）未收到邮件，这时需要查看发送邮箱服务器的端口号有没有写上。

　　发送HTML

　　在构造MIMEText对象时，=第二个参数是MIME的subtype，传入\'plain\'表示纯文本，‘html’表示HTML

html=r\'\'\'
    <h1>hello</h1>
    <img src=\'cid:0\'>
    \'\'\'
msg_main_html=MIMEText(html,\'html\',\'utf-8\')

　　发送附件

　　带附件的邮件可以看做包含若干部分的邮件：文本和各个附件本身，所以，可以构造一个MIMEMultipart对象代表邮件本身，然后往里面加上一个MIMEText作为邮件正文，再继续往里面加上表示附件的MIMEBase对象即可：

# 邮件对象:
msg = MIMEMultipart()
msg[\'From\'] = _format_addr(\'Python爱好者 <%s>\' % from_addr)
msg[\'To\'] = _format_addr(\'管理员 <%s>\' % to_addr)
msg[\'Subject\'] = Header(\'来自SMTP的问候……\', \'utf-8\').encode()

# 邮件正文是MIMEText:
msg.attach(MIMEText(\'send with file...\', \'plain\', \'utf-8\'))

# 添加附件就是加上一个MIMEBase，从本地读取一个图片:
with open(\'/Users/michael/Downloads/test.png\', \'rb\') as f:
    # 设置附件的MIME和文件名，这里是png类型:
    mime = MIMEBase(\'image\', \'png\', filename=\'test.png\')
    # 加上必要的头信息:
    mime.add_header(\'Content-Disposition\', \'attachment\', filename=\'test.png\')
    mime.add_header(\'Content-ID\', \'<0>\')
    mime.add_header(\'X-Attachment-Id\', \'0\')
    # 把附件的内容读进来:
    mime.set_payload(f.read())
    # 用Base64编码:
    encoders.encode_base64(mime)
    # 添加到MIMEMultipart:
    msg.attach(mime)

　　发送图片

　　如果要把一个图片嵌入到邮件正文中怎么做？直接在HTML邮件中链接图片地址行不行？答案是，大部分邮件服务商都会自动屏蔽带有外链的图片，因为不知道这些链接是否指向恶意网站。

　　要把图片嵌入到邮件正文中，我们只需按照发送附件的方式，先把邮件作为附件添加进去，然后，在HTML中通过引用src="cid:0"就可以把附件作为图片嵌入了。如果有多个图片，给它们依次编号，然后引用不同的cid:x即可。

msg.attach(MIMEText(\'<html><body><h1>Hello</h1>\' +
    \'<p><img src="cid:0"></p>\' +
    \'</body></html>\', \'html\', \'utf-8\'))

　　同时支持HTML和Plain格式

　　并不是说，只能发送文本和只能发送网页，如果收件人使用的设备太古老，查看不了HTML邮件怎么办？

　　办法是在发送HTML的同时再附加一个纯文本，如果收件人无法查看HTML格式的邮件，就可以自动降级查看纯文本邮件。

　　利用MIMEMultipart就可以组合一个HTML和Plain，要注意指定subtype是alternative：

text=r\'\'\'hello,good\'\'\'
html=r\'\'\'
    <h1>hello</h1>
    <img src=\'cid:0\'>
    \'\'\'
msg=MIMEMultipart()
msg_main=MIMEText(text,\'plain\',\'utf-8\')
msg_main_html=MIMEText(html,\'html\',\'utf-8\')
msg.attach(msg_main)
msg.attach(msg_main_html)

　　加密SMTP

　　使用标准的25端口连接SMTP服务器时，使用的是明文传输，发送邮件的整个过程可能会被窃听。要更安全地发送邮件，可以加密SMTP会话，实际上就是先创建SSL安全连接，然后再使用SMTP协议发送邮件。

收取邮件

　　收取邮件就是编写一个MUA作为客户端，从MDA把邮件获取到用户的手机或者电脑上。

　　收取邮件最常用的协议是POP目前的版本是3，俗称pop3

　　Python内置了一个实现了pop3协议的模块poplib，可以用来收取邮件

　　但直接使用pop协议收取的邮件并不是一个直接阅读的文本，这点和SMTP发送邮件类似，通过SMTP发送的协议也是一个经过编码的文本，所以经过pop协议收取的邮件，还需要通过Python的email模块提供的各种类来解析原始文本，变成可阅读的文本邮件。

　　所以，收取邮件分为两步，第一步是通过POP协议把邮件下载到本地，第二部是通过email模块把原始文本解析为邮件对象

　　下载邮件

import poplib

# 输入邮件地址, 口令和POP3服务器地址:
email = input(\'Email: \')
password = input(\'Password: \')
pop3_server = input(\'POP3 server: \')

# 连接到POP3服务器:
server = poplib.POP3(pop3_server)
# 可以打开或关闭调试信息:
server.set_debuglevel(1)
# 可选:打印POP3服务器的欢迎文字:
print(server.getwelcome().decode(\'utf-8\'))

# 身份认证:
server.user(email)
server.pass_(password)

# stat()返回邮件数量和占用空间:
print(\'Messages: %s. Size: %s\' % server.stat())
# list()返回所有邮件的编号:
resp, mails, octets = server.list()
# 可以查看返回的列表类似[b\'1 82923\', b\'2 2184\', ...]
print(mails)

# 获取最新一封邮件, 注意索引号从1开始:
index = len(mails)
resp, lines, octets = server.retr(index)

# lines存储了邮件的原始文本的每一行,
# 可以获得整个邮件的原始文本:
msg_content = b\'\r\n\'.join(lines).decode(\'utf-8\')
# 稍后解析出邮件:
msg = Parser().parsestr(msg_content)

# 可以根据邮件索引号直接从服务器删除邮件:
# server.dele(index)
# 关闭连接:
server.quit()

　　解析邮件

　　还原邮件的过程和构造邮件对象的过程刚好相反，先导入模块

from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr

　　先把邮件解析为Message对象

msg=Parser().parserstr(msg_content)

　　但是这个Message对象本身可能是一个MIMEMultipart对象，即包含嵌套的其他MIMEBase对象，嵌套可能还不止一层。

　　我们要打印出他的层次结构，让人能看的明白

# indent用于缩进显示:
def print_info(msg, indent=0):
    if indent == 0:
        for header in [\'From\', \'To\', \'Subject\']:
            value = msg.get(header, \'\')
            if value:
                if header==\'Subject\':
                    value = decode_str(value)
                else:
                    hdr, addr = parseaddr(value)
                    name = decode_str(hdr)
                    value = u\'%s <%s>\' % (name, addr)
            print(\'%s%s: %s\' % (\'  \' * indent, header, value))
    if (msg.is_multipart()):
        parts = msg.get_payload()
        for n, part in enumerate(parts):
            print(\'%spart %s\' % (\'  \' * indent, n))
            print(\'%s--------------------\' % (\'  \' * indent))
            print_info(part, indent + 1)
    else:
        content_type = msg.get_content_type()
        if content_type==\'text/plain\' or content_type==\'text/html\':
            content = msg.get_payload(decode=True)
            charset = guess_charset(msg)
            if charset:
                content = content.decode(charset)
            print(\'%sText: %s\' % (\'  \' * indent, content + \'...\'))
        else:
            print(\'%sAttachment: %s\' % (\'  \' * indent, content_type))

　　邮件中的Subject、from等都是通过编码后的str，所以要把他们decode

def decode_str(s):
    value, charset = decode_header(s)[0]
    if charset:
        value = value.decode(charset)
    return value

　　decode_header()返回一个list，因为像Cc、Bcc这样的字段可能包含多个邮件地址，所以解析出来的会有多个元素。上面的代码我们偷了个懒，只取了第一个元素。

　　文本邮件的内容也是str，还需要检测编码，否则，非UTF-8编码的邮件都无法正常显示：

def guess_charset(msg):
    charset = msg.get_charset()
    if charset is None:
        content_type = msg.get(\'Content-Type\', \'\').lower()
        pos = content_type.find(\'charset=\')
        if pos >= 0:
            charset = content_type[pos + 8:].strip()
    return charset