【发布时间】:2016-08-30 10:41:19
【问题描述】:
我知道它被问了很多,我尝试了一些东西,但我无法做到:
我有一个这样的文本文件:
From: VENCA <email@infoclientes.venca.es>
Subject: =?ISO-8859-1?Q?=BFMaxi,_midi_o_mini=3F_=A1No_pases_d?=
=?ISO-8859-1?Q?e_largo_porque_esto_te_interesa!?=
Subject: =?UTF-8?Q?Lo_mejor_de_Gmail_est=C3=A9s_donde_est=C3=A9s?=
From: Equipo de Gmail <mail-noreply@google.com>
Subject: =?UTF-8?Q?Tres_consejos_para_sacarle_el_m=C3=A1ximo_partido_a_Gmai?=
From: Equipo de Gmail <mail-noreply@google.com>
Subject: =?UTF-8?Q?Organ=C3=ADzate_mejor_con_la_bandeja_de_entrada_de_Gmail?=
From: Equipo de Gmail <mail-noreply@google.com>
From: VENCA <email@infoclientes.venca.es>
Subject: =?UTF-8?Q?MARINA,_comprueba_que_tus_datos_se?=
=?UTF-8?Q?an_correctos_y_=C2=A1bienvenid@_a_Venca!?=
Subject: =?UTF-8?Q?Nuevo_inicio_de_sesi=C3=B3n_en_Chrome_con_Windows?=
From: Google <no-reply@accounts.google.com>
[...]
每对 From/Subject 或 Subject/From 都是我要提取的,格式为:
From: VENCA <email@infoclientes.venca.es> - Subject: ¿Maxi, midi o mini? ¡No pases de largo porque esto te interesa!
[...]
所以我必须提取每一对(记住一些主题是 2,3... 行长度)给出我想要的格式并从 utf-8、iso... 对主题进行编码以制作它们不稳定
非常感谢!
【问题讨论】:
标签: python python-2.7 utf-8 decode encode