【问题标题】:What type of encoding is being used?正在使用什么类型的编码?
【发布时间】:2011-03-06 23:01:48
【问题描述】:

我目前正在制作一个程序,其中一个功能是提取多部分电子邮件的 HTML 部分。

我已经很好地完成了这项任务,但是在某些我似乎无法弄清楚的字符上存在一种编码类型,例如

',' into '=2C'
';' into '=3B'
'=' into '=3D'

它还会在各处放置随机的“=”。

有谁知道这是否有解码器(甚至它的名称是什么)?我已经用代码替换了一些东西,但是我可能还缺少很多东西,因为我还没有遇到它们。因此,我想弄清楚编码的类型以便我可以替换所有内容,或者找到一个已经这样做的库。

附:如果这可能是原因,我正在从 hotmail 帐户发送电子邮件。

【问题讨论】:

  • 如果您还提取邮件的标题,也可以将其编码为 QP 变体,通常如果使用 US-ASCII 范围之外的字符

标签: c# email encoding decoding quoted-printable


【解决方案1】:

它是quoted-printable encoding,在RFC中有解释。在你花太多时间在你的任务上之前,让我警告你。解析电子邮件可能会让人头疼,所以你不应该自己做。试试这些免费图书馆,这是我见过的最好的(我见过很多)http://www.lumisoft.ee/lswww/download/downloads/Net/

【讨论】:

  • @Emmanuel Smith 好吧......我真的怀疑你是否快完成了,因为你可能低估了这项任务所需的努力。只需针对不同的电子邮件字母尝试您的解析器。
【解决方案2】:

这称为quoted-printable 编码。

不幸的是,Microsoft 现有的 QuotedPrintableStream 是内部的,因此您无法使用它。但是,您可以使用 Mono 项目或任何处理 MIME 处理的库。

【讨论】:

    猜你喜欢
    • 2016-04-05
    • 1970-01-01
    • 1970-01-01
    • 2017-04-26
    • 1970-01-01
    • 2022-07-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多