【发布时间】:2019-11-25 02:24:11
【问题描述】:
我正在尝试解码出现在 MBox 电子邮件存档中的一些引用可打印编码文本。我将举一个我遇到问题的文本示例。
在 MBox 中,出现以下文本:
“Theresa Castel=E3o-Lawless 的划界”
正确解码,我认为应该显示为:
“Theresa Castelão-Lawless 的划界”
我的陈述是基于它应该是什么样子的
1) 电子邮件的网络存档,其中文本被正确呈现为“Theresa Castelão-Lawless 的分界线”
和 2) 此页面,其中显示“=E3”对应于引用可打印https://www.ic.unicamp.br/~stolfi/EXPORT/www/ISO-8859-1-Encoding.html 的“ã”
我已经尝试了下面的代码,但它给出了错误的输出。
string = "Demarcation by Theresa Castel=E3o-Lawless"
decoded_string = Mail::Encodings::QuotedPrintable.decode(string)
puts decoded_string + "\n"
上面代码的结果是 “Theresa Castel?o-Lawless 的划界” 但如上所述,我想要 “Theresa Castelão-Lawless 的划界”
【问题讨论】:
-
关于 2) 该页面是关于 ISO-8859-1 又名 ISO Latin 1。在 Ruby 中,字符串默认为 UTF-8。
标签: ruby quoted-printable