【发布时间】:2012-08-07 00:34:04
【问题描述】:
我收到一封使用字符集iso-8859-8-i 的电子邮件。 iconv 说它是一个不受支持的字符集。我尝试使用iso-8859-8,但出现“无效的多字节序列”错误。知道如何将此字符串转换为 UTF-8 吗?
【问题讨论】:
我收到一封使用字符集iso-8859-8-i 的电子邮件。 iconv 说它是一个不受支持的字符集。我尝试使用iso-8859-8,但出现“无效的多字节序列”错误。知道如何将此字符串转换为 UTF-8 吗?
【问题讨论】:
只需将编码名称替换为"iso-8859-8"。 -i 后缀表示它是按逻辑顺序排列的,而不是 "iso-8859-8" 传统意义上的向后“视觉顺序”。 iconv 无论如何都不能专门处理“视觉顺序”,所以它应该可以很好地转换它。
至于“无效的多字节序列”,也许你把源/目标字符集参数顺序倒了?如果这不是问题,那么您的文件可能包含未在 ISO-8859-8 字符集中定义的字节,即它是无效的......
【讨论】: