【发布时间】:2014-07-13 01:52:59
【问题描述】:
我有一个 utf-8 文档要使用 iconv 转换为 big5 编码,代码如下
iconv -f utf-8 -t big5 $inputFile -o $outputFile
但是有一些 utf-8 字符编码不完整,因为我在文档的每一行中设置了字节大小限制,比如一行 40 个字节,所以会剪切一些 utf-8 字符。
由于utf-8字符编码不完整导致iconv对于不完整的utf-8字符编码找不到对应的big5编码,iconv停止。
为什么要避免iconv停止并跳过不完整的utf-8字符编码并继续将以下文档转换为big5编码文档?
【问题讨论】:
-
为什么不让更长的行?
-
这是固定规格。我无法更改要求。
标签: linux bash shell character-encoding iconv