【发布时间】:2010-09-10 12:19:29
【问题描述】:
我们的应用程序从我们的用户那里接收文件,如果这些文件是我们支持的编码类型(即 UTF-8、Shift-JIS、EUC-JP),则必须验证这些文件,一旦验证了该文件,我们还需要将该文件保存在我们的系统中,并将其编码为元数据。
目前,我们正在使用JCharDet(这是 mozilla 字符检测器的 Java 端口),但有一些 Shift-JIS 字符似乎无法检测为有效的 Shift-JIS 字符。
还有什么我们可以使用的想法吗?
【问题讨论】:
-
应用程序如何接收文件?如果是通过 HTTP,这应该存储在 mime 标头中。
-
@Peter:不,当然不是。 mime 头只代表 HTTP 请求体的编码,而不是文件的原始编码。
标签: java utf-8 character-encoding detect shift-jis