分类: 字符与编码
大家都说java使用的字符集是unicode,那么默认编码不就是应该是UTF8,UTF16之类的unicode编码吗?
可是调用Charset.defaultCharset()的结果并非如此。
- import java.nio.charset.Charset;
- public class javaCode {
- public static void main(String args[])
- {
- String defaultCharsetName=Charset.defaultCharset().displayName();
- System.out.println("defaultCharsetName:"+defaultCharsetName);
- }
- }
执行结果如下
defaultCharsetName:GBK
多次试验发现,这个默认字符编码是由windows的语言地域里的设定决定的
这个字符编码肯定不是java内部的字符编码,那会不会是文件读入时的字符编码?
先用Emeditor之类的编辑器,生成一个UTF8的txt文件,输入内容:門(door),保存。
用下面的代码读入
- import java.io.FileInputStream;
- import java.io.FileNotFoundException;
- import java.io.IOException;
- import java.io.InputStream;
- import java.io.InputStreamReader;
- import java.nio.charset.Charset;
- public class javaCode {
- public static void main(String args[])
- {
- String defaultCharsetName=Charset.defaultCharset().displayName();
- System.out.println("defaultCharsetName:"+defaultCharsetName);
- try {
- InputStream is = new FileInputStream("F://shifjst.txt");
- //等于 InputStreamReader streamReader = new InputStreamReader(is,Charset.defaultCharset());
- InputStreamReader streamReader = new InputStreamReader(is);
- char[] chars = new char[10];
- streamReader.read(chars, 0, 10);
- System.out.println(chars);
- } catch (FileNotFoundException e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- } catch (IOException e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- }
- }
结果是乱码:
defaultCharsetName:windows-31j
髢?door)
再把那个文件的格式改成shift-jis,正确读出来了。
defaultCharsetName:windows-31j
門(door)
看来,java读入文件时的字符编码是根据系统的默认编码来的。