【问题标题】:Convert from unrecognised character to normal form从无法识别的字符转换为正常形式
【发布时间】:2013-03-14 19:51:53
【问题描述】:

我的文件有错误。也就是说,所有的字符都像"Giá»âºi tính".,我想用Java编写一个程序,将这些字符转换为普通字符。我试图将它们转换为字节,然后再次转换为字符串,但它保持不变。

【问题讨论】:

  • 您的文件不包含字符,而是 字节。如果您看到您提到的字符,则您已经为这些字节假定了特定的 编码。不过,您没有与我们分享有关该计数的任何详细信息。
  • 如果您使用十六进制编辑器或转储,您会看到什么?例如Unix hexdump -C filename 还是 Windows debug?

标签: java utf-8 character


【解决方案1】:

您需要知道文件的编码才能执行此操作。 Java 在内部将所有字符串表示为 UTF-16;为了解决这个问题,您需要知道文件的编码,并在读取文件时使用该编码:http://goo.gl/PoBgo (Java API Docs)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-01-01
    • 1970-01-01
    • 2021-08-21
    • 2018-05-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多