【发布时间】:2018-01-22 15:32:31
【问题描述】:
Java Normalize 已经允许我使用重音字符并输出非重音字符。但是,它似乎根本不能很好地处理复合字符(Œ、Æ)。
Java 有没有办法原生处理这些字符?我想避免保留这些字符的 Map(因为这就是我们首先使用 Normalize 的原因)。
例如,“Œ”的输入应该返回“OE”,就像它已经将“½”等字符整齐地分解为“1/2”一样。
【问题讨论】:
-
请详细说明然而,它似乎根本不能很好地处理复合字符(Œ,Æ)
-
@SotiriosDelimanolis 我认为他希望
Normalizer.normalize("Œ", Normalizer.Form.NFD).equals("OE");是真实的。我也是。 -
@SotiriosDelimanolis 我希望这可以澄清它:)
-
@DodgyCodeException 哼,这似乎还不够(结果我也得到了空字符串)
-
@WeckarE。我知道,从某种意义上说,它告诉您它无法解决;-)
标签: java unicode-normalization