【发布时间】:2015-10-31 23:20:15
【问题描述】:
我编写了一个更喜欢 NFC 的应用程序。当我从 OSX 获得文件名时,它被归一化为 NFD。据我所知,我不应该像这里提到的那样转换数据:
http://www.win.tue.nl/~aeb/linux/uc/nfc_vs_nfd.html
[...](不是因为 NFD 或这个版本的 NFD 有问题, 但因为永远不应该更改数据。文件名不得 标准化。)[...]
当我将文件名与用户输入(在 NFC 中)进行比较时,我必须实现一个相应的比较函数来处理 Unicode 等效性。但这可能比需要的慢得多。如果我将文件名规范化为 NFC 不是更好吗?当只涉及内存比较时,它会大大提高速度。
【问题讨论】:
标签: unicode utf-8 normalization unicode-normalization