【发布时间】:2011-03-29 02:57:16
【问题描述】:
我希望能够说“通过强制变音符号进入它们的组合形式来规范化这个字符串”。
详情:
我的代码是用 C# 开发的,但我不认为这个问题是特定于语言的。
我的数据有两个问题 (1) 变音符号在此数据中的基本字符之前(它需要在 Unicode 形式 D 或 KD 中的基本字符之后)。 (2) 我的数据中的重音变音符号是希腊语 Tonos (U+0384) 但需要组合形式 (U+0301) 才能进行规范化。
我想以编程方式执行此操作。我认为这种类型的操作应该是众所周知的,但我没有在 C# Globalization 方法中找到支持(有规范化方法,但没有办法将变音符号强制转换为它们的组合形式)。
【问题讨论】:
标签: unicode normalization diacritics unicode-normalization