【发布时间】:2013-02-09 23:32:24
【问题描述】:
显然拉丁字母是这样。但我是在概念意义上问这个问题,跨语言和 Unicode 规范。
实际上这是为了比较两个字符串。如果您已经知道它们的字节数不同(在所有语言中),您能否认为足以保证它们不是同一字符串的不同“大小写”版本?
【问题讨论】:
-
请注意,大写的 utf-8 字符串的 字符数 甚至可以与对应的小写字符不同:'ß' -> 'SS'
标签: unicode utf-8 case-insensitive