【发布时间】:2011-07-09 02:53:06
【问题描述】:
我需要第二个功能相同但只返回字母字符 A-Z。
非常感谢任何帮助。
【问题讨论】:
-
这些在哪个 Unicode 规范化形式中,您为什么要这样做?
-
当您说 A-Z 和“字母数字”时,您的意思是真的只有 A-Z 还是要匹配所有语言的所有字母,包括外语和过时的脚本?
-
如果您这样做是为了进行不区分重音的字符串比较,那么您做错了。
-
它不只是“来自所有语言”。是英文的。英语使用拉丁文字。有
unichars '\p{Latin}' '\p{Alphabetic}' '[^A-Za-z]' | wc -l== 1192 个拉丁字母但不是 A-Z 的代码点。人们普遍认为 ASCII 对英语来说就足够了。不是,这就是为什么写 A-Z 有一种代码味道的原因。 -
@Scott B:英语不仅仅使用 A-Z 的 26 个字母。例如,单词 ressumé 包括 é。也许您可以解释一下您要做什么,因为这可能会帮助您获得更好的答案。