【发布时间】:2012-10-25 11:09:32
【问题描述】:
有没有办法用 Lua 提取 UTF-8 编码字符串的首字母?
Lua 不正确支持 Unicode,所以string.sub("ÆØÅ", 2, 2) 将返回"?" 而不是"Ø"。
是否有一个相对简单的 UTF-8 解析算法可以对字符串逐字节使用,其唯一目的是获取字符串的第一个字母,无论是汉字还是 A?
还是这种方式太复杂,需要庞大的库等?
【问题讨论】:
-
"简单的 Unicode 解析算法" 这是什么种类的“Unicode”?是 UTF-8、UTF-16 还是别的什么?编码是什么?