【发布时间】:2012-01-19 20:32:31
【问题描述】:
我和我的朋友正在为 iphone 和 android 开发一个应用程序。我们需要处理单词转录。我们应该选择什么编码(甚至是特殊字体)来在我们的应用程序中显示正确的单词转录?
更新(2011 年 12 月 14 日):我想提供更多信息。我尝试从 Muller 字典 (http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download) 中阅读一些转录,但遇到了一些字符问题。
我用enca检查字典文件编码
~/mueller24 % enca dict.xdxf
Universal transformation format 8 bits; UTF-8
一个有问题的词是“画家”。当我在 emacs 中打开字典文件时,我看到:
有了数据,我们的脚本用 ruby 编写。它从字典中解析这个转录并存储在数据库中。之后,它从数据库中获取这个转录并将其作为 json 写入文件(utf-8)。如果我在文本编辑器中打开这个文件,我会看到它是这个字符串\u0445peInt\u255a
如果我在我的应用程序中解析它并在屏幕上显示它看起来像这样:
错在哪里?我想在解析字典文件时有这个问题。比如何正确解析?
【问题讨论】:
-
单词转录与其他文本有何不同?
-
请看我的详细更新。谢谢
标签: android iphone ruby fonts transcription