【发布时间】:2012-04-19 20:58:21
【问题描述】:
我偶然发现使用 PDDScanner 在 PDF 中搜索西里尔字母(以及任何其他非 ASCII)字符。我使用的代码类似于 Randon Ideas 博客中提到的 SO 代码。问题在于,对于西里尔 PDF,scanner 的输出是完全垃圾,无法解码为任何有意义的东西。西里尔 PDF 中的英文字符被完美地搜索。所以,问题在于,当涉及到西里尔文时,它是被编码的,我们不知道如何正确解码。
我们在这里错过了什么?
在此先感谢任何可以阐明该主题的人。
【问题讨论】:
-
你能发布代码,还有“Randon 创意博客”的链接吗?这听起来像是一个字符编码问题,但 PDF 本身很棘手。
-
blog.random-ideas.net/?p=184 代码直接剪切粘贴
标签: ios pdf sdk full-text-search quartz-2d