【发布时间】:2015-07-07 10:37:15
【问题描述】:
我正在尝试提取 pdf 中第 5 页的文本。
pdf 的字体 YLJAAA+CMSY10 没有映射 (CMap) 甚至没有编码(默认编码或 /Differences)。
提取文本时,字符串“tetex package”后,CGPDFScanner 会返回多次遇到的“\x15”字符。
当遇到这个字符时,当前字体是上面提到的字体,它没有任何东西可以从 pdf 字符串中提取文本。
这个 \x15 字符是什么?
谢谢。
【问题讨论】:
标签: ios pdf cgpdfscanner