【问题标题】:Unable to read text from Pdf in ios无法在 ios 中读取 Pdf 文本
【发布时间】:2014-02-18 07:50:58
【问题描述】:

我正在尝试在我的 iOS 应用程序中提取 pdf 文档的文本,我正在使用 CGPDFScanner.. 我使用了这些链接中的参考:

以上两个链接中指定的方法适用于一些简单的(Programming in Objective-c) 类型的 pdf。但是当我尝试从 pdf 中提取文本时,例如“Head First”系列中的那些我得到垃圾值。请建议我一些适用于所有类型 pdf 的解决方案

【问题讨论】:

  • @BradLarson 为什么投反对票?
  • 我没有对您的问题投票,只是对其进行了编辑以删除盗版电子书的链接。

标签: ios iphone cgpdfdocument cgpdfscanner


【解决方案1】:

如果您使用的是 PDFKitten,则可能是 CMap 解析问题。我已经解决了这个问题,发现几乎每个 pdf 的搜索都很顺利。

【讨论】:

  • 如果你使用 PDFKitten,它有很多问题与 PDF 有 ToUnicodeMapping。它对 CMap 的解析是完全错误的。它在解析时丢弃了大部分映射。如果您能解决这个问题,您将能够正确搜索 PDF,因为您将获得正确的文本。
【解决方案2】:

尝试使用http://fastpdfkit.com/,这是我用过的最好的pdf阅读器库之一。

【讨论】:

  • 我看过fastpdfkit,但是因为没有用到CGPDFDictionary所以不能用,我想用它来做。我也尝试过 PDFKitten,但这个库也无法正确扫描 pdf 文本。建议一些替代方法(代码 sn-p)来解决这个问题。
  • 嗯,我确实遇到了这个问题。目前我没有任何替代方案,但如果我找到任何替代方案会通知您。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-08-09
  • 1970-01-01
  • 2012-03-07
  • 2020-07-01
相关资源
最近更新 更多