【发布时间】:2015-10-14 22:50:00
【问题描述】:
我想解析一个没有图像,只有文本的 PDF。我正在尝试查找文本。例如搜索字符串“Name:”并能够读取“:”后面的字符。
我已经能够打开 PDF、获取页数并循环播放它们。问题是当我想使用像CGPDFDictionaryGetStream 或CGPDFStreamCopyData 这样的函数时,因为它们使用指针。我没有在互联网上为 swift 程序员找到太多信息。
也许最简单的方法是将所有内容解析为 NSString。然后我就可以做剩下的了。
这是我的代码:
// Get existing Pdf reference
let pdf = CGPDFDocumentCreateWithURL(NSURL(fileURLWithPath: path))
let pageCount = CGPDFDocumentGetNumberOfPages(pdf);
for index in 1...pageCount {
let myPage = CGPDFDocumentGetPage(pdf, index)
//Search somehow the string "Name:" to get whats written next
}
【问题讨论】:
-
我会为遇到同样问题的人更新自己的更多信息。目前很少有信息可供 swift 程序员使用。一方面,我建议阅读 pdf 内容是如何写入 pdf 文件中的。在 www.adobe.com 上搜索“PDF 规范”。另一方面,我们可以在这里找到一些关于如何使用 C# 解析 PDF 文件的信息:developer.apple.com/library/mac/documentation/GraphicsImaging/…>
-
你知道这个收藏吗:也许你可以在那里找到一些东西:ipdfdev.com/2013/03/13/…
-
嗨@JoseAntonio,你已经很久没有问这个问题了。您能找到任何更新吗?