【发布时间】:2015-03-20 03:16:58
【问题描述】:
我有一个引用了许多“子”pdf 的父 pdf,我们称它们为 Parent.pdf 和 ChildX.pdf。 Parent 有几百页,在脚注中会多次引用 ChildX 的不同页面(针对不同的 X 值)
我需要一种方法来自动浏览 Parent.pdf 的文本,找到类似“see ChildX, page Y”之类的文本,并在 Parent 中插入指向 ChildX 中页面 Y 的链接,这样当点击链接时 ChildX 在页面打开Y. ChildX 中没有书签,但如果需要,我可以添加它们。 我可以使用哪些工具?哪种工具最简单?
(为了论证起见,我们假设引用始终如上编写,尽管情况并非如此 - 单独的问题)
我基本上与语言和技术无关,但在 Windows 上运行的任何东西都是一个加号。研究出现了 iText、ReportLab 和 PyPDF,但我不确定哪个可以插入指向不同文档特定部分的链接,也不知道它们的优缺点是什么。另外,如果有人可以为此建议一些示例代码,那将是非常受欢迎的!
谢谢,
【问题讨论】:
-
主要基于意见的问题超出了 StackExchange 的范围