【发布时间】:2012-05-22 10:36:05
【问题描述】:
我使用 imagemagick 将 PDF(由 pdfLaTex 生成)呈现为图像:
convert -density 120 test.pdf -trim test.png
然后我在 HTML 文件中使用此图像(以便在自己的 wiki 引擎中包含乳胶代码)。
当然,PNG 文件没有 PDF 文件包含的任何超链接。
是否也可以提取超链接的坐标和目标 URL,以便我可以构建 HTML image map?
如果有所作为:我只需要外部 (http://) 超链接,不需要 PDF 内部超链接。像 pdftohtml 这样的基于文本的解决方案是不可接受的,因为 PDF 也包含图形和公式。
【问题讨论】:
-
我有一个非常相似的案例。在 PDF 查看器(如 Acrobat read 或 evince)中查看文件时,我收到的 PDF 文件可能包含可单击(并打开网页)的超链接。我使用 Ghostscript 将 PDF 内容转换为位图图像,以便以后(预)在 web 应用程序中查看。我想在我的 web 应用程序上显示超链接及其各自的热点覆盖在图像上。为此,我需要从 PDF 中提取链接 url 和热点矩形。
标签: html pdf hyperlink imagemagick