【发布时间】:2010-09-21 13:03:41
【问题描述】:
如何使用 Python 将 PDF 文件转换为 HTML?
我在单独考虑 Google 所做(或似乎正在做的)索引 PDF 文件的工作。
我的最终目标是设置 Apache 以显示 PDF 文件的 HTML,因此任何引导我朝这个方向发展的东西也将不胜感激。
【问题讨论】:
如何使用 Python 将 PDF 文件转换为 HTML?
我在单独考虑 Google 所做(或似乎正在做的)索引 PDF 文件的工作。
我的最终目标是设置 Apache 以显示 PDF 文件的 HTML,因此任何引导我朝这个方向发展的东西也将不胜感激。
【问题讨论】:
poppler 包提供了一个您可以使用的 pdf2html 实用程序。 libpoppler 还有一个Python binding。
【讨论】: