【问题标题】:PDF to HTML library in PHPPHP 中的 PDF 到 HTML 库
【发布时间】:2012-02-20 08:47:07
【问题描述】:

我想将仅包含文本的 pdf 文件转换为 html 格式。 我想检索内容(文本、格式、缩进等)并将其存储在变量中,以便以相同的格式、排列、缩进显示。

谁能推荐一个我可以使用的 PHP 类/库(不是软件工具,无需安装)?

谢谢

【问题讨论】:

    标签: php pdf text


    【解决方案1】:

    pdf2text 为您提供了它所说的内容:它从 pdf 文件中提取 文本,它不会将其转换为 html 标记。您可能需要为此使用命令行实用程序或在线服务。

    有 linux 命令行 pdftohtml 工具

    Poppler 是另一种选择,它包含一个名为 pdftohtml 的实用程序

    如果您准备考虑使用 Java 应用程序,可以使用 jPedal

    还有很多商业应用可以做到这一点,但我猜你想要“免费”

    【讨论】:

    • 我没有用过,我只是知道它们的存在......所以我无法评论它们有多好,或者如何使用它们
    【解决方案2】:

    您可以使用 FPDI - PDF-Parser (COMERCIAL) 从您的 pdf 文件中导入文本,或使用 FPDI (FREE) 像 pdf 模板一样导入(您不能在免费版本上修改文本)。或者您可以存储一些 html 格式的模板和短代码,并使用 TCPDF:Open Source PHP Class 创建新的 pdf。

    【讨论】:

    • 我猜 FPDI 更多地用于生成 PDF 而不是阅读它。我想要的是读取pdf文件的内容(文本)并将其存储在php变量中并以与pdf相同的格式(粗体、斜体、缩进等)显示
    猜你喜欢
    • 1970-01-01
    • 2010-11-25
    • 1970-01-01
    • 2011-07-27
    • 2022-10-14
    • 1970-01-01
    • 1970-01-01
    • 2011-07-20
    • 2011-06-25
    相关资源
    最近更新 更多