【问题标题】:Convert multi pages PDF into single html file using pdftohtml poppler utility使用 pdftohtml poppler 实用程序将多页 PDF 转换为单个 html 文件
【发布时间】:2015-04-20 10:22:35
【问题描述】:

我正在使用 poppler 实用程序将 PDF 文档转换为 HTML。但是它为每个页面创建了单独的 html 文件,但是在将 pdf 转换为 html 后我想要一个 HTML 文件。

我使用了以下语法:

pdftohtml -c abc.pdf

但它创建 abc-1.html、abc-2.html、....等

我也尝试了pdftohtml -c abc.pdf abc.html,但没有得到预期的输出。

谁能告诉如何在单个文件而不是多个 html 文件中获取 html 输出?

【问题讨论】:

    标签: poppler pdf-parsing pdf-to-html


    【解决方案1】:

    我通过 -s 选项实现了这一点

    例如:

    pdftohtml -c -s -noframes abc.pdf abc.html
    

    【讨论】:

    • @Deepti Kakade:它对我来说工作正常,但我遇到了一个问题。它创建左对齐的所有页面。它应该与 PDF 中的相同。你知道我该怎么做吗?
    • 非常感谢,我完全错过了“-noframes”标志 :-)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-04-22
    • 1970-01-01
    • 2013-06-06
    • 2012-02-22
    • 2016-03-11
    • 2013-06-08
    • 2018-04-29
    相关资源
    最近更新 更多