【发布时间】:2015-04-20 10:22:35
【问题描述】:
我正在使用 poppler 实用程序将 PDF 文档转换为 HTML。但是它为每个页面创建了单独的 html 文件,但是在将 pdf 转换为 html 后我想要一个 HTML 文件。
我使用了以下语法:
pdftohtml -c abc.pdf
但它创建 abc-1.html、abc-2.html、....等
我也尝试了pdftohtml -c abc.pdf abc.html,但没有得到预期的输出。
谁能告诉如何在单个文件而不是多个 html 文件中获取 html 输出?
【问题讨论】:
标签: poppler pdf-parsing pdf-to-html