【问题标题】:How to convert PDF to DOCX on linux如何在 Linux 上将 PDF 转换为 DOCX
【发布时间】:2019-03-22 01:57:39
【问题描述】:

我尝试将 pdf 文件转换为 word、excel 和 powerpoint。 我已经尝试了很多这样的命令:

soffice -env:UserInstallation=file:///$HOME/.libreoffice-headless/ --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
/usr/bin/soffice --headless --invisible --convert-to docx file.pdf
soffice --infilter="writer_pdf_import" --convert-to doc file.pdf

/usr/bin/libreoffice --headless --invisible --convert-to doc file.pdf
/usr/bin/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf

abiword --to=doc file.pdf
unoconv -f doc file.pdf
lowriter --invisible --convert-to doc 'file.pdf'

总是从 soffice/libreoffice/unoconv 收到此错误消息:

:1: parser error : Document is empty
%PDF-1.7

这个是abiword

Unable to init server: Could not connect: Connection refused

** (abiword:6477): WARNING **: clutter failed 0, get a life.
Unable to init server: Could not connect: Connection refused

除了 abiword 之外的所有命令。我得到了一个包含坏字符的 doc 文件。 但永远不会得到正确的文件。

我尝试创建一个文件转换器,所以我只想要命令行方法。不想使用某人的 API。

谢谢

【问题讨论】:

    标签: linux ubuntu type-conversion libreoffice soffice


    【解决方案1】:

    设法用 soffice 做到这一点。 我必须安装这个包:libreoffice-pdfimport 并且不要忘记使用 --infilter="writer_pdf_import"

    【讨论】:

    • 谢谢,我一直在寻找正确的 PDF 过滤器选项。请问你是怎么知道的?
    • @TomG。现在不记得了,但我做了很多搜索
    • 非常感谢。它就像魅力一样。我用过:libreoffice --invisible --infilter="writer_pdf_import" --convert-to docx:"MS Word 2007 XML" input_file.pdf
    • 它将PDF转换成大量的文本框以保持布局。有什么办法可以改进吗?
    • 我的问题是一样的:大量的文本框为什么不能在 2021 年转换为真正的 doc、docx、odf?或者 Libre Office 在 writer 中以正常格式而不是 draw 方式打开?
    猜你喜欢
    • 2018-08-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-12-01
    • 1970-01-01
    • 2017-07-24
    • 1970-01-01
    相关资源
    最近更新 更多