【问题标题】:How to open PDF file with Docx in Python?如何在 Python 中使用 Docx 打开 PDF 文件?
【发布时间】:2020-10-03 11:31:09
【问题描述】:

我想从我的 mac 打开一个 pdf 文件,但是我收到了这个错误:

'此文件无法打开。它可能已损坏或具有预览无法识别的文档结构。'

这是我正在使用的代码:

from docx import Document
#open the document
doc=Document('./testDoc.docx')
a = input('Whats your name ')
b = input('Whats your date of birth ')

Dictionary = {"name": a, "dob": b}

for i in Dictionary:
    for p in doc.paragraphs:
        if p.text.find(i)>=0:
            p.text=p.text.replace(i,Dictionary[i])

#save changed document
doc.save('/my/path/contract{}.pdf'.format(a))

有人知道怎么回事吗?

【问题讨论】:

  • python-docx 无法导出为 pdf。你可以试试this

标签: python pdf docx converters


【解决方案1】:

不幸的是,我认为 docx 模块不适用于 pdf——他们的文档中没有关于它的任何内容。但是您可以改用docx2pdf 模块:https://pypi.org/project/docx2pdf/

这是他们文档中的简单操作方法:

from docx2pdf import convert

convert("input.docx", "output.pdf")

【讨论】:

    【解决方案2】:

    docx模块无法将word文档转换为PDF。
    您可以使用pywin32 模块。

    import win32com.client
    def wordToPdf(input_path, output_path):
        word = win32com.client.Dispatch("Word.Application")
        doc = word.Documents.Open(str(input_path))
        doc.SaveAs(str(output_path), FileFormat=17)
        doc.Close()
        word.Quit()
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-05-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多