通用转换器到 PDF [关闭]答案

【问题标题】：Universal converter to PDF [closed]通用转换器到 PDF [关闭]
【发布时间】：2021-11-17 01:15:07
【问题描述】：

我有一千份文件。它们的格式如下：

“xls、xlsx、csv、ppt、pptx、doc、docx、txt”

有没有图书馆可以做这项工作？我找到了一个叫 PDFTron，但似乎需要许可证。这是我的示例代码，它将首先复制文件，然后转换非 PDF

import os
import shutil

src = ".../srcpaths"
dst = ".../dstpaths"
ext = ['xls', 'xlsx', 'csv', 'ppt', 'pptx', 'doc', 'docx', 'txt', 'pdf']

for root, subfolders, filenames in os.walk(src):               # for all folders and files
    for filename in filenames:                                 # for all names
        if os.path.splitext(filename)[1] in ext:
            shutil.copy2(os.path.join(root, filename), os.path.join(dst, filename))  # cope files with its path(root)
        
        
def ConvertToPDF(ext):
    ########converter code#####

ConvertToPDF('.xls')
ConvertToPDF('.xlsx')
ConvertToPDF('.csv')
ConvertToPDF('.ppt')
ConvertToPDF('.pptx')
ConvertToPDF('.doc')
ConvertToPDF('.docx')
ConvertToPDF('.txt')

【问题讨论】：

显然，问题不在于拥有免费的许可证，而在于保护文件的机密性
不，对于普通最终用户来说没问题。只是一些公司不允许使用第三方网络应用程序处理他们的数据。顺便说一句，我刚刚找到 unoconv，将在 github.com/unoconv/unoconv 中尝试这个
哦，现在说得通了。我会检查一下。谢谢@KJ！

标签： python file pdf converters file-conversion

【解决方案1】：

没有。没有通用的ConvertToPDF 库。但是使用pandoc 可能会得到合理的结果。但是，我非常怀疑您是否会找到一个 python 库来执行此操作。

【讨论】：

感谢您与我们联系。对我来说，“unoconv”效果最好。不过需要 Libre Office。 github.com/unoconv/unoconv