【发布时间】:2021-11-17 01:15:07
【问题描述】:
我有一千份文件。 它们的格式如下:
“xls、xlsx、csv、ppt、pptx、doc、docx、txt”
有没有图书馆可以做这项工作?我找到了一个叫 PDFTron,但似乎需要许可证。 这是我的示例代码,它将首先复制文件,然后转换非 PDF
import os
import shutil
src = ".../srcpaths"
dst = ".../dstpaths"
ext = ['xls', 'xlsx', 'csv', 'ppt', 'pptx', 'doc', 'docx', 'txt', 'pdf']
for root, subfolders, filenames in os.walk(src): # for all folders and files
for filename in filenames: # for all names
if os.path.splitext(filename)[1] in ext:
shutil.copy2(os.path.join(root, filename), os.path.join(dst, filename)) # cope files with its path(root)
def ConvertToPDF(ext):
########converter code#####
ConvertToPDF('.xls')
ConvertToPDF('.xlsx')
ConvertToPDF('.csv')
ConvertToPDF('.ppt')
ConvertToPDF('.pptx')
ConvertToPDF('.doc')
ConvertToPDF('.docx')
ConvertToPDF('.txt')
【问题讨论】:
-
显然,问题不在于拥有免费的许可证,而在于保护文件的机密性
-
不,对于普通最终用户来说没问题。只是一些公司不允许使用第三方网络应用程序处理他们的数据。顺便说一句,我刚刚找到 unoconv,将在 github.com/unoconv/unoconv 中尝试这个
-
哦,现在说得通了。我会检查一下。谢谢@KJ!
标签: python file pdf converters file-conversion