【发布时间】:2018-06-11 03:37:57
【问题描述】:
我想制作一个脚本来读取目录中的所有 pdf 文件,复制每个文件的第二页并将其写入一个输出 pdf(包含所有秒页)。
我已经写了一个代码,但它给了我一个带有空白页的 pdf。这真的很奇怪,因为我有另一个代码,它获取每个 pdf 的第二页并为每个第二页制作一个新的 pdf,并且该代码有效。我想我的问题可能与addPage()有关。
我正在使用 PyPDF2 库来使用 pdf 文件。
import pathlib
from PyPDF2 import PdfFileReader, PdfFileWriter
files_list = [file for file in pathlib.Path(__file__).parent.iterdir() if (file.is_file() and not str(file).endswith(".py"))]
total = len(files_list)
writer = PdfFileWriter()
for file in files_list:
with open(file, 'rb') as infile:
reader = PdfFileReader(infile)
reader.decrypt("")
writer.addPage(reader.getPage(1))
with open('Output.pdf', 'wb') as outfile:
writer.write(outfile)
print('Done.')
【问题讨论】:
-
你为什么不使用你想要的代码呢?因为它没有合并页面?
-
@PatrickArtner,该代码没有合并,它只是复制旧的 pdf,只有第二页,但它没有合并到 one pdf .
-
在我的答案中添加了来自其他答案的示例(已修改)。归功于下面的其他答案。
-
不是严格的重复 - 但这种特殊情况由 stackoverflow.com/questions/22795091/… -answer
标签: python python-3.x pdf