根据字段中的值合并pdf文件答案

【问题标题】：Merging pdf files based on a value in a field根据字段中的值合并pdf文件
【发布时间】：2017-09-08 22:39:03
【问题描述】：

StoreID（唯一）在 Column1 中，即 Column2 中的 pdf 地图位置，文件名为“Warehouse1”（这会有所不同）。（名字并没有真正按数字顺序排列）

County1     C:/maps/map1.pdf 
County1     C:/maps/map2.pdf 
County2     C:/maps/map1.pdf 
County2     C:/maps/map3.pdf 
County3     C:/maps/map3.pdf 
County4     C:/maps/map2.pdf 
County4     C:/maps/map4.pdf

是否可以附加相同县的 pdf 地图，并按县字段中的值和文件名分组命名新的 pdf 文件？

输出会是这样的：

C:\maps\final\County1_Warehouse1.pdf (pdf file is map1.pdf and map2.pdf)
C:\maps\final\County2_Warehouse1.pdf (pdf file is map1.pdf and map3.pdf)
C:\maps\final\County3_Warehouse1.pdf (pdf file is map3.pdf)
C:\maps\final\County4_Warehouse1.pdf (pdf file is map2.pdf and map4.pdf)

现在数据在数据库中，但我可以将此信息导出为所需的任何格式。我将每年多次执行此任务，因此如果可能的话，我希望将其自动化。

关于如何做到这一点的想法？我熟悉python编程。

【问题讨论】：

pypdf2 库应该能够连接 pdf 文件。这是一个如何做的例子：github.com/mstamy2/PyPDF2/blob/master/Sample_Code/….
我正试图弄清楚如何从文件中获取信息。我可以使用 csv 阅读器以某种方式按县分组，然后通过 PdfFileMerger 类运行相应的地图位置吗？猜猜如果您不发布代码，您会被否决。只是想弄清楚从哪里开始。
在您的问题中，您说数据在数据库中，您可以以任何格式导出它。如果您可以将数据导出到 csv，那么是的，csv.reader() 将允许您获得PdfFileMerger 所需的 pdf 路径。 itertools.groupby() 将有助于按县分组。此外，虽然没有代码的问题通常被否决，但您的问题可能被否决，因为您的问题中有几个问题（合并文件、从数据库中提取数据），然后有几种方法可以解决每个问题其中。

标签： python pdf

【解决方案1】：

Solution can be found at following post

【讨论】：