【发布时间】:2017-09-08 22:39:03
【问题描述】:
StoreID(唯一)在 Column1 中,即 Column2 中的 pdf 地图位置,文件名为“Warehouse1”(这会有所不同)。 (名字并没有真正按数字顺序排列)
County1 C:/maps/map1.pdf
County1 C:/maps/map2.pdf
County2 C:/maps/map1.pdf
County2 C:/maps/map3.pdf
County3 C:/maps/map3.pdf
County4 C:/maps/map2.pdf
County4 C:/maps/map4.pdf
是否可以附加相同县的 pdf 地图,并按县字段中的值和文件名分组命名新的 pdf 文件?
输出会是这样的:
C:\maps\final\County1_Warehouse1.pdf (pdf file is map1.pdf and map2.pdf)
C:\maps\final\County2_Warehouse1.pdf (pdf file is map1.pdf and map3.pdf)
C:\maps\final\County3_Warehouse1.pdf (pdf file is map3.pdf)
C:\maps\final\County4_Warehouse1.pdf (pdf file is map2.pdf and map4.pdf)
现在数据在数据库中,但我可以将此信息导出为所需的任何格式。我将每年多次执行此任务,因此如果可能的话,我希望将其自动化。
关于如何做到这一点的想法?我熟悉python编程。
【问题讨论】:
-
pypdf2库应该能够连接 pdf 文件。这是一个如何做的例子:github.com/mstamy2/PyPDF2/blob/master/Sample_Code/…. -
我正试图弄清楚如何从文件中获取信息。我可以使用 csv 阅读器以某种方式按县分组,然后通过 PdfFileMerger 类运行相应的地图位置吗?猜猜如果您不发布代码,您会被否决。只是想弄清楚从哪里开始。
-
在您的问题中,您说数据在数据库中,您可以以任何格式导出它。如果您可以将数据导出到 csv,那么是的,
csv.reader()将允许您获得PdfFileMerger所需的 pdf 路径。itertools.groupby()将有助于按县分组。此外,虽然没有代码的问题通常被否决,但您的问题可能被否决,因为您的问题中有几个问题(合并文件、从数据库中提取数据),然后有几种方法可以解决每个问题其中。