【问题标题】:Merging pdf files based on a value in a field根据字段中的值合并pdf文件
【发布时间】:2017-09-08 22:39:03
【问题描述】:

StoreID(唯一)在 Column1 中,即 Column2 中的 pdf 地图位置,文件名为“Warehouse1”(这会有所不同)。 (名字并没有真正按数字顺序排列)

County1     C:/maps/map1.pdf 
County1     C:/maps/map2.pdf 
County2     C:/maps/map1.pdf 
County2     C:/maps/map3.pdf 
County3     C:/maps/map3.pdf 
County4     C:/maps/map2.pdf 
County4     C:/maps/map4.pdf

是否可以附加相同县的 pdf 地图,并按县字段中的值和文件名分组命名新的 pdf 文件?

输出会是这样的:

C:\maps\final\County1_Warehouse1.pdf (pdf file is map1.pdf and map2.pdf)
C:\maps\final\County2_Warehouse1.pdf (pdf file is map1.pdf and map3.pdf)
C:\maps\final\County3_Warehouse1.pdf (pdf file is map3.pdf)
C:\maps\final\County4_Warehouse1.pdf (pdf file is map2.pdf and map4.pdf)

现在数据在数据库中,但我可以将此信息导出为所需的任何格式。我将每年多次执行此任务,因此如果可能的话,我希望将其自动化。

关于如何做到这一点的想法?我熟悉python编程。

【问题讨论】:

  • pypdf2 库应该能够连接 pdf 文件。这是一个如何做的例子:github.com/mstamy2/PyPDF2/blob/master/Sample_Code/….
  • 我正试图弄清楚如何从文件中获取信息。我可以使用 csv 阅读器以某种方式按县分组,然后通过 PdfFileMerger 类运行相应的地图位置吗?猜猜如果您不发布代码,您会被否决。只是想弄清楚从哪里开始。
  • 在您的问题中,您说数据在数据库中,您可以以任何格式导出它。如果您可以将数据导出到 csv,那么是的,csv.reader() 将允许您获得PdfFileMerger 所需的 pdf 路径。 itertools.groupby() 将有助于按县分组。此外,虽然没有代码的问题通常被否决,但您的问题可能被否决,因为您的问题中有几个问题(合并文件、从数据库中提取数据),然后有几种方法可以解决每个问题其中。

标签: python pdf


【解决方案1】:
猜你喜欢
  • 2021-02-11
  • 1970-01-01
  • 2013-06-20
  • 1970-01-01
  • 1970-01-01
  • 2017-09-07
  • 1970-01-01
  • 2015-05-23
  • 1970-01-01
相关资源
最近更新 更多