【问题标题】:Converting PDF to PNG with same resolution - Imagemagick以相同的分辨率将 PDF 转换为 PNG - Imagemagick
【发布时间】:2016-06-24 18:17:32
【问题描述】:

我有 1000 多个包含多个页面的 PDF,每个 PDF 都有不同的分辨率(基于用于扫描它们的扫描仪)。我想将 PDF 的每一页转换为 PNG 以将其传递给 Tesseract 进行 OCR。我使用 Imagemagick 转换为 PNG,但必须为所有图像传递一个固定的 DPI 以获得良好的可读输出。有没有办法通过保留 PDF 的分辨率来转换每个 PDF?

例如,如果 1.PDF 的分辨率为 622 × 788,而 2.pdf 的分辨率为 792 × 612,我希望以相同的分辨率进行精确转换,只是格式不同(PNG)。

我现在使用的命令是:

convert -monochrome -density 1200 input.pdf -resize 25% -monochrome -white-threshold 50% -black-threshold -50% output.png

谢谢, 帕夏

【问题讨论】:

  • 请添加您用于转换的命令。只有这样,才能获得真正解释某事的答案
  • 对不起..用命令更新了帖子

标签: file format imagemagick ocr


【解决方案1】:

也许读取第一页的几何图形,然后调整所有页面的大小以匹配?

SIZE=$(identify -format '%g' input.pdf)
convert  -monochrome \
         -density 1200 \
         -resize $SIZE \
         -white-threshold 50% \
         -black-threshold -50% \
         -append \
         output.png

【讨论】:

  • 感谢@emcconville。但是,这不会保留分辨率。输出的 png 图像降级了。
猜你喜欢
  • 2017-04-19
  • 2014-03-23
  • 1970-01-01
  • 1970-01-01
  • 2020-05-31
  • 2011-02-21
  • 2018-03-16
  • 2017-02-18
  • 1970-01-01
相关资源
最近更新 更多