【问题标题】:Converting pdf to Image : spacing issue将 pdf 转换为图像:间距问题
【发布时间】:2014-09-07 15:12:12
【问题描述】:

我正在尝试使用 Wand(python 的 Imagemagick 绑定)将 PDF 的第一页(包含图像和文本)转换为图像。输出看起来像这样!!!http://i.stack.imgur.com/OdCMZ.jpg 这里的文字不是图像的一部分。图像没有完全跨越。只显示一半。

如果 PDF 没有任何文本,它完全像这样跨越..http://i.stack.imgur.com/NmcjO.jpg 这里的文字是图片的一部分

我不明白问题出在文本还是库上。第一个Image怎么可能也完全跨越。

【问题讨论】:

    标签: python pdf imagemagick wand


    【解决方案1】:

    pdf 转换时,imagemagick 使用 Ghostscript。 如果你想要结果只有内部边框内容。 您可以使用“-dUseCropBox”选项。

    import subprocess
    cmd = [
        'gs',
        '-q',
        '-dQUIET',
        '-dSAFER',
        '-dBATCH',
        '-dNOPAUSE',
        '-dNOPROMPT',
        '-dMaxBitmap=500000000',
        '-dAlignToPixels=0',
        '-dGridFitTT=2',
        '-dUseCropBox',
        '-dTextAlphaBits=4',
        '-dGraphicsAlphaBits=4',
        '-r{0}x{0}'.format(200),
        '-sDEVICE=jpeg',
        '-dJPEGQ=100',
        '-sOutputFile=%05d.jpg',
        'test.pdf'
    ]
    subprocess.call(cmd)
    

    【讨论】:

      猜你喜欢
      • 2012-02-20
      • 2011-05-30
      • 2015-03-01
      • 1970-01-01
      • 2020-09-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多