【问题标题】:Optimizing JPEG quantization table for grayscale text document images优化灰度文本文档图像的JPEG量化表
【发布时间】:2011-08-02 03:11:34
【问题描述】:

信号处理:图像压缩:

我想以 JPEG 或 TIFF-JPEG 格式存储全彩色文本图像。这些图像包含带有一些彩色图形的文本文档。即使 JPEG 质量级别非常高,文本上仍然存在很多伪影和降级。

我可以完全控制 JPEG 编码参数,包括二次采样率和量化矩阵。

我的问题是:

  • 能否针对文本文档优化这些参数? (超出质量水平)
  • 我可以为图像的不同部分应用不同的参数设置吗?
  • 如果我在编码之前手动截断(量化)图像不同部分的系数会有帮助吗?

(稍后将附上示例图片,因为在办公室无法访问 imgur。)

【问题讨论】:

    标签: optimization image-processing jpeg image-compression


    【解决方案1】:

    您是否考虑过使用 PDF 作为输出?使用 PDF,您可以对黑白文本进行动态阈值处理,以将其压缩为 1-bpp CCITT G4。您还可以捕获页面上的颜色对象并使用 FLATE 或 JPEG 压缩它们。 PDF 页面可以是这两种对象的组合。您将获得最佳质量和更好的压缩效果。

    【讨论】:

      【解决方案2】:

      我赞同 BitBank 使用 PDF 以不同方式压缩不同内容的建议 - 我看到这有时被称为“MRC”——混合光栅内容。大量的文学作品。

      您不会说您的图像是合成的还是扫描的。对于合成图像,我个人的经验是,即使是 LZW(在 TIFF 中)也可以做得非常出色,特别是如果您愿意进行一些(有损)预处理以使样本值均质化。也就是说,如果你可以量化足够多的相似值,使它们变得相等。

      但是,如果您的图像被扫描,则很难预处理到足够干净的图像,以使 LZW 或任何其他无损压缩可以找到牵引力。所以剩下的JPEG,我想说的几乎与ruslik相反,JPEG的损耗在全局和频域都是高度可调的。当然可以调整量化表以选择性地提高文本质量。我不是专家,但我碰巧记得的起点是 Giordano Bruno Beretta & co 的作品。在 HP 实验室,例如 Method for selecting JPEG quantization tables for low bandwidth applications

      【讨论】:

        【解决方案3】:

        标准 JPEG 是有损的,您对此无能为力。丢失的信息在自然(平滑)图像上应该不会被注意到。

        我的观点是,对于人造图像,您应该使用无损编解码器。不是无损JPEG,而是至少支持RLE的东西。例如,PNG 或JPEG-LS 在此类图像上会产生更好的效果。

        【讨论】:

        • 谢谢。我个人同意你的看法。不幸的是,我有偿为当前客户寻找平衡——他们需要与 JPEG 中等质量相当的压缩比,但他们也希望优化文本外观。 (同一页面上还有图形艺术品。)
        • @rwong:我明白了.. 后处理怎么样?
        • 图像需要被任何图像软件读取。你能举出后处理的例子吗?类似于阈值?谢谢。
        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-10-13
        • 2012-05-16
        相关资源
        最近更新 更多