【问题标题】:Reduce & Optimize Scanned Documents File Size减少和优化扫描文档文件大小
【发布时间】:2013-07-03 06:22:42
【问题描述】:

我的客户每天处理大约 100,000 个扫描文档 (jpg)。我想知道如何减小这些图像的文件大小以加快文件传输和浏览速度。

文档以黑白扫描,以jpg格式保存。它们的分辨率为 150dpi,尺寸为 1275x1753(宽 x 高)。主要的问题是它们的大小介于 ~150kb 和 ~500kb 之间,我认为这对于黑白图片来说太高了。

是否有可能通过更改分辨率、更改某些颜色模式或其他方式来减小它们的尺寸?尝试使用 Photoshop,但没有成功。

扫描的文档仅用于审阅。所以我认为他们不需要太多细节或原始图片大小。

打算用c#编写程序,所以请告诉我是否有用于此目的的好的图像库。

【问题讨论】:

  • 对于黑白图像(不是灰度),我会选择与传真兼容的格式,例如 TIFF 单声道。 Code example on MSDN.
  • 你能不能只使用最低的 jpeg 设置并使用更小的(缩略图)图像(原始图像的 50%)来查看。您可以将图像减少为索引颜色,然后减少到 32 种颜色;文件会很小,但图像质量会很差
  • @GhoulFool 刚刚尝试使用索引颜色 (32),但文件大小比原来增长了 3 倍。
  • 您是否也减小了图像尺寸?图像大小(和文件大小)存在交叉点,

标签: c# image-processing jpeg resolution photoshop


【解决方案1】:

如果您的图像是 JPEG 压缩的,则它们不是灰度(每像素 8 位)或全彩色(每像素 24 或 32 位)。我不知道那里有任何其他 JPEG 类型。

鉴于此,如果您尝试将这些图像转换为其他格式而不更改其大小(两个方向上的像素数)和/或色彩空间,您可能不会获得太多好处。

JPEG 2000 可能会比 JPEG 更好地压缩您的图像,但另一种有损压缩会引入更多伪像。您可以自己尝试一下,看看这种方法是否适合您。不过,我不能向您推荐任何用于这种方法的工具。

我建议您尝试将图像转换为双层图像(即只有两种颜色),然后使用一种传真压缩方案(第 3 组或第 4 组)对其进行压缩。您也可以尝试同时减小图像尺寸。这可以使用Docotic.Pdf library 轻松实现(免责声明:我为图书馆的供应商工作)。

请查看我对与您类似的问题的回答。答案显示了如何使用RecompressWithGroup4Fax 和/或Scale 方法来recompress existing images in PDF

@plinth 还提供了关于 JBIG2 压缩和其他内容的宝贵建议。值得一读。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-03-28
    • 2011-12-18
    • 2021-11-27
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多