在大多数情况下,您的 test1.jpg 和 test2.jpg 图像会略有不同。这意味着,在您打开(解压缩)并使用有损 JPEG 压缩保存(再次压缩)后,test1.jpg 中存储的信息将会丢失。
但是,在某些情况下,使用相同的软件打开和存储 JPEG 图像不会带来任何变化。
看看这个例子:
from PIL import Image
import os
import hashlib
def md5sum(fn):
hasher = hashlib.md5()
with open(fn, 'rb') as f:
hasher.update(f.read())
return hasher.hexdigest()
TMP_FILENAME = 'tmp.jpg'
orig = Image.open(INPUT_IMAGE_FILENAME)
orig.save(TMP_FILENAME) # first JPG compression, standard quality
d = set()
for i in range(10000):
# Compute file statistics
file_size = os.stat(TMP_FILENAME).st_size
md5 = md5sum(TMP_FILENAME)
print ('Step {}, file size = {}, md5sum = {}'.format(i, file_size, md5))
if md5 in d: break
d.add(md5)
# Decompress / compress
im = Image.open(TMP_FILENAME)
im.save(TMP_FILENAME, quality=95)
它会重复打开并保存一个JPG文件,直到找到一个循环(意味着打开的图像与之前的数据完全相同)。
在我的测试中,需要 50 到 700 个周期才能达到稳定状态(当打开和保存图像不会产生任何损失时)。但是,最终的“稳定”图像与原始图像明显不同。
第一次 JPG 压缩后的图像:
经过 115 次压缩/解压缩循环后的“稳定”图像:
样本输出:
Step 0, file size = 38103, md5sum = ea28705015fe6e12b927296c53b6d147
Step 1, file size = 71707, md5sum = f5366050780be7e9c52dd490e9e69316
...
Step 113, file size = 70050, md5sum = 966aabe454aa8ec4fd57875bab7733da
Step 114, file size = 70050, md5sum = 585ecdd66b138f76ffe58fe9db919ad7
Step 115, file size = 70050, md5sum = 585ecdd66b138f76ffe58fe9db919ad7
因此,即使我使用了 95 的相对高质量设置,如您所见,多次重复压缩/解压缩会使图像失去颜色和清晰度。即使质量设置为 100,结果也会非常相似,尽管文件大小几乎是两倍。