【问题标题】:Repeated loading and saving the same image to file system alters data of image重复加载相同的图像并将其保存到文件系统会改变图像的数据
【发布时间】:2020-03-29 13:54:55
【问题描述】:

从文件系统反复保存和加载相同的图像会导致数据发生变化,从而导致哈希和发生变化(我需要)。

我的程序执行以下步骤:

1.创建一个缓冲图像

BufferedImage bufferedImage = new BufferedImage(400, 400, BufferedImage.TYPE_INT_RGB);
Graphics2D graphics = bufferedImage.createGraphics();
graphics.setColor(Color.RED);
graphics.fillRect(100, 100, 200, 200);
graphics.dispose();

2。计算创建的 BufferedImage 的 MD5 哈希

ByteArrayOutputStream baos = new ByteArrayOutputStream();
ImageIO.write(bufferedImage, "jpg", baos);
byte[] bytesOfImage = baos.toByteArray();
DigestUtils.md5Hex(bytesOfImage); // => bebc7da469524057926f3871bdb07a6a

3.将 BufferedImage 保存到文件系统

Path tempFile = Files.createTempFile(null, "jpg");
ImageIO.write(bufferedImage, "jpg", tempFile.toFile());

4.计算文件的 MD5 哈希

byte[] bytesOfFile = Files.readAllBytes(tempFile);
DigestUtils.md5Hex(bytesOfFile); // => bebc7da469524057926f3871bdb07a6a

5.从文件系统加载图片

BufferedImage bufferedImageFromFilesystem = ImageIO.read(tempFile.toFile());

6.计算从文件系统加载的图像的 MD5 哈希

ByteArrayOutputStream baosFS = new ByteArrayOutputStream();
ImageIO.write(bufferedImageFromFilesystem, "jpg", baosFS);
byte[] bytesOfImageFromFilesystem = baosFS.toByteArray();
DigestUtils.md5Hex(bytesOfImageFromFilesystem); // => 11dc0e49342a1ad15ab1b5a7f8bc271e

(重复步骤 3 到 6,但重复使用步骤 5 中的图像:)
7.将 BufferedImage 存储到文件系统

Path tempFile2 = Files.createTempFile(null, "jpg");
ImageIO.write(bufferedImageFromFilesystem, "jpg", tempFile2.toFile());

8.计算文件的MD5哈希

byte[] bytesOfFile2 = Files.readAllBytes(tempFile2);
DigestUtils.md5Hex(bytesOfFile2);// => 11dc0e49342a1ad15ab1b5a7f8bc271e

9.从文件系统加载图片

BufferedImage bufferedImageFromFilesystem2 = ImageIO.read(tempFile2.toFile());

10.计算从文件系统加载的图像的 MD5 哈希

ByteArrayOutputStream baosFS2 = new ByteArrayOutputStream();
ImageIO.write(bufferedImageFromFilesystem2, "jpg", baosFS2);
byte[] bytesOfImageFromFilesystem2 = baosFS2.toByteArray();
DigestUtils.md5Hex(bytesOfImageFromFilesystem2); // => d1102e4b7efef384623cac915a21e1c2

(org.apache.commons.codec.digest.DigestUtils用于MD5计算)

每次我使用代码 sn -p #3. 在文件系统上保存相同的图像并使用从 #5. 中截取的代码加载相同的图像时文件系统,图像数据被改变。图像的大小缩小了几个字节。该图像仍然可以由标准 Windows 图像查看器打开,并且似乎仍然有效。

我已经检查了问题是否是由图像的元数据引起的。将 jpg 文件的元数据与适当的程序进行比较并不会显示元数据的任何差异。

如何确保加载和保存相同的图像不会更改文件?

【问题讨论】:

  • 我错过了您反复保存和加载同一张图片的地方。您似乎正在重新创建图像。否则,这是个好问题。
  • @GilbertLeBlanc 感谢您的建议。我添加了额外的代码(另外 4 个步骤)以进一步澄清问题。

标签: java bufferedimage


【解决方案1】:

您正在保存 jpeg,它是一种 有损 压缩图像格式,而不是原始缓冲区。有损意味着该过程无法逆转,因为信息在该过程中丢失。将其保存为 jpeg 使用启发式压缩字节数组以减小其大小。因此,当您将其加载回来时,它会产生与原始字节数组不同的字节数组,因此会更改哈希。然后你再次保存它,它再次压缩它,当你加载它时再次导致不同的散列。我怀疑如果你这样做一百万次,图像会变成一个灰色像素,并且哈希值将停止变化。

【讨论】:

  • 我认为JPEG的重要之处在于它是一种有损压缩。每次重新压缩图像时,都会丢失数据。这不是一般压缩的问题(即,您可以使用 Zip 或 Flate 重新压缩任意多次,并保留相同的数据),仅适用于有损压缩方案。
  • 谢谢,我有这个想法,但在我的回答中没有清楚地表达出来。我已对其进行了更新以反映这一重要事实。
  • 感谢您回答我的问题。最初我认为使用 ImageIO.write 或使用质量因子为 1.0 的 JPGWriter 不会进一步压缩我的图像。
猜你喜欢
  • 2021-10-29
  • 1970-01-01
  • 2021-09-22
  • 1970-01-01
  • 1970-01-01
  • 2012-06-12
  • 1970-01-01
  • 2012-08-10
  • 2019-05-25
相关资源
最近更新 更多