如何在 Java 中计算文件的哈希值？ [复制]答案

【问题标题】：How to calculate hash value of a file in Java? [duplicate]如何在 Java 中计算文件的哈希值？ [复制]
【发布时间】：2023-03-14 10:06:01
【问题描述】：

我编写了以下程序来计算 Java 中字符串的 SHA-256 哈希值：

public class ToHash {

    public static void main(String[] args)  {

        byte[] data = "test".getBytes("UTF8");
        MessageDigest digest = MessageDigest.getInstance("SHA-256");
        byte[] hash = digest.digest(data);
        System.out.println(new BASE64Encoder().encode(hash));

    }
}

嗯，效果很好。在下一步中，我想以一种接受文件并计算其哈希值的方式开发它。我的解决方案是读取字符串数组中的整个文件，并在该字符串数组上调用digest() 方法。但是有两个问题：

我不知道如何将整个文件读入数组？目前我认为我必须逐行阅读并在新行中附加一个数组！
上述方法需要大量内存来存储大文件！

这是我当前读取文件的程序：

public class ToHash {

    public static void main(String[] args) throws NoSuchAlgorithmException, UnsupportedEncodingException, FileNotFoundException, IOException {
        // TODO code application logic here

        // The name of the file to open.
        String fileName = "C:\\Users\\ghasemi\\Desktop\\1.png";
        BufferedReader br = null;

        try {

            String sCurrentLine;
            br = new BufferedReader(new FileReader(fileName));
            while ((sCurrentLine = br.readLine()) != null) {
                byte[] data = sCurrentLine.getBytes("UTF8");
                System.out.println(new BASE64Encoder().encode(data));
            }

        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (br != null) {
                    br.close();
                }
            } catch (IOException ex) {
                ex.printStackTrace();
            }
        }

    }
}

BufferedReader 对象似乎无法通过一次调用读取整个文件。

【问题讨论】：

标签： java arrays file-io hash

【解决方案1】：

您可以随时读取文件并计算哈希值。

    byte[] buffer= new byte[8192];
    int count;
    MessageDigest digest = MessageDigest.getInstance("SHA-256");
    BufferedInputStream bis = new BufferedInputStream(new FileInputStream(fileName));
    while ((count = bis.read(buffer)) > 0) {
        digest.update(buffer, 0, count);
    }
    bis.close();

    byte[] hash = digest.digest();
    System.out.println(new BASE64Encoder().encode(hash));

这不假设任何关于字符集或文件适合内存的任何内容，也不会忽略行终止符。

或者您可以使用DigestInputStream.

【讨论】：

上述程序是否适用于所有大文件？（1 GigaByte）例如！
@Abraham 当然，为什么不呢？它只需要 8192 字节的内存加上摘要使用的任何内容。您可以使用缓冲区大小，但不要让它变得更小。
我认为在digest.update() 方法中，我们将读取的数据附加到先前数据的末尾，因此我们需要大量内存（RAM）来存储大文件。
请问count = bis.read(data)中的data是指什么？在我的程序中使用相同的data？
@Abraham 不，我们逐步重新计算哈希值。请参阅 Javadoc。没有关于附加数据的内容。 data 是一个错字。