【问题标题】:How to calculate hash value of a file in Java? [duplicate]如何在 Java 中计算文件的哈希值? [复制]
【发布时间】:2023-03-14 10:06:01
【问题描述】:

我编写了以下程序来计算 Java 中字符串的 SHA-256 哈希值:

public class ToHash {

    public static void main(String[] args)  {

        byte[] data = "test".getBytes("UTF8");
        MessageDigest digest = MessageDigest.getInstance("SHA-256");
        byte[] hash = digest.digest(data);
        System.out.println(new BASE64Encoder().encode(hash));

    }
}

嗯,效果很好。在下一步中,我想以一种接受文件并计算其哈希值的方式开发它。我的解决方案是读取字符串数组中的整个文件,并在该字符串数组上调用digest() 方法。但是有两个问题:

  1. 我不知道如何将整个文件读入数组?目前我认为我必须逐行阅读并在新行中附加一个数组!

  2. 上述方法需要大量内存来存储大文件!


这是我当前读取文件的程序:

public class ToHash {

    public static void main(String[] args) throws NoSuchAlgorithmException, UnsupportedEncodingException, FileNotFoundException, IOException {
        // TODO code application logic here

        // The name of the file to open.
        String fileName = "C:\\Users\\ghasemi\\Desktop\\1.png";
        BufferedReader br = null;

        try {

            String sCurrentLine;
            br = new BufferedReader(new FileReader(fileName));
            while ((sCurrentLine = br.readLine()) != null) {
                byte[] data = sCurrentLine.getBytes("UTF8");
                System.out.println(new BASE64Encoder().encode(data));
            }

        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (br != null) {
                    br.close();
                }
            } catch (IOException ex) {
                ex.printStackTrace();
            }
        }

    }
}

BufferedReader 对象似乎无法通过一次调用读取整个文件。

【问题讨论】:

    标签: java arrays file-io hash


    【解决方案1】:

    您可以随时读取文件并计算哈希值。

        byte[] buffer= new byte[8192];
        int count;
        MessageDigest digest = MessageDigest.getInstance("SHA-256");
        BufferedInputStream bis = new BufferedInputStream(new FileInputStream(fileName));
        while ((count = bis.read(buffer)) > 0) {
            digest.update(buffer, 0, count);
        }
        bis.close();
    
        byte[] hash = digest.digest();
        System.out.println(new BASE64Encoder().encode(hash));
    

    这不假设任何关于字符集或文件适合内存的任何内容,也不会忽略行终止符。

    或者您可以使用DigestInputStream.

    【讨论】:

    • 上述程序是否适用于所有大文件? (1 GigaByte)例如!
    • @Abraham 当然,为什么不呢?它只需要 8192 字节的内存加上摘要使用的任何内容。您可以使用缓冲区大小,但不要让它变得更小。
    • 我认为在digest.update() 方法中,我们将读取的数据附加到先前数据的末尾,因此我们需要大量内存(RAM)来存储大文件。
    • 请问count = bis.read(data)中的data是指什么?在我的程序中使用相同的data
    • @Abraham 不,我们逐步重新计算哈希值。请参阅 Javadoc。没有关于附加数据的内容。 data 是一个错字。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-11-05
    • 1970-01-01
    • 1970-01-01
    • 2014-10-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多