【发布时间】:2018-01-13 12:13:34
【问题描述】:
我想加载可能不同文件的 MD5。我正在关注answer 这样做,但主要问题是加载文件的 MD5 所需的时间(可能有数百个)很多。
有什么方法可以用来查找文件的MD5而不用花费太多时间。
注意 - 文件的大小可能很大(可能高达 300MB)。
这是我正在使用的代码 -
import java.io.*;
import java.security.MessageDigest;
public class MD5Checksum {
public static byte[] createChecksum(String filename) throws Exception {
InputStream fis = new FileInputStream(filename);
byte[] buffer = new byte[1024];
MessageDigest complete = MessageDigest.getInstance("MD5");
int numRead;
do {
numRead = fis.read(buffer);
if (numRead > 0) {
complete.update(buffer, 0, numRead);
}
} while (numRead != -1);
fis.close();
return complete.digest();
}
// see this How-to for a faster way to convert
// a byte array to a HEX string
public static String getMD5Checksum(String filename) throws Exception {
byte[] b = createChecksum(filename);
String result = "";
for (int i=0; i < b.length; i++) {
result += Integer.toString( ( b[i] & 0xff ) + 0x100, 16).substring( 1 );
}
return result;
}
public static void main(String args[]) {
try {
System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe"));
// output :
// 0bb2827c5eacf570b6064e24e0e6653b
// ref :
// http://www.apache.org/dist/
// tomcat/tomcat-5/v5.5.17/bin
// /apache-tomcat-5.5.17.exe.MD5
// 0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe
}
catch (Exception e) {
e.printStackTrace();
}
}
}
【问题讨论】:
-
尝试更大的缓冲区:例如
64 * 1024 -
@pskink 尝试缓冲到
32764,但仍然消耗了很多平局。进一步增加缓冲区大小有什么害处吗? -
在十六进制转换中附加字符串将花费大量时间。使用`BigInteger.toHexString()`。
-
@EJP 发生碰撞的几率是多少?
标签: java android md5 md5sum md5-file