有两个任意格式的文件。
如何用Java判断两个文件是否一样?
或者内容是一样的(不考虑文件名等信息)。
需要考虑文件比较大的情况下的效率问题。
取散列值。常见算法有MD5,SHA-256
如果你维护这些文件列表,并且后期会不定期进行比较,也就是确定一个文件有多次被比较的机会。可以计算这些文件的MD5并缓存起来,后期直接用MD5进行比较。
如果只是临时性的随机选两个文件进行比较,可以先比较文件大小,如果文件大小不同就说明文件内容不相同。如果大小相等的话,可以打开这两个文件的输入流,字节逐一比较,如果中间有不相等的字节就说明两个文件不相等,然后直接退出比较,需要注意的是文件流要缓冲(BufferedInputStream)。
之所以不推荐MD5是因为MD5也需要根据文件全部内容计算散列值,可是实际上中途发现有一个字节不相同就可以判定这两个文件是不同的,根本没必要去读取文件的全部内容。
//in1, in2为两个文件的输入流,最后注意流的关闭
int c;
while ((c = in1.read()) != -1) {
if (in2.read() != c) return false;
}
return true;
先通过文件的大小和后缀等粗略的判断,如果都相同,就要通过MD5值来判断内容是不是相同。算法可以问度娘。
比较通用的就是计算md5等值来比较