用hashlib.md5
获得打开文件的md5值,但是当文件很大的时候,比如好几个G,就会吃掉过多的内存,有没有办法在不打开文件的情况下,获得大文件的md5值呢?
def md5_for_file(f, block_size=2**20): md5 = hashlib.md5() while True: data = f.read(block_size) if not data: break md5.update(data) return md5.digest()
def md5(f):
cmd = "md5sum " + f
import subprocess
fp = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
(s,e) = fp.communicate()
result = (s.decode()).strip()
e = (e.decode()).strip()
return (result, e)