【发布时间】:2018-03-29 19:16:46
【问题描述】:
我的目录有数百个文件,其中一些名称不同但内容重复。我已将文件分组到一个数组中并执行以下操作:
import os
import itertools
import hashlib
directory = os.listdir(input())
for collection1, collection2 in itertools.combinations (directory, 2):
def check(data):
data_check = hashlib.md5()
data_check.update(open(data).read())
return data_check.hexdigest()
def match_check(c1, c2):
return check(c1) == check(c2)
match_check(collection1,collection2)
【问题讨论】:
-
这里没有问题。在 SO 上,您不仅需要提供一个最小示例,还需要提供您所期望的与您的最小示例产生的结果之间的差异。
-
好的。你有什么问题?
-
我的示例不完整,我对代码的期望是打印具有完全相同内容的文件的匹配项。 t
标签: python itertools hashlib listdir