【发布时间】:2019-12-23 00:33:31
【问题描述】:
我观察到,当我从 *.txt 文件和 *.docx 文件中散列数据时,即使两个文件中的数据相同,生成的两个散列也不同。 为什么会这样?
【问题讨论】:
-
这两种情况下使用的字符编码是什么?
-
你怎么知道它是一样的?我在一个 txt 文件和一个 docx 中写了 hello 这个词。文本文件为 1kb,docx 为 12kb,因此在内容相同的情况下,docx 可能会保存更多与文档及其格式相关的数据。
-
您错了:“两个文件中的数据相同”。打开它们看起来相似但它们不一样!无论如何,散列适用于文件数据(字节)而不是“内容”。
标签: python hash cryptography digital-signature sha256