【发布时间】:2018-04-18 05:10:19
【问题描述】:
我创建了一个~2MiB 文件。
dd if=/dev/urandom of=file.bin bs=2M count=1
然后我多次复制该文件并为每个(相同的)副本生成一个校验和。
for i in `seq 50000`;
do
name="file.${i}.bin"
cp file.bin "${name}"
sha512sum "${name}" > "${name}.sha512"
done
然后,我使用验证脚本验证了所有这些校验和文件,以针对每个文件运行 sha512sum。
for file in `find . -regex ".*\.sha512"`
do
sha512sum --check --quiet "${file}" || (
cat "${file}" && sha512sum "${file%.sha512}"
)
done
我刚刚创建了这些文件,当我稍后验证它们时,我发现数据中出现间歇性故障和不一致(为了便于阅读,控制台文本被截断)
will:/mnt/usb $ for file in `find ...
file.5602.bin: FAILED
sha512sum: WARNING: 1 computed checksum did NOT match
91fc201a3812e93ef3d4890 ... file.5602.bin
b176e8e3ea63a223130f3a0 ... ./file.5602.bin
校验和文件都是相同的,因为源文件都是相同的
问题似乎是,当我去验证时,我的计算机似乎随机生成了错误的校验和。 不同的文件每次都无法通过校验和,而之前失败的文件将通过。
will:/mnt/usb $ for file in `find ...
sha512sum: WARNING: 1 computed checksum did NOT match
91fc201a3812e93ef3d4890 ... file.3248.bin
442a1d8805ed134c9ab5252 ... ./file.3248.bin
请记住,所有这些文件都是相同的。
我看到 SATA SSD 和 HDD 以及 USB 设备、md5 和 sha512、xfs、btrfs、ext4 和 vfat 的行为相同。我尝试实时启动到另一个操作系统。不管怎样,我看到了同样的陌生人行为。我还看到rsync --checksum 这些文件认为校验和错误并重新复制这些文件,即使它们没有更改。
什么可以解释这种行为?由于它发生在具有我描述的所有场景的多个设备上,我怀疑这有点烂。我的内核日志没有显示明显的错误。根据我的故障排除,我认为这是硬件问题,但如何诊断?是 CPU、主板、内存吗?
【问题讨论】:
-
我将我的 PSU 替换为 I'd read,这可能是硬盘驱动器出现问题的根源,但我看不出行为有什么不同。
-
有时我的验证过程似乎根本找不到文件。
sha512sum: file.6707.bin: Input/output error -
我运行了Intel CPU diagnostic(在修复bug、
lodctr /R之后),英特尔测试给了我一个没有错误的通过结果。 -
我没有可以在系统菜单和ASUS (my MOBO maker) has docs for a "PC Diagnostic Tool" 中找到的 BIOS 诊断工具,但它们似乎不再托管该工具。我在一个不可靠的下载站点上找到了该工具的下载,但它没有报告任何错误。我的H87I-PLUS Motherboard seems to have some sort of utility program,但它不会运行,而且似乎只是我所读到的一种风扇速度实用程序。
标签: filesystems checksum disk