【问题标题】:Checksum inconsistencies in reading large files within same server. Hardware issue symptoms?在同一服务器中读取大文件时校验和不一致。硬件问题症状?
【发布时间】:2013-10-22 06:29:22
【问题描述】:

我在一台服务器上存在校验和不一致的问题,想知道您的意见和您可能有过的类似经历。

每次我运行命令时

# md5sum MyBig.3GB.largeFile.bin

校验和输出不同。即使对于这个命令:

# for i in {1..10} ; do time md5sum MyBig.3GB.largeFile.bin ;done

随后的校验和输出不同,运行每次迭代所花费的时间也非常不同,可能是随机的,从 10 秒到 3 分钟,这是基于 I/O 性能的通常时间。

问题不仅在于“md5sum”校验和,还在于“cksum”和“sha1sum”。同样不一致的结果。

我有三台双服务器,规格完全相同。其中只有一个显示了这个问题。 服务器处于测试阶段,还没有真正的最终用户。尽管您仅在服务器受到压力并承受重负载时才会看到此行为。这很重要,您重新启动服务器并且问题消失,直到再次被推到极限,然后它开始显示这些症状。

服务器是华硕主板、Intel Xeon i7 CPU、4x8GB kingston RAM、SATA 控制器 Intel 8 Series/C220、RAID-1 软件中的 2x2TB Seagate ST2000DM,运行 CentOS 6.4 64bit。

根据我的经验,这是硬件潜在问题的明显症状。但是,服务器所有者(我只是租用这些服务器)进行了内存测试,并否认有任何与硬件相关的问题。服务器是全新的。内存测试没有显示任何内存问题。

现在,这是你们所有人的问题。你怎么看?可能是什么问题呢? 你过去有没有类似的问题。

谢谢。

(对不起,描述太长了)

【问题讨论】:

    标签: hardware large-files memory-corruption


    【解决方案1】:

    这听起来像是我的记忆问题。或者其他一些硬件错误。

    这似乎不太可能是软件问题。你是对的,告诉服务器所有者更加努力或测试其他系统,如 PCI 互连和驱动器本身。

    【讨论】:

    • 谢谢。我同意。当内存测试结果没有抛出任何错误时,你怎么能告诉所有者——“嘿,你的那些 SIMM 内存芯片有问题”?
    • 问他是否可以更长时间地运行测试或承受更多压力?或者也可以要求他运行磁盘/cpu 测试?
    猜你喜欢
    • 2022-12-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-04-18
    • 1970-01-01
    相关资源
    最近更新 更多