linux – L3缓存中的ECC错误 – 关键与否?
在
Linux服务器(8x四核AMD 8378)上,我收到以下错误:
[Hardware Error]: MC4_STATUS[-|CE|MiscV|-|AddrV|CECC]: 0x9c294c00001d018b [Hardware Error]: Northbridge Error (node 4): ECC error in L3 cache tag. [Hardware Error]: cache level: L3/GEN,tx: GEN,mem-tx: SNP [Hardware Error]: Machine check events logged 这种情况在上个月发生了三次,但从未发生过(服务器运行3年). 从快速谷歌搜索,似乎这是一个严重的问题. 但是,供应商支持技术人员说:
那么 – 这是一个严重的错误,我应该订购新的部件(更换CPU?)或忽略它? 非常感谢. 解决方法
最佳实践:尽可能保留自己的备件.
至于机器检查异常,这些由硬件报告;内核只是将消息传递给您,以便您可以在硬件问题失控之前采取措施并导致真正的灾难. 我能够找到内核“误报”机器检查异常的唯一实例如下. In this case,这是导致问题的处理器中的一个缺陷,而不是内核.
一句话:听起来像供应商试图避免更换有缺陷的硬件. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |