加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

监视Linux上的物理RAM错误

发布时间:2020-12-14 02:27:11 所属栏目:Linux 来源:网络整理
导读:我想监视两个 Linux系统(Ubuntu和Red Hat)的内存.我意识到我可以从启动运行memtest86来诊断坏ram.但是在系统仍在运行时是否有任何监控RAM的解决方案.我在想一个守护进程,它从随机未使用的内存中写入和读回.以前有人见过这样的东西吗? 解决方法 大多数具有任
我想监视两个 Linux系统(Ubuntu和Red Hat)的内存.我意识到我可以从启动运行memtest86来诊断坏ram.但是在系统仍在运行时是否有任何监控RAM的解决方案.我在想一个守护进程,它从随机未使用的内存中写入和读回.以前有人见过这样的东西吗?

解决方法

大多数具有任何合理质量的现代服务器都有一个IPMI模块,它会报告坏的RAM(通常是通过来自ECC RAM的SBE(单比特错误)消息 – 你在服务器中使用ECC RAM,对吗?). IPMI模块还监视和报告一堆其他有用的东西.

您可以使用各种网络监视系统(如果您有IPMI NIC的管理网络)或使用大多数Unix系统上提供的ipmitool来监视IPMI模块.许多供应商(戴尔和IBM肯定)也有专门的工具来询问IPMI模块的在线诊断.有关详细信息,请咨询硬件供应商.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读