加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

您如何每天管理20个或更多Linux服务器?

发布时间:2020-12-13 16:42:47 所属栏目:Linux 来源:网络整理
导读:我正在研究以集中方式管理20台 Linux服务器和100台 Linux工作站的最熟练方法. 我不确定是否有一些管理和监控套件来实现日常管理工作和单个站点的故障排除. 解决方法 我有一个站点有四十个工作站和大约十五个计算节点. 我通过以下方式管理工作站: 强制工程师
我正在研究以集中方式管理20台 Linux服务器和100台 Linux工作站的最熟练方法.

我不确定是否有一些管理和监控套件来实现日常管理工作和单个站点的故障排除.

解决方法

我有一个站点有四十个工作站和大约十五个计算节点.

我通过以下方式管理工作站:

>强制工程师将所有数据存储在NFS网络上,而不是本地存储
>不要让任何工程师因任何原因在任何工作站上拥有root权限
>将所有系统syslog发送到中央syslog-ng主机,定期进行日志解析(通常是每天,但有时每小时一次)
>用nagios监视上/下
>具有可重复的kickstart环境 – 经验法则是如果在30分钟内无法修复问题,机器将重新启动(实际上,我们实际上比这更快地启动,因为在此设置中很少有30分钟的时间我们可以做的故障排除),如果kickstart失败,我们就开始交换硬件

我以几乎相同的方式管理计算服务器场,除了:

>有一个本地/临时目录,任何人都可以写任何东西 – 但是不保证该目录的内容
>性能/使用计数器是通过munin从中央主机完成的
>通过使用cacti监视场节点连接到的交换机端口来完成网络活动

它并不完美,但它保持了这一个网站.

(哦,我应该提一下,这个网站没有任何现场全职IT人员,它是PT和按需.上面的监控系统通常可以让你知道什么时候有一台遇险的电脑.)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读