加入收藏 | 设为首页 | 会员中心 | 我要投稿李大同（https://www.lidatong.com.cn/）- 科技、建站、经验、云计算、5G、大数据,站长网!

当前位置：首页 > 百科 > 正文

HDFS High Availability Using the Quorum Journal Manager

发布时间：2020-12-14 04:42:53 所属栏目：百科来源：网络整理

导读：http://hadoop.apache.org/docs/r2.9.0/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html 背景在Hadoop 2.0.0以前，在一个HDFS集群中NameNode存在单点故障。每个集群中只有一个NameNode，如果这个机器不可用的话，那么整个集群将不可用，

http://hadoop.apache.org/docs/r2.9.0/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

背景

在Hadoop 2.0.0以前，在一个HDFS集群中NameNode存在单点故障。每个集群中只有一个NameNode，如果这个机器不可用的话，那么整个集群将不可用，直到这个机器被重启或者其它的机器来替代它。这就意味着：

万一NameNode机器宕机了，那么整个集群不可用
NameNode机器上的软件或者硬件升级的时候，集群不得不停止运行

HDFS HA在每个集群中运行两个NameNode，一个是Active的，一个Passive的，作为热备。

架构

在典型的HA集群中，两个分开的机器均被配置为NameNode。在任意时刻，只有一个NameNode处于活动状态，另一个处于备用状态。处于活动状态的NameNode负责处理集群中所有客户端操作，此时处于备用状态的NameNode只是扮演者slave的角色。这个备用的NameNode维护足够的状态，以防快速容灾。

备用NameNode为了保持和活动NameNode的状态同步，这两个节点用一组单独的后台进程进行通信，这个守护进程被叫做“JournalNodes”（简称JNs）。当处于活动状态的NameNode做了任何修改以后，它将修改的日志传给大部分JNs。备用的NameNode从JNs中读取这种修改，并且会把这种改变写到EditLog中。因为备用NameNode看到这些编辑，所有它将这种改变应用到自己的namespace中。

要想保住HA集群正确的操作，至关重要的一点是，同一时间集群中只能有一个NameNode处于活动状态。为了保证这一点，JournalNodes只允许同一时间只有一个NameNode可以写。

硬件资源

为了部署一个HA集群，你需要准备下列资源：

NameNode machines：运行活动的和备用的NameNode的机器的硬件配置应该是相等的
JournalNode machines：必须至少3个JournalNode，因为Edit Log必须被写到大多数JNs上。也就是说，可以容忍单个机器失败。你也可以运行3个以上的JournalNode，但是为了能够增加系统承受失败的数量，你应该运行奇数个JNs（比如：3，5，7等等）。当运行的JournalNode数量是N的时候，系统最多可以容忍（N - 1）/ 2个失败，并且正常服务。

?

其它参考

http://blog.csdn.net/strongerbit/article/details/7013221/

?

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

相关内容

推荐文章

站长推荐

热点阅读