Linux中hadoop 单机_伪分布_安装与配置
步骤一:创建 hadoop 用户,并为 hadoop 用户授权 (1) 在一个新的Linux系统CentOS-7-x86_64-DVD-1708.iso中,开始用户是root不是hadoop用户是,那么需要增加一名为Hadoop的用户。执行下面命令查看hadoop用户是否存在。 $cat ? /etc/passwd |grep? hadoop (2) 如果 hadoop 用户不存在则创建 hadoop 用户,则继续执行(3),如果 hadoop 用户存在则执行步骤(4)。 (3) 创建用户 hadoop。(若系统没有sudo此命令,则 yum install net-tools 安装) $sudo useradd -m hadoop -s /bin/bash (4)设置密码为 hadoop(密码不回显) $sudo passwd hadoop (5)为 hadoop 用户授予 sudo 权限。(为hadoop用户授权会出现错误:hadoop is not in the sudoers file. This incident will be reported. :解决方法点击此链接:https://blog.csdn.net/haijiege/article/details/79630187 ) $sudo adduser hadoop sudo (6)重启计算机,以 hadoop 用户登录。 $reboot 步骤二:修改集群节点名称,添加域名映射。 (1)将节点名称写入/etc/hostname 文件中。 $sudo vi? /etc/hostnames? (2)将节点的 IP 地址与主机名写入/etc/hosts 中,完成域名映射的添加。 $sudo vi /etc/hosts? 例如: 172.17.67.10 master 如图配置完成: ? ? ? (3)重新启动计算机。 $reboot 步骤三:SSH 登录权限设置 (1)在节点上安装 SSH。 查看ssh的安装包 :rpm -qa | grep ssh ? 下图安装好的: ? ? ? ? ? ?未安装则输入命令: $sudo apt-get install openssh-server (2)在节点上生成公钥和私钥。 $ssh-keygen –t rsa (命令输入后等待自动完成) 在~/目录下自动创建目录.ssh,内部创建 id_rsa(私钥)、id_rsa.pub(公钥)、 authorized_keys 文件。 (3)将节点的公钥发送到 .ssh/authorized_keys 文件中。 $cd ~/.ssh $cat ./id_rsa.pub >> ./authorized_keys (4)测试 SSH 免密码登录。(暂时还需输入密码登录) $ssh localhost ? ? 测试成功后,可以执行 exit 命令结束远程登录。 步骤四:安装 Java 环境 (1)在目录/usr/lib 中创建 jvm 目录,并将目录所有者修改为 hadoop 用户。 $sudo mkdir /usr/lib/jvm/ $sudo chown –R hadoop:hadoop /usr/lib/jvm (2)使用tar命令解压安装jdk-8u121-linux-x64.tar.gz文件到目录/usr/lib/jvm。 $cd ~/ ?(进入jdk安装包目录进行解压) $sudo tar zxvf jdk-8u121-linux-x64.tar.gz -C /usr/lib/jvm/ (3)配置 JDK 环境变量,使其生效。 ①使用 vi 命令打开用户的配置文件.bashrc。 $sudo vi ~/.bashrc ②在文件中加入下列内容: export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_121 export JRE_HOME=$JAVA_HOME/jre export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH export CLASSPATH=$CLASSPATH:.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib ③使环境变量生效,并验证 JDK 是否安装成功。 $ source ~/.bashrc #生效环境变量 $ java –version #如果打印出 java 版本信息,则成功 ? ?步骤五:伪分布式集群安装配置 (1)使用 tar 命令解压安装 hadoop-2.7.3.tar.gz 文件到目录/usr/local,并重命 名为 hadoop。 $cd ~/ #进入 hadoop-2.7.3.tar.gz 文件所在目录 $sudo tar -zxvf hadoop-2.7.3.tar.gz -C /usr/local $cd /usr/local #进入/usr/local 查看解压结果 $ls #解压后目录名为 hadoop-2.7.3 $sudo mv ./hadoop-2.7.3 ./hadoop #为简化操作,文件夹重命名为 hadoop (2)将目录/usr/local/hadoop 的所有者修改为 hadoop 用户。 $ sudo chown -R hadoop:hadoop /usr/local/hadoop (3)修改环境变量,并使其生效。 ①修改环境变量 $sudo vi ~/.bashrc #打开用户配置文件 在用户配置文件.bashrc 中写入下列 hadoop 配置信息。 export HADOOP_HOME=/usr/local/hadoop export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop export YARN_HOME=/usr/local/hadoop export YARN_CONF_DIR=${YARN_HOME}/etc/hadoop ② 生效环境变量 $source ~/.bashrc (4)配置 Hadoop 文件 伪分布环境中,伪分布式需要修改下列 4 个配置文件。 $cd /usr/local/hadoop/etc/hadoop $vi filename(文件) ①hadoop-env.sh 中配置 JAVA_HOME export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_121 ②yarn-env.sh 中配置 JAVA_HOME export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_121 ③修改 core-site.xml 文件。 ? ? ? ? ④修改 hdfs-site.xml 文件。 ? ? ? ? ? (5)格式化 NameNode 节点。 $cd /usr/local/hadoop $bin/hdfs namenode -format 注意:若格式化之后,重新修改了配置文件,那么需要重新格式化操作,在 此之前需要删除 tmp、dfs、logs 文件夹。 (8)启动 Hadoop 服务 $cd /usr/local/hadoop $bin/start-dfs.sh $bin/start-yarn.sh (9)验证是否安装成功。 ① 执行 jps 命令查看服务 $sbin/start-all.sh 命令可用于启动整个hadoop服务 ? ? 更详细转载:https://www.cnblogs.com/hopelee/p/7049819.html (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |