Hadoop完全分布安装部署

【使用/软件/版本】

VMware Workstation Pro 17、MobaXterm（SSH客户端软件）、Centos 9系统

Hadoop版本为3.3.0、JDK版本为jdk-8u241

【Hadoop完全分布式部署详细步骤】

推荐全程使用SSH客户端，原生无可视化的Linux无法粘贴，而这次很多内容都需要粘贴

一、前置环境设置

1.创建并配置主节点虚拟机（该虚拟机已提前配置好静态IP）

“不会安装虚拟机或者配静态IP，在CSDN上有很多可以搜到，或者过几天我自己总结一个在这套个链接”

（1）先创建一台虚拟机hadoop1（名字按自己像设置的来），在虚拟机Hadoop1的根目录下创建以下目录作为约定。

创建存放数据的目录：mkdir -p /export/data/
创建存放安装程序的目录：mkdir -p /export/servers/
创建存放安装包的目录：mkdir -p /export/software/

（2）在虚拟机Hadoop1的/export/software目录上传JDK和Hadoop安装包并进行安装（红字按自己上传的安装包版本来写）。

tar -zxvf /export/software/jdk-8u241-linux-x64.tar.gz -C /export/servers/
tar -zxvf /export/software/hadoop-3.3.0.tar.gz -C /export/servers

（3）在虚拟机Hadoop1执行“vi /etc/profile”命令编辑环境变量文件profile，在该文件的底部添加配置JDK系统环境变量的内容（注意看好自己的安装的文件名字（版本号））。

export JAVA_HOME=/export/servers/jdk1.8.0_241 
export PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/export/servers/hadoop-3.3.0 
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

（4）退出保存后初始化系统环境变量执行“source /etc/profile”

（5）修改hosts文件方便后续进行集群之间的映射，注意保存退出。

在虚拟机Hadoop1执行“vi /etc/hosts”命令编辑映射文件hosts，在配置文件中添加如下内容（根据自己三台的虚拟机的IP和用户名）。

192.168.121.161 hadoop1 
192.168.121.162 hadoop2 
192.168.121.163 hadoop3

2.创建并配置两台虚拟机来做副节点

（1）在Hadoop1的基础上克隆两台虚拟机（完全克隆）

**（2）修改主机名，修改两台台主机名称为 “hadoop2/hadoop3” **

修改主机名称

vi /etc/hostname 
或者
hostnamectl set-hostname hadoop2（根据自己虚拟机用户名进行修改）

更改后可用

hostname

查看自己的用户名是否修改成功

（3）编辑虚拟机Hadoop2和3的网络配置文件ens33.nmconnection。

在两台虚拟机中分别执行下列命令

vi /etc/NetworkManager/system-connections/ens33.nmconnection

分别修改address1后的IP为192.168.121.162和192.168.121.163（根据自己情况进行修改）

（4）修改虚拟机Hadoop2和Hadoop3的uuid，uuid的作用是使分布式系统中的所有元素都有唯一的标识码。

sed -i '/uuid=/c\uuid='`uuidgen`'' \ /etc/NetworkManager/system-connections/ens33.nmconnection

（5）重启ens33网卡和重新加载网络配置文件

在虚拟机Hadoop2和3中执行“

nmcli c reload

”命令重新加载网络配置文件，以及执行“

nmcli c up ens33

”命令重启ens33网卡，使修改后的网络配置文件生效。

（6）通过执行“ip addr”命令查看虚拟机Hadoop2和3的网络信息，验证网络配置文件是否修改成功。

3. 虚拟机免密登录设置

在集群环境中，主节点需要频繁的访问从节点，以获取从节点的运行状态，主节点每次访问从节点时都需要通过输入密码的方式进行验证，确定密码输入正确后才建立连接，这会对集群运行的连续性造成不良影响，为主节点配置SSH免密登录功能，可以有效避免访问从节点时频繁输入密码。接下来，虚拟机Hadoop1作为集群环境的主节点实现SSH免密登录。

（1）在虚拟机Hadoop1中执行“ssh-keygen -t rsa”命令，生成密钥。

（执行命令生成密钥，并根据提示连续按四次Enter确认，有一次需要输入y）

（2）在虚拟机Hadoop1中执行“cd /root/.ssh/”命令进入存储密钥文件的目录，在该目录下执行“ll”命令查看密钥文件。

（3）将虚拟机Hadoop1生成的公钥文件复制到集群中相关联的所有虚拟机，实现通过虚拟机Hadoop1可以免密登录虚拟机Hadoop1、Hadoop2和Hadoop3

依次输入下列命令：

ssh-copy-id hadoop1 
ssh-copy-id hadoop2 
ssh-copy-id hadoop3

（4）在虚拟机Hadoop1中执行“ssh hadoop2”命令访问虚拟机Hadoop2，验证虚拟机Hadoop1是否可以免密登录虚拟机Hadoop2。（执行exit可退出Hadoop2的连接）