0


大数据技术之Hadoop-运行环境搭建

Hadoop 运行环境搭建

一、VMware准备Linux虚拟机

** 1. 设置VMware网段**

在VMware的虚拟网络编辑器中,将VMnet8虚拟网卡的:

  • 网段设置为:192.168.88.0
  • 网关设置为:192.168.88.2

2. 下载CentOS操作系统

首先,我们需要下载操作系统的安装文件,本次使用CentOS7.6版本进行学习:

https://vault.centos.org/7.6.1810/isos/x86_64/   

首先,我们需要下载操作系统的安装文件,本次使用CentOS7.6版本进行学习:

或者直接使用如下链接下载:

https://vault.centos.org/7.6.1810/isos/x86_64/CentOS-7-x86_64-DVD-1810.iso

3. 在VMware中安装CentOS****操作系统

打开VMware软件

按照步骤创建虚拟机:

点击完成后,即开启了CentOS系统的安装,耐心等待安装完成即可,后续都是自动化的。

点击用户名:

体验Linux的快乐吧。

4. 配置多台Linux虚拟机

我们可以使用VMware提供的克隆功能,基于一台虚拟机去克隆创建多台虚拟机。

首先,在VMware中,创建一个文件夹,起名为大数据集群

克隆

同样的操作克隆出:node2和node3

对虚拟机的内存进行配置:

  • node1配置为4G内存
  • node2、node3配置为2G内存

二 、VMware虚拟机系统设置

**1. **对三台虚拟机完成主机名、固定IP、SSH免密登陆等系统设置

1. 1 配置固定IP地址

开启node1,修改主机名为node1,并修改固定ip为:192.168.88.131

#修改主机名
hostnamectl set-hostname node1

#修改IP地址
vim /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR="192.168.88.131"

#重启网卡
systemctl stop network
systemctl start network#

#或者直接
systemctl restart network

同样的操作启动node2和node3,

修改node2主机名为node2,设置ip为192.168.88.132

修改node2主机名为node3,设置ip为192.168.88.133

1.2 配置主机名映射

在Windows系统中修改hosts文件,填入如下内容:

192.168.88.131 node1
192.168.88.132 node2
192.168.88.133 node3

在3台Linux的/etc/hosts文件中,填入如下内容(3台都要添加)

192.168.88.131 node1
192.168.88.132 node2
192.168.88.133 node3
1.3 配置SSH免密登录

后续安装的集群化软件,多数需要远程登录以及远程执行命令,我们可以简单起见,配置三台Linux服务器之间的免密码互相SSH登陆

    在每一台机器都执行:`ssh-keygen -t rsa -b 4096`,一路回车到底即可。

    在每一台机器都执行:
ssh-copy-id node1
ssh-copy-id node2
ssh-copy-id node3
    执行完毕后,node1、node2、node3之间将完成root用户之间的免密互通
1.4 创建hadoop用户并配置免密登录

后续大数据的软件,将不会以root用户启动(确保安全,养成良好的习惯)

我们为大数据的软件创建一个单独的用户hadoop,并为三台服务器同样配置hadoop用户的免密互通

    1. 在每一台机器执行:useraddhadoop,创建hadoop用户

    2. 在每一台机器执行:passwd hadoop,设置hadoop用户密码为123456

    3. 在每一台机器均切换到hadoop用户:su - hadoop,并执行 ssh-keygen -t rsa -b 4096,创建ssh密钥

   4 在每一台机器均执行
ssh-copy-id node1
ssh-copy-id node2
ssh-copy-id node3

2. JDK环境部署

2.1 什么是JDK为什么需要部署它

** **JDK:Java Development Kit,是用于Java语言开发的环境。

    大数据的很多软件的运行都需要有Java运行环境的支持,所以我们在三台服务器上,预先都部署好JDK环境。
2.2 配置JDK环境

** **下载JDK软件:https://www.oracle.com/java/technologies/downloads

在页面下方找到:

下载jdk-8u361-linux-x64.tar.gz

1.创建文件夹,用来部署JDK,将JDK和Tomcat都安装部署到:/export/server 内

mkdir -p /export/server
  1. 解压缩JDK安装文件
tar -zxvf jdk-8u351-linux-x64.tar.gz-C /export/server
  1. 配置JDK的软链接
ln-s /export/server/jdk1.8.0_351 /export/server/jdk
  1. 配置JAVA_HOME环境变量,以及将$JAVA_HOME/bin文件夹加入PATH环境变量中
# 编辑/etc/profile文件
export JAVA_HOME=/export/server/jdk
export PATH=$PATH:$JAVA_HOME/bin
  1. 生效环境变量
source /etc/profile
  1. 配置java执行程序的软链接
# 删除系统自带的java程序
rm -f /usr/bin/java
# 软链接我们自己安装的java程序
Ln-s /export/server/idk/bin/java /usr/bin/java
  1. 执行验证
java -version
javac -version

3. 防火墙、SELinux、时间同步

关闭防火墙和SELinux

集群化软件之间需要通过端口互相通讯,为了避免出现网络不通的问题,我们可以简单的在集群内部关闭防火墙。

# 每台机器执行
systemctl stop firewalld
systemctl disable firewalld

Linux有一个安全模块:SELinux,用以限制用户和程序的相关权限,来确保系统的安全稳定。

在当前,我们只需要关闭SELinux功能,避免导致后面的软件运行出现问题即可

# 每台机器执行
vim /etc/sysconfig/selinux

#将第七行,SELINUX=enforcing 改为
SELINUX=disabled
#保存退出后,重启虚拟机即可,千万要注意disabled单词不要写错,不然无法启动系统

4. 修改时区并配置自动时间同步

以下操作在三台Linux均执行

  1. 安装ntp软件
yum install -y ntp
  1. 更新时区
rm -f /etc/localtime;sudo ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
  1. 同步时间
ntpdate -u ntp.aliyun.com
  1. 开启ntp服务并设置开机自启
systemctl start ntpd
systemctl enable ntpd

5. 设置快照

目前Linux虚拟机的状态基本准备就绪,可以对当前状态进行快照保存,以备后续恢复。

对三台虚拟机均执行拍摄快照。

标签: linux 运维 服务器

本文转载自: https://blog.csdn.net/qq_33934592/article/details/136363560
版权归原作者 半间烟雨 所有, 如有侵权,请联系我们删除。

“大数据技术之Hadoop-运行环境搭建”的评论:

还没有评论