1.数据仓库
1.1概念
构建面向分析的集成化数据环境
面向分析的存储数据
1.2主要特征
数据仓库是面向主题的集成的非易失的和时变的数据集合,用以支持管理决策

1.2.3 非易失性




开启三台虚拟机
上传压缩包到software

解压到src下

改名

修改环境变量


生效环境变量

查询卸载Maeidb文件包



上传MySQL安装包

安装MySQL软件包

修改my文件


注意错误 可能是my.cnf文件错误

开启mysql服务

查看mysql开启状态

查看mysql初始密码
cat /var/log/mysqld.log | grep password
重新设定密码和配置,登录
**mysql_secure_installation **
新密码:Password123$
登录:mysql -uroot -pPassword123$

新建hive用户元与数据
create database hive_db;
#新建 hive_db 数据库作为 Hive 的元数据存储地址。
**create user hive identified by 'Password123$'; **
#创建 Hive 访问用户,用户名为 hive,密码为 hive。
grant all privileges on . to hive@'%' identified by 'Password123$' with grant option ;
grant all privileges on . to 'root'@'%'identified by 'Password123$' with grant option;
#grant 权限 1,权限 2,...权限 n on 数据库名称.表名称 to 用户名@用户地址。赋予 hive 用户对所有数据库所有表的所有权限且任何地址都能建立连接“%”,并具有授予权。
flush privileges
#刷新 MySQL 的系统权限相关表
赋予 hive 用户对所有数据库所有表的所有权限且任何地址都能建立连接“%”,并具有授予权。

改用户权限

配置 hive-site.xml
因为没有所以要复制
去conf下复制出hive-site.xml
cp /usr/local/src/hive/conf/hive-default.xml.template /usr/local/src/hive/conf/hive-site.xml

Vim hive-site.xml

连接 MySQL 的 hive 操作用户

连接 MySQL 的 hive 操作用户密码

配置数据库连接驱动

远程资源下载的临时目录

hive.exec.local.scratchdir

hive.querylog.location

hive.server2.logging.operation.log.location

hiveserver2 WebUI 页面访问地址

hiveserver2 WebUI 页面访问端口

配置hive-env.xml
cp /usr/local/src/hive/conf/hive-env.sh.template /usr/local/src/hive/conf/hive-env.sh
vi /usr/local/src/hive/conf/hive-env.sh

开启三台虚拟机节点 首先开启zookeeper节点 zkServer.sh start
master

Slave1


Slave2

开启namenode节点在hdfs上创建warehouse,并更改权限,在本地创建tmp文件夹
hadoop fs -mkdir -p /user/hive/warehouse
hadoop fs -chmod g+w /user/hive/warehouse
**mkdir /usr/local/src/hive/tmp **

将 Hive 连接 MySQL 的驱动器文件上传至 Hive 的 lib 文件夹下

初始化数据库
schematool -initSchema -dbType mysql
当显示 schemaTool completed 时,初始化成功

查看 MySQL 下 hive_db 数据库,发现多出许多个新表(55 个)

启动hive


打开 MySQL 数据库,使用配置过的 hive_db 数据库,hive 创建的表统一都在 hive_d b 数据库的 TBLS 表中。当创建表存在,既基于 MySQL 存储元数据的 Hive 组件搭建完毕。

版权归原作者 hello snowman 所有, 如有侵权,请联系我们删除。