0


如何在ubuntu上安装Hive 嵌入式

**安装环境 **

⚫ 虚拟机系统:CentOS7

⚫ Hadoop 安装模式:伪分布式(单节点)

⚫ Hive 安装模式:嵌入模式

⚫ 安装包:

Hive(3.1.3)

https://dlcdn.apache.org/hive/

**安装步骤 **

(1) **安装 **

解压 Hive 安装包

tar -zxvf apache-hive-3.1.3-bin.tar.gz

打开文件重命名

移动到/usr/local 路径下并命名

sudo mv hive-3.1.3 /usr/local/

**(2) ****配置环境变量 **

在**/etc/profile.d **路径下新建 hive.sh 脚本文件在文件中添加 HIVE_HOME 变量并将其添加到 PATH 变量中,后 export 这

两个变量。

sudo vim /etc/profile.d/hive.sh
HIVE_HOME=/usr/local/hive-3.1.3
PATH=$HIVE_HOME/bin:$PATH
export HIVE_HOME PATH

更新环境变量

source /etc/profile

测试是否配置成功**(需要提前启动 hdfs) **

hive

**(3) Hive ****配置文件 **

进入**/usr/local/hive-3.1.3 /conf/**路径下

将 hive-env.sh.template 复制一份并命名为 hive-env.sh

cp hive-env.sh.template hive-env.sh

编辑 hive-env.sh 进行配置

找到“# HADOOP_HOME=”开头的一行,去掉行首的“#”,后配置为

Hadoop 的安装路径

找到“# HIVE_CONF_DIR=”开头的一行,去掉行首的“#”,后配置为

Hive 按照文件下的 conf 路径(**/usr/local/hive-3.1.3 /conf/**)

在**/usr/local/hive-3.1.3/conf/**路径下新建 hive-site.xml 并编辑

vim hive-site.xml
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:derby:;databaseName=metastore_db;create=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>org.apache.derby.jdbc.EmbeddedDriver</value>
</property>
<property>
<name>hive.metastore.local</name>
<value>true</value>
</property>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>hdfs://hadoop:9000/hive/warehouse</value>
</property>
</configuration>

标红的地方改成自己的hostname

**(4) ****初始化 ****Derby **数据库

schematool -dbType derby -initSchema

测试hive安装是否成功:

  1. Hive Shell入门基础命令

  2. 创建database test_db

CREATE DATABASE test_db;

  1. 使用database testDB

USE test_db;

  1. 创建emp表
CREATE TABLE emp(empno INT,ename STRING,job STRING,mgr INT,hiredate STRING,sal INT,comm INT,deptno INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY',';
  1. 将emp.csv中的数据导入到emp表中

     emp.csv表如下(要提前上传到hdfs上)
    

7369SMITHCLERK79021980/12/17800207499ALLENSALESMAN76981981/2/201600300307521WARDSALESMAN76981981/2/221250500307566JONESMANAGER78391981/4/22975207654MARTINSALESMAN76981981/9/2812501400307698BLAKEMANAGER78391981/5/12850307782CLARKMANAGER78391981/6/92450107788SCOTTANALYST75661987/4/193000207839KINGPRESIDENT1981/11/175000107844TURNERSALESMAN76981981/9/815000307876ADAMSCLERK77881987/5/231100207900JAMESCLERK76981981/12/3950307902FORDANALYST75661981/12/33000207934MILLERCLERK77821982/1/23130010

LOAD DATA INPATH '/ussr/local/input/emp.csv' INTO TABLE emp;
  1. 常用查询语句的使用
  2. 查询工资大于2000的员工信息。
select * from emp where sal>2000;

  1. 以部门号(deptno)来分组对员工工资(sal)进行求和。
SELECT deptno, SUM(sal) AS total_salary FROM emp GROUP BY deptno;


本文转载自: https://blog.csdn.net/weixin_66547608/article/details/136214849
版权归原作者 张謹礧 所有, 如有侵权,请联系我们删除。

“如何在ubuntu上安装Hive 嵌入式”的评论:

还没有评论