0


HIVE选择题总结

1.Hive 的元数据存储在 derby 和 MySQL 中有什么区别( B )
What is the difference between Storing Hive metadata in Derby and MySQL
A. 没区别
B. 多会话 (More session)
C. 支持网络环境
D. 数据库的区别
2.Hive有四个驱动器,下面那个不是( C)
Hive has four drives, not the one below
A. 解释器
B. 编译器
C. 策略器(Strategy implement)
D. 优化器
3.Hive执行外部的脚本参数是( B )
The external script parameter for Hive execution is
A. hive –e
B. hive –f
C. hive –sql
D. hive –s
4.Hive是基于( A )
A. Mapreduce
B. html5
C. web
D. Ajax
5.Hive中分组的关键字是什么( A )
What are the group keywords in Hive
A. group by
B. order by
C. distribute by
D. sort by
6.Hive有什么好处(B )
A. 可以使用sql,操作存储在hdfs中的数据
B. 可以通过语句自动编译mapreduce(Mapreduce can be automatically compiled using statements)
C. 可以直接在表中插入数据
D. 可以存储数据
7.HIVE与传统SQL数据库对比,下面描述不正确的是( C )
A. 对于查询语言:HIVE使用HQL,传统SQL数据库使用SQL
B. 对于数据存储:HIVE使用HDFS存储,传统SQL数据库使用本地磁盘
C. 最终执行者:HIVE使用MapReduce和Excutor执行,传统SQL数据库使用Excutor执行器
D. 执行延迟:HIVE属于高,传统SQL数据库属于低
8.下面中不属于HIVE中的元数据信息(C )
A. 表的名字
B. 表的列和分区及其属性
C. 表的属性(只存储内部表信息)
D. 表的数据所在目录
9.Hive数据类型那个不是基本类型( A )
A. Varchar
B. Int
C. FLOAT
D. DOUBLE

10.外连接进行JOIN默认在( B)
A、 Map端
B、 Reduce端
C、 external端
D、 Shuffle端

11.下面关于Hive查看表table1的分区的描述正确的是(A )
A show partitions table1;
B desc table1;
C show create table table1;
D drop table1

12.已知数组 trans_cnt[1, 2, 3, 4],trans_cnt[2] 获取的结果为(C )
A 1
B 2
C 3
D 4

13.Hive是为了解决哪类问题(A )
A 海量结构化日志的数据统计
B 分布式组件调度
C 分布式系统监控
D 分布式系统高可用

14.下面关于Hive SQL的内外表使用正确的是(A)
A 在/tmp/path创建外表:CREATE EXTERNAL TABLE … LOCATION ‘/tmp/path’;
B 在/tmp/path创建外表:CREATE TABLE … ;
C 创建内表:CREATE EXTERNAL TABLE … LOCATION ‘/tmp/path’;
D 创建内表:CREATE EXTERNAL TABLE … ;

15.以下表达式书写错误的是(B )

A year(‘2015-12-31 12:21’)
B month(2015-10-31)
C day(‘2015-12-11’)
D date_sub(‘2015-12-01’,3)

16.以下哪种不是 Hive 支持的数据类型(D)
(Hive 不支持 Long 类型,支持 TINYINT SMALLINT INT BIGINT)
A Struct
B Int
C Map
D Long

17.已知数组 trans_cnt[1, 2, 3, 4],以下哪一个表达式是求数组的元素数量(D)
length()获取字符串长度
size()获取泛型集合元素个数
A type(trans_cnt)
B length(trans_cnt)
C coalesce(trans_cnt)
D size(trans_cnt)

18.在hive中下列哪个命令不可以实现去重( D)

A distinct
B group by
C row_number
D having

19.代码select substr(‘abcdef’,2,3)的结果是哪一个( B )
从下标2开始,取3个
字符串下标从1开始
A bc
B bcd
C cde
D 其他结果都不对

20.下面关于Hive内外表描述错误的是(C )
A Hive内表的元数据和数据都由Hive自己管理
B Hive会管理外表的元数据
C 当Hive内表的元数据发生变化时,内表的改动修改不会同步给元数据
D 对外部表的表结构和分区进行修改,需要修复

21.下面关于Hive格式描述正确的是(D )
A.TEXTFILE存储方式为列存储
B.TEXTFILE格式的数据磁盘开销不大
C.使用TEXTFILE时Hive会对数据进行切分
D.TEXTFILE格式是Hive的默认存储格式

22.下面关于Hive SQL编译顺序正确的是( C)
(1)遍历QueryBlock,翻译为执行操作树OperatorTree
(2)遍历OperatorTree,翻译为MapReduce任务
(3)遍历AST Tree,抽象出查询的基本组成单元QueryBlock
(4)逻辑层优化器进行OperatorTree变换,合并不必要的ReduceSinkOperator,减少shuffle数据量
(5)物理层优化器进行MapReduce任务的变换,生成执行计划
(6)将SQL转化为抽象语法树AST Tree
A.(3)(1)(2)(4)(5)(6)
B.(5)(3)(1)(2)(4)(5)
C.(6)(3)(1)(2)(4)(5)
D.(5)(3)(1)(2)(4)(6)

23.下面关于Hive SQL的JOIN关键词正确的是( A)
(1)INNERN JOIN
(2)JOIN
(3)OUTER JOIN
(4)RIGHT JOIN
(5)CROSS JoIN
(6)LEFT JOIN

A.(2)(4)(5)(6)
B.(1)(4)(5)(6)
C.(1)(4)(6)
D.(3)(4)(6)

24.下面关于Hive描述错误的是( C )
A.TEXTFILE格式的文件就算结合了gzip压缩格式,也无法对数据进行并行操作
B.sequenceFile是Hadoop API提供的一种二进制文件支持
C.RCFile是一种行存储的格式
D.ORC文件是基于RCEile格式的一种优化

25.下面关于Hive SQL编译描述正确的是(B )
A.Hive SQL的Parser层是为了将sql转化为执行计划的
B.逻辑层优化器会进行算子转换,优化合并不必要的算子操作
C.MapReduce任务是需要遍历oueryBlock后生成的
D.编译器遍历AST Tree,抽象出查询的基本组成单元operator Tree

26.下列哪个组件不属于Hive架构(B )
A.MySQL
B.TaskManager
C.HDFS
D.Client

27.下面关于Hive sQL中INSERT INTO和INSERT OVERWRITE的区别说法正确的是(B)
A.INSERT INTO会覆盖已经存在的数据
B.INSERT OVERWRITE会先现将原始表的数据remove,再插入新数据
C.INSERT OVERWRITE不考虑原始表的数据,直接追加到表中
D.INSERT INTO重复的数据会报错

28.Hive是由哪家公司开源的(B )
A.Google
B.Facebook
C.LinkedIn
D.Netflix

29.下面关于Hive描述正确的是(B )
A.count函数必须开窗口才能使用
B.max函数是窗口函数
C.lead函数是聚合函数,不是窗口函数
D.min函数是聚合函数,不是窗口函数

30.下面关于Hive内外表描述正确的是(D )
A.建表时候如果不显示声明表的类型,则建表为外表
B.外表使用DROP语句可以删除的很干净
C.外表由Hive自己管理
D.建表时候如果不显示声明表的类型,则建表为内表

标签: hive big data hadoop

本文转载自: https://blog.csdn.net/m0_51376832/article/details/125284478
版权归原作者 江江_ 所有, 如有侵权,请联系我们删除。

“HIVE选择题总结”的评论:

还没有评论