杭电信工--大数据期末考试试题

CAP是指一致性、可用性、分区容忍性。 T
CAP是指在一个分布式系统中，不可能同时满足可用性、一致性、分区容忍性。 T
NoSQL数据库的BASE特性是指基本可用、持续性、软状态、最终一致性。 F
NoSQL数据库的BASE特性是指基本可用、软状态、最终一致性。 T
目前，NoSQL的含义是“Not only SQL”，而不是“No SQL”。 T
一个数据库事务具有ACID是指：原子性，一致性，持久性，隔离性。 T
Redis是列族数据库。 F
HBase是列族数据库。 T
MySQL采用的是CA原则，因此扩展性比较差。 T
BASE不同于ACID模型，BASE牺牲了高一致性，从而获得可用性和可靠性T
NoSQL数据库的三大理论基石不包括。 B
最终一致性 B、ACID C、BASE D、CAP

12、下列数据库属于文档数据库的是。 C

A.MySQL B.Redis C.MongoDB D.HBase

13、下列关于NoSQL数据库和关系型数据库的比较，不正确的是 A

A、NoSQL数据库很容易实现数据完整性，关系型数据库很难实现数据完整性

B、NoSQL数据库具有弱一致性，关系型数据库具有强一致性

C、NoSQL数据库缺乏统一的查询语言，而关系型数据库有标准化查询语言

D、NoSQL数据库的可扩展性比传统的关系型数据库更好

14、HBase采用MapReduce分布式并行计算模型来作为底层数据存储。 T

15、HBase不支持表关联，无法使用Join连接。 T

16、当我们的主要需求是单表数据量并发高，数据分析需求较弱，或者不需要那么灵活或者实时。相比HBase，更推荐使用MySQL。 F

17、除了行键以外，HBase还支持外键等其他索引。F

18、在HBase中，每个数据值都是一个未经解释的字符串，没有数据类型。 T

19、HBase中，用户在表中存储数据，每一行都有一个可排序的行键和最多255列。 F

20、在HBase中，最基本的访问控制单元是列。 T

21、HBase的客户端依赖Master来获得Region位置信息后，直接从Region服务器上读取数据，因此Master的负载很小。T

22、HBase系统为每个Region服务器配置了一个HLog文件，它是一种预写式日志（Write Ahead Log）。用户更新数据必须首先写入MemStore缓存后，再写入日志。T

23、用来负责管理和维护HBase表的分区信息的是。

A、Master B、Region C、Zookeeper D、Chubby

24、HBase中根据行键、列族和时间戳来唯一确定一个单元格。F

25、HBase中根据行键、列族、列限定符和时间戳来唯一确定一个单元格。T

26、除了大文件外，hdfs也可以直接高效的存储大量的小文件。F

27、HDFS中，单个Block的大小如果是128MB的话，哪怕文件实际大小是20MB，也会占用128MB的空间。T

28、HDFS的NameNode中，FsImage用于记录所有针对文件的创建、删除、重命名等操作。F

29、FsImage文件没有物理记录每个块存储在哪个数据节点。而是由名称节点把这些映射信息保留在内存中，当数据节点加入HDFS集群时，数据节点会把自己所包含的块列表告知给名称节点。T

30、除了减少名称节点的启动时间外，第二名称节点还可以起到热备份的作用。F

31、HDFS采用了多副本方式对数据进行冗余存储，通常一个数据块的多个副本会被分布到不同的数据节点上，这种多副本方式具备哪些优点：ABC

A加快数据传输速度

B.容易检查数据错误

C.保证数据可靠性

D.节省存储空间

32当block是128mb（默认值）的时候，如果上传3个1mb的文件到hdfs上，会占用3个block。T

一.单选题(共20题，80.0分)

1.(单选题,4.0分)大数据的特点不包括下面哪一项

A.多结构化数据

B.巨大的数据量

C.增长速度快D.价值密度高

我的答案:D

2.(单选题,4.0分)配置Hadoop集群时，JAVA_HOME包含在哪一个配置文件中

A. hadoop-env.sh

B. hadoop-site.xml

c. hadoop-default.xml

D. configuration.xsl

我的答案:A

3.(单选题,4.0分)LSM是什么意思

A.二叉树

B.长平衡二叉树C.日志结构合并树

D.平衡二叉树

我的答案:C

4.(单选题,4.0分)下述哪一个产品不属于列族数据库

A.BigTable

B.Cassandra

C. Redis

D. Hbase

我的答案:C

5.(单选题,4.0分)Hadoop中的ResourceManager的主要功能不包括?

A.日志管理

B.集群资源管理

C.集群资源调度

D.应用程序管理

我的答案:A

6.(单选题,4.0分)以下关于HBase说法错误的是

A.是分布式的

B.是开源的

C.是一种行数据库

D.是一种NoSQL数据库

我的答案:C

7.(单选题,4.0分)HBase的计算能力通过什么提供

A.Zookeeper

B.RPC

C.MapReduce

D.Chubby

我的答案:C

8.(单选题,4.0分)Hbase部署成Pseudo-Distributed Mode需要()个节点?

A.1

B.最少3个

C.2

D.3

我的答案:A

9.(单选题,4.0分)以下关于HDFS的说法错误的是

A.由NameNode，DataNode，Client组成

B.备NameNode上的元数据是主NameNode同步过去的

C.适合一次写入，多次读取的读写任务

D.采用就近的机架点进行数据的第一副本存储

我的答案:B

10.(单选题,4.0分)Zookeeper和以下哪个框架功能接近

A. Protobuf

B.Chubby

C.Spark

D. Kafka

我的答案:B

11.(单选题,4.0分)Hadoop的常用配置文件不包括

A. conf-site.xml

B.core-site.xml

C.hdfs-site.xml

D. hadoop-env.sh

我的答案:A

12.(单选题,4.0分)HDFS不适用以下哪种场景的数据存储和管理?

A.低延迟读取

B.大文件存储

C.高容错、高吞吐量

D.流式数据访问

我的答案:A

13.(单选题,4.0分)解压tar.gz结尾的HBase压缩包使用的Linux命令是

A. tar -s

B. tar -zxf

C.tar -zXV

D.tar -nx

我的答案:B

14.(单选题,4.0分)HDFS跟哪个框架的功能接近

A.EXT3

B.GFS

C.NTFS

D.FAT32

我的答案:B

15.(单选题,4.0分)业界普遍认为Google的三篇论文奠定了大数据的基础，这三篇论文不包括A. MapReduce

B.Big Table

c. Google FS

D.Chubby

我的答案:D

16.(单选题,4.0分)最容易成为集群瓶颈的是

A.磁盘IO

B.网络

C.中央处理器

D.内存

我的答案:A

(单选题,4.0分)HBase的设计思想来源于Google的哪篇论文

A.Chubby

B.BigTable

C.The Google File System

D. MapReduce

我的答案:B

18.(单选题,4.0分)下面哪个不是Hadoop的运行模式

A.Pseudo-Distributed

B.Fully-Distributed

C.NameNode

D. Single Node

我的答案:C

19.(单选题,4.0分)下面关于HDFS的文件和文件块，哪个说法是正确的

A.复制的文件块默认都存在同─机架上

B.用户可以在文件任意位置进行修改

C.支持多用户对同一文件的写操作

D.默认将文件块复制成三份存放

我的答案:D

上述图片中的框架

是（)

A.Zookeeper

B.HBase

C.YARN

D.HDFS

我的答案:C

1.(判断题,4.0分)Hbase中，可以通过行键、列限定符和时间戳来唯一确定一个值

A.对

B.错

我的答案:错

⒉(判断题4.0分)Hadoop是基于Java语言开发的，具有很好的跨平台特性，并且可以部署在廉价的计算机集群中

A.对

B.错

我的答案:对

3.(判断题4.0分)MapReduce设计的一个理念就是“计算向数据靠拢”，而不是“数据向计算靠拢”，因为，移动数据需要大量的网络传输开销

A.对

B.错

我的答案:对

4.(判断题,4.0分)Hadoop框架是用Java实现的，所以MapReduce应用程序也必须用Java来写

A.对

B.错

我的答案:错

5.(判断题,4.0分)Saas就是将基础设施(计算资源和存储)作为服务出租

A.对

B.错

我的答案:错

标签： hbase 大数据

本文转载自: https://blog.csdn.net/qq_57852196/article/details/128319341
版权归原作者 qq_57852196 所有，如有侵权，请联系我们删除。

杭电信工--大数据期末考试试题

发表评论

“杭电信工--大数据期末考试试题”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航