CAP是指一致性、可用性、分区容忍性。 T
CAP是指在一个分布式系统中,不可能同时满足可用性、一致性、分区容忍性。 T
NoSQL数据库的BASE特性是指基本可用、持续性、软状态、最终一致性。 F
NoSQL数据库的BASE特性是指基本可用、软状态、最终一致性。 T
目前,NoSQL的含义是“Not only SQL”,而不是“No SQL”。 T
一个数据库事务具有ACID是指:原子性,一致性,持久性,隔离性。 T
Redis是列族数据库。 F
HBase是列族数据库。 T
MySQL采用的是CA原则,因此扩展性比较差。 T
BASE不同于ACID模型,BASE牺牲了高一致性,从而获得可用性和可靠性T
NoSQL数据库的三大理论基石不包括。 B
最终一致性 B、ACID C、BASE D、CAP
12、下列数据库属于文档数据库的是。 C
A.MySQL B.Redis C.MongoDB D.HBase
13、下列关于NoSQL数据库和关系型数据库的比较,不正确的是 A
A、NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性
B、NoSQL数据库具有弱一致性,关系型数据库具有强一致性
C、NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言
D、NoSQL数据库的可扩展性比传统的关系型数据库更好
14、HBase采用MapReduce分布式并行计算模型来作为底层数据存储。 T
15、HBase不支持表关联,无法使用Join连接。 T
16、当我们的主要需求是单表数据量并发高,数据分析需求较弱,或者不需要那么灵活或者实时。相比HBase,更推荐使用MySQL。 F
17、除了行键以外,HBase还支持外键等其他索引。F
18、在HBase中,每个数据值都是一个未经解释的字符串,没有数据类型。 T
19、HBase中,用户在表中存储数据,每一行都有一个可排序的行键和最多255列。 F
20、在HBase中,最基本的访问控制单元是列。 T
21、HBase的客户端依赖Master来获得Region位置信息后,直接从Region服务器上读取数据,因此Master的负载很小 。T
22、HBase系统为每个Region服务器配置了一个HLog文件,它是一种预写式日志(Write Ahead Log)。用户更新数据必须首先写入MemStore缓存后,再写入日志。T
23、用来负责管理和维护HBase表的分区信息的是。
A、Master B、Region C、Zookeeper D、Chubby
24、HBase中根据行键、列族和时间戳来唯一确定一个单元格。F
25、HBase中根据行键、列族、列限定符和时间戳来唯一确定一个单元格。T
26、除了大文件外,hdfs也可以直接高效的存储大量的小文件。F
27、HDFS中,单个Block的大小如果是128MB的话,哪怕文件实际大小是20MB,也会占用128MB的空间。T
28、HDFS的NameNode中,FsImage用于记录所有针对文件的创建、删除、重命名等操作。F
29、FsImage文件没有物理记录每个块存储在哪个数据节点。而是由名称节点把这些映射信息保留在内存中,当数据节点加入HDFS集群时,数据节点会把自己所包含的块列表告知给名称节点。T
30、除了减少名称节点的启动时间外,第二名称节点还可以起到热备份的作用。F
31、HDFS采用了多副本方式对数据进行冗余存储,通常一个数据块的多个副本会被分布到不同的数据节点上,这种多副本方式具备哪些优点:ABC
A加快数据传输速度
B.容易检查数据错误
C.保证数据可靠性
D.节省存储空间
32当block是128mb(默认值)的时候,如果上传3个1mb的文件到hdfs上,会占用3个block。T
一.单选题(共20题,80.0分)
1.(单选题,4.0分)大数据的特点不包括下面哪一项
A.多结构化数据
B.巨大的数据量
C.增长速度快D.价值密度高
我的答案:D
2.(单选题,4.0分)配置Hadoop集群时,JAVA_HOME包含在哪一个配置文件中
A. hadoop-env.sh
B. hadoop-site.xml
c. hadoop-default.xml
D. configuration.xsl
我的答案:A
3.(单选题,4.0分)LSM是什么意思
A.二叉树
B.长平衡二叉树C.日志结构合并树
D.平衡二叉树
我的答案:C
4.(单选题,4.0分)下述哪一个产品不属于列族数据库
A.BigTable
B.Cassandra
C. Redis
D. Hbase
我的答案:C
5.(单选题,4.0分)Hadoop中的ResourceManager的主要功能不包括?
A.日志管理
B.集群资源管理
C.集群资源调度
D.应用程序管理
我的答案:A
6.(单选题,4.0分)以下关于HBase说法错误的是
A.是分布式的
B.是开源的
C.是一种行数据库
D.是一种NoSQL数据库
我的答案:C
7.(单选题,4.0分)HBase的计算能力通过什么提供
A.Zookeeper
B.RPC
C.MapReduce
D.Chubby
我的答案:C
8.(单选题,4.0分)Hbase部署成Pseudo-Distributed Mode需要()个节点?
A.1
B.最少3个
C.2
D.3
我的答案:A
9.(单选题,4.0分)以下关于HDFS的说法错误的是
A.由NameNode,DataNode,Client组成
B.备NameNode上的元数据是主NameNode同步过去的
C.适合一次写入,多次读取的读写任务
D.采用就近的机架点进行数据的第一副本存储
我的答案:B
10.(单选题,4.0分)Zookeeper和以下哪个框架功能接近
A. Protobuf
B.Chubby
C.Spark
D. Kafka
我的答案:B
11.(单选题,4.0分)Hadoop的常用配置文件不包括
A. conf-site.xml
B.core-site.xml
C.hdfs-site.xml
D. hadoop-env.sh
我的答案:A
12.(单选题,4.0分)HDFS不适用以下哪种场景的数据存储和管理?
A.低延迟读取
B.大文件存储
C.高容错、高吞吐量
D.流式数据访问
我的答案:A
13.(单选题,4.0分)解压tar.gz结尾的HBase压缩包使用的Linux命令是
A. tar -s
B. tar -zxf
C.tar -zXV
D.tar -nx
我的答案:B
14.(单选题,4.0分)HDFS跟哪个框架的功能接近
A.EXT3
B.GFS
C.NTFS
D.FAT32
我的答案:B
15.(单选题,4.0分)业界普遍认为Google的三篇论文奠定了大数据的基础,这三篇论文不包括A. MapReduce
B.Big Table
c. Google FS
D.Chubby
我的答案:D
16.(单选题,4.0分)最容易成为集群瓶颈的是
A.磁盘IO
B.网络
C.中央处理器
D.内存
我的答案:A
- (单选题,4.0分)HBase的设计思想来源于Google的哪篇论文
A.Chubby
B.BigTable
C.The Google File System
D. MapReduce
我的答案:B
18.(单选题,4.0分)下面哪个不是Hadoop的运行模式
A.Pseudo-Distributed
B.Fully-Distributed
C.NameNode
D. Single Node
我的答案:C
19.(单选题,4.0分)下面关于HDFS的文件和文件块,哪个说法是正确的
A.复制的文件块默认都存在同─机架上
B.用户可以在文件任意位置进行修改
C.支持多用户对同一文件的写操作
D.默认将文件块复制成三份存放
我的答案:D
20
上述图片中的框架
是()
A.Zookeeper
B.HBase
C.YARN
D.HDFS
我的答案:C
1.(判断题,4.0分)Hbase中,可以通过行键、列限定符和时间戳来唯一确定一个值
A.对
B.错
我的答案:错
⒉(判断题4.0分)Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中
A.对
B.错
我的答案:对
3.(判断题4.0分)MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销
A.对
B.错
我的答案:对
4.(判断题,4.0分)Hadoop框架是用Java实现的,所以MapReduce应用程序也必须用Java来写
A.对
B.错
我的答案:错
5.(判断题,4.0分)Saas就是将基础设施(计算资源和存储)作为服务出租
A.对
B.错
我的答案:错
版权归原作者 qq_57852196 所有, 如有侵权,请联系我们删除。