hadoop模拟试题

答案，正式使用前请祛除答案以及选项的红色颜色！

1：D

2：C

3：A

4：C

5：B

6：C

7：D

8：B

9：B

10：C

11：A

12：B

13：A

14：C

15：B

16：D

17：A

18：C

19：B

20：A

21：B

22：B

23：A

24：D

25：C

26：C

27：A

28：A

29：D

30：D

31：C

32：D

33：C

34：A

35：A

36：B

37：C

38：AB

39：D

40：D

41：B

42：B

43：A

44：A

45：C

46：B

47：B

48：A

49：A

50：ABC

hadoop-模拟题

50题_共100.00分_及格70.00分

* 第1题【单选题】【2.00分】【概念理解】*

关于Hadoop单机模式和伪分布式模式的说法，正确的是

两者都起守护进程，且守护进程运行在一台机器上
单机模式不使用HDFS，但加载守护进程
两者都不与守护进程交互，避免复杂性
后者比前者增加了HDFS输入输出以及可检查内存使用情况

* 第2题【单选题】【2.00分】【概念理解】*

下面哪个程序负责 HDFS 数据存储。

NameNode
Jobtracker
Datanode
secondaryNameNode

* 第3题【单选题】【2.00分】【概念理解】*

HDFS 在 hadoop2 默认 Block Size 是

128M
64M
4K
128K

* 第4题【单选题】【2.00分】【概念理解】*

Hadoop 的作者

Martin Fowler
Kent Beck
Doug Cutting
James Gosling

* 第5题【单选题】【2.00分】【概念理解】*

namenode主节点的端口是

8080
50070
50090
8020

* 第6题【单选题】【2.00分】【概念理解】*

负责整个集群资源的管理与调度的进程名称是

NameNode
DataNode
ResourceManager
NodeManager

* 第7题【单选题】【2.00分】【概念理解】*

YARN 上的MapReduce 实体不包括

NodeManager
client
ResourceManager
JobTracker

* 第8题【单选题】【2.00分】【概念理解】*

下列哪个属性是core-site.xml 中的配置

dfs.replication
fs.defaultFS
mapreduce.framework.name
yarn.resourcemanager.address

* 第9题【单选题】【2.00分】【概念理解】*

配置Hadoop 时，JAVA_HOME 包含在哪一个配置文件中

hadoop-default.xml
hadoop-eco.sh
hadoop-site.xml
configuration.xsl

* 第10题【单选题】【2.00分】【概念理解】*

关于SecondaryNameNode 哪项（）是正确的

它是NameNode 的热备
它是内存没有要求
他的目的是帮助NameNode 合并编辑日志，减少NameNode 启动时间
SecondaryNameNode 应与NameNode 部署到一个节点

* 第11题【单选题】【2.00分】【概念理解】*

MapReduce 框架提供了一种序列化机制，支持这种序列化的类能够在Map和Reduce 过程中充当键或值，以下说法错误的是

实现Writable 接口的类是值
实现WritableComparable<T>接口的类可以是值或键
Hadoop 的基本类型Text 并不实现WritableComparable<T>接口
键和值的数据类型可以超出Hadoop 自身支持的基本类型

* 第12题【单选题】【2.00分】【概念理解】*

HDFS默认的当前工作目录是/user/$USER，fs.default.name的值需要在哪个配置文件内说明

mapred-site.xml
core-site.xml
hdfs-site.xml
以上均不是

* 第13题【单选题】【2.00分】【概念理解】*

Client在HDFS上进行文件写入时，namenode根据文件大小和配置情况，返回部分datanode信息，谁负责将文件划分为多个Block，根据DataNode的地址信息，按顺序写入到每一个DataNode块

Client
Namenode
Datanode
Secondary namenode

* 第14题【单选题】【2.00分】【概念理解】*

关于HDFS的文件写入，正确的是

支持多用户对同一文件的写操作
用户可以在文件任意位置进行修改
默认将文件块复制成三份存放
复制的文件块默认都存在同一机架上

* 第15题【单选题】【2.00分】【概念理解】*

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是

FSDataInputStream扩展了DataInputStream以支持随机读
为实现细粒度并行，输入分片(Input Split)应该越小越好
一台机器可能被指派从输入文件的任意位置开始处理一个分片
输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割

* 第16题【单选题】【2.00分】【概念理解】*

HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是

.一次写入，少次读
多次写入，少次读
多次写入，多次读
一次写入，多次读

* 第17题【单选题】【2.00分】【概念理解】*

下列哪个程序通常不与 NameNode 在一个节点启动？

SecondaryNameNode
DataNode
resourcemanager
nodemanager

* 第18题【单选题】【2.00分】【概念理解】*

关于 checkpoint,说法正确的是

checkpoint可通过元数据文件的大小进行控制
secondarynamenode会将合并好的元数据移动到namenode
SecondaryNameNode会将edits文件和fsimage复制到本地（HTTP GET方式）
合并元数据需要大量的磁盘进行文件的合并操作

* 第19题【单选题】【2.00分】【概念理解】*

大数据的4V特征是指?

数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、技术发展速度快(Velocity)
数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)
数据量大(Volume)、类型繁多(Variety)、价值密度高(Value)、数据产生速度快(Velocity)
数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、数据变化速度快(Velocity)

* 第20题【单选题】【2.00分】【概念理解】*

HDfS 中的 block 默认保存几份

3
2
1
不确定

* 第21题【单选题】【2.00分】【概念理解】*

关于 hdfs 元数据，NameNode 维护整个文件系统元数据

DataNode
NameNode
resourcemanager
nodemanager

* 第22题【单选题】【2.00分】【概念理解】*

YARNWebUI 默认端口是

50070
8088
19888
8020

* 第23题【单选题】【2.00分】【概念理解】*

HDFS 主节点进程名称是

NameNode
DataNode
ResourceManager
NodeManager

* 第24题【单选题】【2.00分】【概念理解】*

负责单个节点的资源管理与任务启动的进程名称是

NameNode
DataNode
ResourceManager
NodeManager

* 第25题【单选题】【2.00分】【概念理解】*

把本地文件放到集群里,可以使用下面哪个hadoop shell的命令?

hadoop fs -put
hadoop fs –push /
hadoop fs –put /
hadoop -push /

* 第26题【单选题】【2.00分】【概念理解】*

在集群上创建目录,可以使用下面哪个hadoop shell的命令?

hadoop fs -get
hadoop fs –put /
hadoop fs -mkdir
hadoop -push /

* 第27题【单选题】【2.00分】【概念理解】*

下列哪个属性是hdfs-site.xml 中的配置

dfs.replication
fs.defaultFS
mapreduce.framework.name
yarn.resourcemanager.address

* 第28题【单选题】【2.00分】【概念理解】*

关于HDFS集群中的DataNode的描述不正确的是

一个DataNode上存储的所有数据块可以有相同的
存储客户端上传的数据的数据块
DataNode之间可以互相通信
响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑

* 第29题【单选题】【2.00分】【概念理解】*

如果我们现有一个安装CDH的hadoop集群，在不修改默认配置的情况下存储200 个每个200M 的文本文件，请问最终会在集群中产生多少个数据块（包括副本

200
40000
400
1200

* 第30题【单选题】【2.00分】【概念理解】*

Hadoop起始于以下哪个阶段？

2004年，Nutch的开发者开发了NDFS。
2004年，Google发表了关于MapReduce的论文。
2003年，Google发布了GFS论文。
2002年，Apach项目的Nutch。

* 第31题【单选题】【2.00分】【概念理解】*

启动yarn集群的命令是

start-hdfs.sh
start-dfs.sh
start-yarn.sh
zkCli.sh

* 第32题【单选题】【2.00分】【概念理解】*

在map 和reduce 函数的输入和输出类型中

map 的输入和输出
reduce 的输入和输出
map 的输入和reduce 的输出
map 的输出和reduce 的输入

* 第33题【单选题】【2.00分】【概念理解】*

MapReduce 编程模型中以下组件哪个是最后执行的

Mapper
Partitioner
Reducer
RecordReader

* 第34题【单选题】【2.00分】【概念理解】*

与HDFS 类似的框架是

GFS
Spark
Flink
Hive

* 第35题【单选题】【2.00分】【概念理解】*

手动启动对应机器resourcemanager的命令是

yarn-daemon.sh start resourcemanager
start-dfs.sh
hdfs zkfc -formatZK

* 第36题【单选题】【2.00分】【概念理解】*

DbOutputFormat类的主要作用是

将数据库表中的数据进行读取
将MapReduce产生的结果集导入到数据表中

* 第37题【单选题】【2.00分】【概念理解】*

HDFS的NameNode负责管理文件系统的命名空间，将所有的文件和文件夹的元数据保存在一个文件系统树中，这些信息也会在硬盘上保存成以下文件

日志
命名空间镜像
两者都是

* 第38题【多选题】【2.00分】【概念理解】*

关于zookeeper的说法，正确的是

以Fast Paxos算法为基础
通过选举产生一个leader
用于分布式文件存储
用于分布式运算

* 第39题【单选题】【2.00分】【概念理解】*

HDFS无法高效存储大量小文件，想让它能处理好小文件，比较可行的改进策略不包括

利用SequenceFile、MapFile、Har等方式归档小文件
多Master设计
Block大小适当调小
调大namenode内存或文件系统元数据存到硬盘里

* 第40题【单选题】【2.00分】【概念理解】*

Namenode在启动时自动进入安全模式，在安全模式阶段，说法错误的是

安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
根据策略对数据块进行必要的复制或删除
当数据块最小百分比数满足的最小副本数条件时，会自动退出安全模式
文件系统允许有修改

* 第41题【单选题】【2.00分】【概念理解】*

关于 HDFS 写数据流程，下面说法错误的是

写数据首先需要找NN确定写的位置
如果pipeline一个节点写失败则重新申请DN节点再写
写数据是以packet为大小进行的，默认64K
pipeline反方向会进行数据的ack检验

* 第42题【单选题】【2.00分】【概念理解】*

因为 HDFS 有多个副本，所以 NameNode 是不存在单点问题的，这种说法正确吗

正确
错误

* 第43题【单选题】【2.00分】【概念理解】*

Hadoop配置文件中，hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中，hadoop-site.xml被分离成三个XML文件，不包括

conf-site.xml
mapred-site.xml
core-site.xml
hdfs-site.xml

* 第44题【单选题】【2.00分】【概念理解】*

把集群中的文件复制到本地,可以使用下面哪个hadoop shell的命令?

hadoop fs -get
hadoop fs –push /
hadoop fs –put /
hadoop -push /

* 第45题【单选题】【2.00分】【概念理解】*

如果想要修改集群的备份数量,可以修改下面哪个配置文件?

mapred-site.xml
core-site.xml
hdfs-site.xml
hadoop-env.sh

* 第46题【单选题】【2.00分】【概念理解】*

MapReduce的Shuffle过程以下中哪个操作是最后做的

排序
合并
分区
溢写

* 第47题【单选题】【2.00分】【概念理解】*

出现在datanode的VERSION文件格式中但不出现在nomenode的VERSION文件格式中的是

namenodeID
storageID
storageType
layoutVersion

* 第48题【单选题】【2.00分】【概念理解】*

查看linux机器上当前运行的所有java进程的命令是

jps
ipconfig
systemctl

* 第49题【单选题】【2.00分】【概念理解】*

DBInputFormat类的主要作用是

将数据库表中的数据进行读取
将MapReduce产生的结果集导入到数据表中

* 第50题【多选题】【2.00分】【概念理解】*

一个简单的MapReduce程序包括哪几个类

Mapper类
Reducer类
Driver类

标签： hadoop hdfs 大数据

本文转载自: https://blog.csdn.net/qq_72027307/article/details/131227589
版权归原作者 库三岁 所有，如有侵权，请联系我们删除。

hadoop-模拟题

*** 第1题 【单选题】【2.00分】【概念理解】***

*** 第2题 【单选题】【2.00分】【概念理解】***

*** 第3题 【单选题】【2.00分】【概念理解】***

*** 第4题 【单选题】【2.00分】【概念理解】***

*** 第5题 【单选题】【2.00分】【概念理解】***

*** 第6题 【单选题】【2.00分】【概念理解】***

*** 第7题 【单选题】【2.00分】【概念理解】***

*** 第8题 【单选题】【2.00分】【概念理解】***

*** 第9题 【单选题】【2.00分】【概念理解】***

*** 第10题 【单选题】【2.00分】【概念理解】***

*** 第11题 【单选题】【2.00分】【概念理解】***

*** 第12题 【单选题】【2.00分】【概念理解】***

*** 第13题 【单选题】【2.00分】【概念理解】***

*** 第14题 【单选题】【2.00分】【概念理解】***

*** 第15题 【单选题】【2.00分】【概念理解】***

*** 第16题 【单选题】【2.00分】【概念理解】***

*** 第17题 【单选题】【2.00分】【概念理解】***

*** 第18题 【单选题】【2.00分】【概念理解】***

*** 第19题 【单选题】【2.00分】【概念理解】***

*** 第20题 【单选题】【2.00分】【概念理解】***

*** 第21题 【单选题】【2.00分】【概念理解】***

*** 第22题 【单选题】【2.00分】【概念理解】***

*** 第23题 【单选题】【2.00分】【概念理解】***

*** 第24题 【单选题】【2.00分】【概念理解】***

*** 第25题 【单选题】【2.00分】【概念理解】***

*** 第26题 【单选题】【2.00分】【概念理解】***

*** 第27题 【单选题】【2.00分】【概念理解】***

*** 第28题 【单选题】【2.00分】【概念理解】***

*** 第29题 【单选题】【2.00分】【概念理解】***

*** 第30题 【单选题】【2.00分】【概念理解】***

*** 第31题 【单选题】【2.00分】【概念理解】***

*** 第32题 【单选题】【2.00分】【概念理解】***

*** 第33题 【单选题】【2.00分】【概念理解】***

*** 第34题 【单选题】【2.00分】【概念理解】***

*** 第35题 【单选题】【2.00分】【概念理解】***

*** 第36题 【单选题】【2.00分】【概念理解】***

*** 第37题 【单选题】【2.00分】【概念理解】***

*** 第38题 【多选题】【2.00分】【概念理解】***

*** 第39题 【单选题】【2.00分】【概念理解】***

*** 第40题 【单选题】【2.00分】【概念理解】***

*** 第41题 【单选题】【2.00分】【概念理解】***

*** 第42题 【单选题】【2.00分】【概念理解】***

*** 第43题 【单选题】【2.00分】【概念理解】***

*** 第44题 【单选题】【2.00分】【概念理解】***

*** 第45题 【单选题】【2.00分】【概念理解】***

*** 第46题 【单选题】【2.00分】【概念理解】***

*** 第47题 【单选题】【2.00分】【概念理解】***

*** 第48题 【单选题】【2.00分】【概念理解】***

*** 第49题 【单选题】【2.00分】【概念理解】***

*** 第50题 【多选题】【2.00分】【概念理解】***

发表评论