答案,正式使用前请祛除答案以及选项的红色颜色!
1:D
2:C
3:A
4:C
5:B
6:C
7:D
8:B
9:B
10:C
11:A
12:B
13:A
14:C
15:B
16:D
17:A
18:C
19:B
20:A
21:B
22:B
23:A
24:D
25:C
26:C
27:A
28:A
29:D
30:D
31:C
32:D
33:C
34:A
35:A
36:B
37:C
38:AB
39:D
40:D
41:B
42:B
43:A
44:A
45:C
46:B
47:B
48:A
49:A
50:ABC
hadoop-模拟题
50题_共100.00分_及格70.00分
*** 第1题 【单选题】【2.00分】【概念理解】***
关于Hadoop单机模式和伪分布式模式的说法,正确的是
- 两者都起守护进程,且守护进程运行在一台机器上
- 单机模式不使用HDFS,但加载守护进程
- 两者都不与守护进程交互,避免复杂性
- 后者比前者增加了HDFS输入输出以及可检查内存使用情况
*** 第2题 【单选题】【2.00分】【概念理解】***
下面哪个程序负责 HDFS 数据存储。
- NameNode
- Jobtracker
- Datanode
- secondaryNameNode
*** 第3题 【单选题】【2.00分】【概念理解】***
HDFS 在 hadoop2 默 认 Block Size 是
- 128M
- 64M
- 4K
- 128K
*** 第4题 【单选题】【2.00分】【概念理解】***
Hadoop 的作者
- Martin Fowler
- Kent Beck
- Doug Cutting
- James Gosling
*** 第5题 【单选题】【2.00分】【概念理解】***
namenode主节点的端口是
- 8080
- 50070
- 50090
- 8020
*** 第6题 【单选题】【2.00分】【概念理解】***
负责整个集群资源的管理与调度的进程名称是
- NameNode
- DataNode
- ResourceManager
- NodeManager
*** 第7题 【单选题】【2.00分】【概念理解】***
YARN 上的MapReduce 实体不包括
- NodeManager
- client
- ResourceManager
- JobTracker
*** 第8题 【单选题】【2.00分】【概念理解】***
下列哪个属性是core-site.xml 中的配置
- dfs.replication
- fs.defaultFS
- mapreduce.framework.name
- yarn.resourcemanager.address
*** 第9题 【单选题】【2.00分】【概念理解】***
配置Hadoop 时,JAVA_HOME 包含在哪一个配置文件中
- hadoop-default.xml
- hadoop-eco.sh
- hadoop-site.xml
- configuration.xsl
*** 第10题 【单选题】【2.00分】【概念理解】***
关于SecondaryNameNode 哪项()是正确的
- 它是NameNode 的热备
- 它是内存没有要求
- 他的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间
- SecondaryNameNode 应与NameNode 部署到一个节点
*** 第11题 【单选题】【2.00分】【概念理解】***
MapReduce 框架提供了一种序列化机制,支持这种序列化的类能够在Map和Reduce 过程中充当键或值,以下说法错误的是
- 实现Writable 接口的类是值
- 实现WritableComparable<T>接口的类可以是值或键
- Hadoop 的基本类型Text 并不实现WritableComparable<T>接口
- 键和值的数据类型可以超出Hadoop 自身支持的基本类型
*** 第12题 【单选题】【2.00分】【概念理解】***
HDFS默认的当前工作目录是/user/$USER,fs.default.name的值需要在哪个配置文件内说明
- mapred-site.xml
- core-site.xml
- hdfs-site.xml
- 以上均不是
*** 第13题 【单选题】【2.00分】【概念理解】***
Client在HDFS上进行文件写入时,namenode根据文件大小和配置情况,返回部分datanode信息,谁负责将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块
- Client
- Namenode
- Datanode
- Secondary namenode
*** 第14题 【单选题】【2.00分】【概念理解】***
关于HDFS的文件写入,正确的是
- 支持多用户对同一文件的写操作
- 用户可以在文件任意位置进行修改
- 默认将文件块复制成三份存放
- 复制的文件块默认都存在同一机架上
*** 第15题 【单选题】【2.00分】【概念理解】***
下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是
- FSDataInputStream扩展了DataInputStream以支持随机读
- 为实现细粒度并行,输入分片(Input Split)应该越小越好
- 一台机器可能被指派从输入文件的任意位置开始处理一个分片
- 输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
*** 第16题 【单选题】【2.00分】【概念理解】***
HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是
- .一次写入,少次读
- 多次写入,少次读
- 多次写入,多次读
- 一次写入,多次读
*** 第17题 【单选题】【2.00分】【概念理解】***
下列哪个程序通常不与 NameNode 在一个节点启动?
- SecondaryNameNode
- DataNode
- resourcemanager
- nodemanager
*** 第18题 【单选题】【2.00分】【概念理解】***
关于 checkpoint,说法正确的是
- checkpoint可通过元数据文件的大小进行控制
- secondarynamenode会将合并好的元数据移动到namenode
- SecondaryNameNode会将edits文件和fsimage复制到本地(HTTP GET方式)
- 合并元数据需要大量的磁盘进行文件的合并操作
*** 第19题 【单选题】【2.00分】【概念理解】***
大数据的4V特征是指?
- 数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、技术发展速度快(Velocity)
- 数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)
- 数据量大(Volume)、类型繁多(Variety)、价值密度高(Value)、数据产生速度快(Velocity)
- 数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、数据变化速度快(Velocity)
*** 第20题 【单选题】【2.00分】【概念理解】***
HDfS 中的 block 默认保存几份
- 3
- 2
- 1
- 不确定
*** 第21题 【单选题】【2.00分】【概念理解】***
关于 hdfs 元数据,NameNode 维护整个文件系统元数据
- DataNode
- NameNode
- resourcemanager
- nodemanager
*** 第22题 【单选题】【2.00分】【概念理解】***
YARNWebUI 默认端口是
- 50070
- 8088
- 19888
- 8020
*** 第23题 【单选题】【2.00分】【概念理解】***
HDFS 主节点进程名称是
- NameNode
- DataNode
- ResourceManager
- NodeManager
*** 第24题 【单选题】【2.00分】【概念理解】***
负责单个节点的资源管理与任务启动的进程名称是
- NameNode
- DataNode
- ResourceManager
- NodeManager
*** 第25题 【单选题】【2.00分】【概念理解】***
把本地文件放到集群里,可以使用下面哪个hadoop shell的命令?
- hadoop fs -put
- hadoop fs –push /
- hadoop fs –put /
- hadoop -push /
*** 第26题 【单选题】【2.00分】【概念理解】***
在集群上创建目录,可以使用下面哪个hadoop shell的命令?
- hadoop fs -get
- hadoop fs –put /
- hadoop fs -mkdir
- hadoop -push /
*** 第27题 【单选题】【2.00分】【概念理解】***
下列哪个属性是hdfs-site.xml 中的配置
- dfs.replication
- fs.defaultFS
- mapreduce.framework.name
- yarn.resourcemanager.address
*** 第28题 【单选题】【2.00分】【概念理解】***
关于HDFS集群中的DataNode的描述不正确的是
- 一个DataNode上存储的所有数据块可以有相同的
- 存储客户端上传的数据的数据块
- DataNode之间可以互相通信
- 响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑
*** 第29题 【单选题】【2.00分】【概念理解】***
如果我们现有一个安装CDH的hadoop集群,在不修改默认配置的情况下存储200 个每个200M 的文本文件,请问最终会在集群中产生多少个数据块(包括副本
- 200
- 40000
- 400
- 1200
*** 第30题 【单选题】【2.00分】【概念理解】***
Hadoop起始于以下哪个阶段?
- 2004年,Nutch的开发者开发了NDFS。
- 2004年,Google发表了关于MapReduce的论文。
- 2003年,Google发布了GFS论文。
- 2002年,Apach项目的Nutch。
*** 第31题 【单选题】【2.00分】【概念理解】***
启动yarn集群的命令是
- start-hdfs.sh
- start-dfs.sh
- start-yarn.sh
- zkCli.sh
*** 第32题 【单选题】【2.00分】【概念理解】***
在map 和reduce 函数的输入和输出类型中
- map 的输入和输出
- reduce 的输入和输出
- map 的输入和reduce 的输出
- map 的输出和reduce 的输入
*** 第33题 【单选题】【2.00分】【概念理解】***
MapReduce 编程模型中以下组件哪个是最后执行的
- Mapper
- Partitioner
- Reducer
- RecordReader
*** 第34题 【单选题】【2.00分】【概念理解】***
与HDFS 类似的框架是
- GFS
- Spark
- Flink
- Hive
*** 第35题 【单选题】【2.00分】【概念理解】***
手动启动对应机器resourcemanager的命令是
- yarn-daemon.sh start resourcemanager
- start-dfs.sh
- hdfs zkfc -formatZK
*** 第36题 【单选题】【2.00分】【概念理解】***
DbOutputFormat类的主要作用是
- 将数据库表中的数据进行读取
- 将MapReduce产生的结果集导入到数据表中
*** 第37题 【单选题】【2.00分】【概念理解】***
HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件
- 日志
- 命名空间镜像
- 两者都是
*** 第38题 【多选题】【2.00分】【概念理解】***
关于zookeeper的说法,正确的是
- 以Fast Paxos算法为基础
- 通过选举产生一个leader
- 用于分布式文件存储
- 用于分布式运算
*** 第39题 【单选题】【2.00分】【概念理解】***
HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
- 利用SequenceFile、MapFile、Har等方式归档小文件
- 多Master设计
- Block大小适当调小
- 调大namenode内存或文件系统元数据存到硬盘里
*** 第40题 【单选题】【2.00分】【概念理解】***
Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是
- 安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
- 根据策略对数据块进行必要的复制或删除
- 当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
- 文件系统允许有修改
*** 第41题 【单选题】【2.00分】【概念理解】***
关于 HDFS 写数据流程,下面说法错误的是
- 写数据首先需要找NN确定写的位置
- 如果pipeline一个节点写失败 则重新申请DN节点再写
- 写数据是以packet为大小进行的,默认64K
- pipeline反方向会进行数据的ack检验
*** 第42题 【单选题】【2.00分】【概念理解】***
因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的,这种说法正确吗
- 正确
- 错误
*** 第43题 【单选题】【2.00分】【概念理解】***
Hadoop配置文件中,hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中,hadoop-site.xml被分离成三个XML文件,不包括
- conf-site.xml
- mapred-site.xml
- core-site.xml
- hdfs-site.xml
*** 第44题 【单选题】【2.00分】【概念理解】***
把集群中的文件复制到本地,可以使用下面哪个hadoop shell的命令?
- hadoop fs -get
- hadoop fs –push /
- hadoop fs –put /
- hadoop -push /
*** 第45题 【单选题】【2.00分】【概念理解】***
如果想要修改集群的备份数量,可以修改下面哪个配置文件?
- mapred-site.xml
- core-site.xml
- hdfs-site.xml
- hadoop-env.sh
*** 第46题 【单选题】【2.00分】【概念理解】***
MapReduce的Shuffle过程以下中哪个操作是最后做的
- 排序
- 合并
- 分区
- 溢写
*** 第47题 【单选题】【2.00分】【概念理解】***
出现在datanode的VERSION文件格式中但不出现在nomenode的VERSION文件格式中的是
- namenodeID
- storageID
- storageType
- layoutVersion
*** 第48题 【单选题】【2.00分】【概念理解】***
查看linux机器上当前运行的所有java进程的命令是
- jps
- ipconfig
- systemctl
*** 第49题 【单选题】【2.00分】【概念理解】***
DBInputFormat类的主要作用是
- 将数据库表中的数据进行读取
- 将MapReduce产生的结果集导入到数据表中
*** 第50题 【多选题】【2.00分】【概念理解】***
一个简单的MapReduce程序包括哪几个类
- Mapper类
- Reducer类
- Driver类
版权归原作者 库三岁 所有, 如有侵权,请联系我们删除。