0


hadoop模拟试题

答案,正式使用前请祛除答案以及选项的红色颜色!

1:D

2:C

3:A

4:C

5:B

6:C

7:D

8:B

9:B

10:C

11:A

12:B

13:A

14:C

15:B

16:D

17:A

18:C

19:B

20:A

21:B

22:B

23:A

24:D

25:C

26:C

27:A

28:A

29:D

30:D

31:C

32:D

33:C

34:A

35:A

36:B

37:C

38:AB

39:D

40:D

41:B

42:B

43:A

44:A

45:C

46:B

47:B

48:A

49:A

50:ABC

hadoop-模拟题

50题_共100.00分_及格70.00分

*** 第1题 【单选题】【2.00分】【概念理解】***

关于Hadoop单机模式和伪分布式模式的说法,正确的是

  1. 两者都起守护进程,且守护进程运行在一台机器上
  2. 单机模式不使用HDFS,但加载守护进程
  3. 两者都不与守护进程交互,避免复杂性
  4. 后者比前者增加了HDFS输入输出以及可检查内存使用情况

*** 第2题 【单选题】【2.00分】【概念理解】***

下面哪个程序负责 HDFS 数据存储。

  1. NameNode
  2. Jobtracker
  3. Datanode
  4. secondaryNameNode

*** 第3题 【单选题】【2.00分】【概念理解】***

HDFS 在 hadoop2 默 认 Block Size 是

  1. 128M
  2. 64M
  3. 4K
  4. 128K

*** 第4题 【单选题】【2.00分】【概念理解】***

Hadoop 的作者

  1. Martin Fowler
  2. Kent Beck
  3. Doug Cutting
  4. James Gosling

*** 第5题 【单选题】【2.00分】【概念理解】***

namenode主节点的端口是

  1. 8080
  2. 50070
  3. 50090
  4. 8020

*** 第6题 【单选题】【2.00分】【概念理解】***

负责整个集群资源的管理与调度的进程名称是

  1. NameNode
  2. DataNode
  3. ResourceManager
  4. NodeManager

*** 第7题 【单选题】【2.00分】【概念理解】***

YARN 上的MapReduce 实体不包括

  1. NodeManager
  2. client
  3. ResourceManager
  4. JobTracker

*** 第8题 【单选题】【2.00分】【概念理解】***

下列哪个属性是core-site.xml 中的配置

  1. dfs.replication
  2. fs.defaultFS
  3. mapreduce.framework.name
  4. yarn.resourcemanager.address

*** 第9题 【单选题】【2.00分】【概念理解】***

配置Hadoop 时,JAVA_HOME 包含在哪一个配置文件中

  1. hadoop-default.xml
  2. hadoop-eco.sh
  3. hadoop-site.xml
  4. configuration.xsl

*** 第10题 【单选题】【2.00分】【概念理解】***

关于SecondaryNameNode 哪项()是正确的

  1. 它是NameNode 的热备
  2. 它是内存没有要求
  3. 他的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间
  4. SecondaryNameNode 应与NameNode 部署到一个节点

*** 第11题 【单选题】【2.00分】【概念理解】***

MapReduce 框架提供了一种序列化机制,支持这种序列化的类能够在Map和Reduce 过程中充当键或值,以下说法错误的是

  1. 实现Writable 接口的类是值
  2. 实现WritableComparable<T>接口的类可以是值或键
  3. Hadoop 的基本类型Text 并不实现WritableComparable<T>接口
  4. 键和值的数据类型可以超出Hadoop 自身支持的基本类型

*** 第12题 【单选题】【2.00分】【概念理解】***

HDFS默认的当前工作目录是/user/$USER,fs.default.name的值需要在哪个配置文件内说明

  1. mapred-site.xml
  2. core-site.xml
  3. hdfs-site.xml
  4. 以上均不是

*** 第13题 【单选题】【2.00分】【概念理解】***

Client在HDFS上进行文件写入时,namenode根据文件大小和配置情况,返回部分datanode信息,谁负责将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块

  1. Client
  2. Namenode
  3. Datanode
  4. Secondary namenode

*** 第14题 【单选题】【2.00分】【概念理解】***

关于HDFS的文件写入,正确的是

  1. 支持多用户对同一文件的写操作
  2. 用户可以在文件任意位置进行修改
  3. 默认将文件块复制成三份存放
  4. 复制的文件块默认都存在同一机架上

*** 第15题 【单选题】【2.00分】【概念理解】***

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是

  1. FSDataInputStream扩展了DataInputStream以支持随机读
  2. 为实现细粒度并行,输入分片(Input Split)应该越小越好
  3. 一台机器可能被指派从输入文件的任意位置开始处理一个分片
  4. 输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

*** 第16题 【单选题】【2.00分】【概念理解】***

HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是

  1. .一次写入,少次读
  2. 多次写入,少次读
  3. 多次写入,多次读
  4. 一次写入,多次读

*** 第17题 【单选题】【2.00分】【概念理解】***

下列哪个程序通常不与 NameNode 在一个节点启动?

  1. SecondaryNameNode
  2. DataNode
  3. resourcemanager
  4. nodemanager

*** 第18题 【单选题】【2.00分】【概念理解】***

关于 checkpoint,说法正确的是

  1. checkpoint可通过元数据文件的大小进行控制
  2. secondarynamenode会将合并好的元数据移动到namenode
  3. SecondaryNameNode会将edits文件和fsimage复制到本地(HTTP GET方式)
  4. 合并元数据需要大量的磁盘进行文件的合并操作

*** 第19题 【单选题】【2.00分】【概念理解】***

大数据的4V特征是指?

  1. 数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、技术发展速度快(Velocity)
  2. 数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)
  3. 数据量大(Volume)、类型繁多(Variety)、价值密度高(Value)、数据产生速度快(Velocity)
  4. 数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、数据变化速度快(Velocity)

*** 第20题 【单选题】【2.00分】【概念理解】***

HDfS 中的 block 默认保存几份

  1. 3
  2. 2
  3. 1
  4. 不确定

*** 第21题 【单选题】【2.00分】【概念理解】***

关于 hdfs 元数据,NameNode 维护整个文件系统元数据

  1. DataNode
  2. NameNode
  3. resourcemanager
  4. nodemanager

*** 第22题 【单选题】【2.00分】【概念理解】***

YARNWebUI 默认端口是

  1. 50070
  2. 8088
  3. 19888
  4. 8020

*** 第23题 【单选题】【2.00分】【概念理解】***

HDFS 主节点进程名称是

  1. NameNode
  2. DataNode
  3. ResourceManager
  4. NodeManager

*** 第24题 【单选题】【2.00分】【概念理解】***

负责单个节点的资源管理与任务启动的进程名称是

  1. NameNode
  2. DataNode
  3. ResourceManager
  4. NodeManager

*** 第25题 【单选题】【2.00分】【概念理解】***

把本地文件放到集群里,可以使用下面哪个hadoop shell的命令?

  1. hadoop fs -put
  2. hadoop fs –push /
  3. hadoop fs –put /
  4. hadoop -push /

*** 第26题 【单选题】【2.00分】【概念理解】***

在集群上创建目录,可以使用下面哪个hadoop shell的命令?

  1. hadoop fs -get
  2. hadoop fs –put /
  3. hadoop fs -mkdir
  4. hadoop -push /

*** 第27题 【单选题】【2.00分】【概念理解】***

下列哪个属性是hdfs-site.xml 中的配置

  1. dfs.replication
  2. fs.defaultFS
  3. mapreduce.framework.name
  4. yarn.resourcemanager.address

*** 第28题 【单选题】【2.00分】【概念理解】***

关于HDFS集群中的DataNode的描述不正确的是

  1. 一个DataNode上存储的所有数据块可以有相同的
  2. 存储客户端上传的数据的数据块
  3. DataNode之间可以互相通信
  4. 响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑

*** 第29题 【单选题】【2.00分】【概念理解】***

如果我们现有一个安装CDH的hadoop集群,在不修改默认配置的情况下存储200 个每个200M 的文本文件,请问最终会在集群中产生多少个数据块(包括副本

  1. 200
  2. 40000
  3. 400
  4. 1200

*** 第30题 【单选题】【2.00分】【概念理解】***

Hadoop起始于以下哪个阶段?

  1. 2004年,Nutch的开发者开发了NDFS。
  2. 2004年,Google发表了关于MapReduce的论文。
  3. 2003年,Google发布了GFS论文。
  4. 2002年,Apach项目的Nutch。

*** 第31题 【单选题】【2.00分】【概念理解】***

启动yarn集群的命令是

  1. start-hdfs.sh
  2. start-dfs.sh
  3. start-yarn.sh
  4. zkCli.sh

*** 第32题 【单选题】【2.00分】【概念理解】***

在map 和reduce 函数的输入和输出类型中

  1. map 的输入和输出
  2. reduce 的输入和输出
  3. map 的输入和reduce 的输出
  4. map 的输出和reduce 的输入

*** 第33题 【单选题】【2.00分】【概念理解】***

MapReduce 编程模型中以下组件哪个是最后执行的

  1. Mapper
  2. Partitioner
  3. Reducer
  4. RecordReader

*** 第34题 【单选题】【2.00分】【概念理解】***

与HDFS 类似的框架是

  1. GFS
  2. Spark
  3. Flink
  4. Hive

*** 第35题 【单选题】【2.00分】【概念理解】***

手动启动对应机器resourcemanager的命令是

  1. yarn-daemon.sh start resourcemanager
  2. start-dfs.sh
  3. hdfs zkfc -formatZK

*** 第36题 【单选题】【2.00分】【概念理解】***

DbOutputFormat类的主要作用是

  1. 将数据库表中的数据进行读取
  2. 将MapReduce产生的结果集导入到数据表中

*** 第37题 【单选题】【2.00分】【概念理解】***

HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件

  1. 日志
  2. 命名空间镜像
  3. 两者都是

*** 第38题 【多选题】【2.00分】【概念理解】***

关于zookeeper的说法,正确的是

  1. 以Fast Paxos算法为基础
  2. 通过选举产生一个leader
  3. 用于分布式文件存储
  4. 用于分布式运算

*** 第39题 【单选题】【2.00分】【概念理解】***

HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括

  1. 利用SequenceFile、MapFile、Har等方式归档小文件
  2. 多Master设计
  3. Block大小适当调小
  4. 调大namenode内存或文件系统元数据存到硬盘里

*** 第40题 【单选题】【2.00分】【概念理解】***

Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是

  1. 安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
  2. 根据策略对数据块进行必要的复制或删除
  3. 当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
  4. 文件系统允许有修改

*** 第41题 【单选题】【2.00分】【概念理解】***

关于 HDFS 写数据流程,下面说法错误的是

  1. 写数据首先需要找NN确定写的位置
  2. 如果pipeline一个节点写失败 则重新申请DN节点再写
  3. 写数据是以packet为大小进行的,默认64K
  4. pipeline反方向会进行数据的ack检验

*** 第42题 【单选题】【2.00分】【概念理解】***

因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的,这种说法正确吗

  1. 正确
  2. 错误

*** 第43题 【单选题】【2.00分】【概念理解】***

Hadoop配置文件中,hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中,hadoop-site.xml被分离成三个XML文件,不包括

  1. conf-site.xml
  2. mapred-site.xml
  3. core-site.xml
  4. hdfs-site.xml

*** 第44题 【单选题】【2.00分】【概念理解】***

把集群中的文件复制到本地,可以使用下面哪个hadoop shell的命令?

  1. hadoop fs -get
  2. hadoop fs –push /
  3. hadoop fs –put /
  4. hadoop -push /

*** 第45题 【单选题】【2.00分】【概念理解】***

如果想要修改集群的备份数量,可以修改下面哪个配置文件?

  1. mapred-site.xml
  2. core-site.xml
  3. hdfs-site.xml
  4. hadoop-env.sh

*** 第46题 【单选题】【2.00分】【概念理解】***

MapReduce的Shuffle过程以下中哪个操作是最后做的

  1. 排序
  2. 合并
  3. 分区
  4. 溢写

*** 第47题 【单选题】【2.00分】【概念理解】***

出现在datanode的VERSION文件格式中但不出现在nomenode的VERSION文件格式中的是

  1. namenodeID
  2. storageID
  3. storageType
  4. layoutVersion

*** 第48题 【单选题】【2.00分】【概念理解】***

查看linux机器上当前运行的所有java进程的命令是

  1. jps
  2. ipconfig
  3. systemctl

*** 第49题 【单选题】【2.00分】【概念理解】***

DBInputFormat类的主要作用是

  1. 将数据库表中的数据进行读取
  2. 将MapReduce产生的结果集导入到数据表中

*** 第50题 【多选题】【2.00分】【概念理解】***

一个简单的MapReduce程序包括哪几个类

  1. Mapper类
  2. Reducer类
  3. Driver类

标签: hadoop hdfs 大数据

本文转载自: https://blog.csdn.net/qq_72027307/article/details/131227589
版权归原作者 库三岁 所有, 如有侵权,请联系我们删除。

“hadoop模拟试题”的评论:

还没有评论