校内大数据课题目

校内大数据课程选择题题目
1 /300【单选】
()指数据经由组织机构内部与外部组织机构及个人交互过程中提供数据的阶段。
A.数据采集
B.数据交换
C.数据处理
D.数据传输

2/300【单选】
大数据最明显的特点就是()。
A.数据体量大
B.数据类型繁多
C.价值密度低
D.处理速度快

3 /300【单选】
大数据的核心就是()，大数据能够预测体现在很多方面。
A.预测
B.计算
c.数据
D.推测

4 /300【单选】
大数据的一个鲜明特征就是其()。
A.特权性
B.智慧化
C.开放性
D.智能化

5/300【单选】
()是将数据分析结果通过直观的方式（表格、图形等）呈现出来。
A.数据清洗
B.数据可视化
C.数据处理
D.数据计算

6 /300【单选】
下单时间、订单数量、商品品类、订单金额、订购频次属于()。
A.网站用户数据
B.订单数据
C.反馈数据
D.私有数据

7 /300【单选】
()被称作是最新的商业原材料“21世纪的石油”。
A.可视化
B.数据计算
c.数据汇总
D.数据

8 /300【单选】
根据不同的业务需求来建立数据模型，抽取最有意义的向量，决定选取哪种方法的数据分析角色人员是（）.
A.数据管理人员
B.数据分析员
C.研究科学家
D.软件开发工程师

9/300【单选】
美国海军军官莫里通过对前人航海日志的分析，绘制了新的航海路线图，标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的（)。
A.在数据基础上倾向于全体数据而不是抽样数据。
B.在分析方法上更注重相关分析而不是因果分析。
C.在分析效果上更追究效率而不是绝对精确。
D.在数据规模上强调相对数据而不是绝对数据。

10 /300【单选】
下列选项中无法通过大数据技术实现的是?()
A.商业模式发现
B.信用评估
C.商品推荐
D.运营分析

11 /300【判断】
“大数据”是指存储量超过 100TB 的数据集。
A.正确
B.错误

12 /300【判断】
大数据分析可以从海量数据中发现趋势或者规律，具有很高的应用价值。
A.正确
B.错误

13 /300【判断】
大数据与传统数据有着本质上的差别，因为大数据有
专门的处理软件。
A.正确
B.错误

14 /300 【判断】
能够充分利用数据价值、先挖掘到数据价值的企业将会占领先机，不注重大数据等新兴技术的企业，将会落后甚至被淘汰。数据将成为最有价值的资产。
A.正确
B.错误

15 /300【判断】
随着数据量的增大，异常值和缺失值对整体分析结果的影响会逐渐变小，因此在“大数据”模式下，数据清洗可忽略部分异常值和缺失值的影响，而侧重对数据结构合理性的分析。
A.正确
B.错误

16 /300【判断】
大数据时代是先有数据后有模式
A.正确
B.错误

17 /300【多选】
数据按数字化方式分()。
A.定位数据
B.定性数据
C.矢量数据
D.格网数据

18 /300 【多选】
大数据的特征包括()。
A.数据体量大
B.数据类型繁多
C.低价值密度
D.处理速度快

19 /300 【多选】
下列属于大数据思维的核心原理的有()。
A.数据核心原理
B.数据价值原理
C.全样本原理
D.关注效率原理

20/300【多选】
大数据思维有三个维度，这三个维度指的是()。
A.定性思维
B.定量思维
C.相关思维
D.实验思维

21/300【多选】
大数据研究专家舍恩伯格指出，大数据时代，人们对待数据的思维方式会发生如下三个变化()。
A.从样本思维转向总体思维
B.从精确思维转向容错思维
C.从因果思维转向相关思维
D.从预测思维转向推测思维

22 /300【多选】
大数据具有重要而独特的特性包括()。
A.体积
B.类型
C.速度
D.移动设备

23 /300 【多选】
在收集数据时，数据来源包含两种方式，这两种方式是()。
A.直接数据
B.移动端数据
C.间接数据
D.客户端数据

24/300【多选】
在实际工作中,获取数据的方式有很多种,包括()。
A.数据库
B.公开出版物
C.统计工具的数据
D.市场调查

25 /300【多选】
数据的有效存储是大数据技术的基础，数据存储技术的发展主要经历了以下阶段()。
A.直接数据
B.非关系型数据库和分布式文件系统
C.数据仓库
D.关系型数据库

26/300 【多选】
前台分析工具主要包括()，以及各种基于数据仓库和数据集市的应用开发工具等。
A.报表工具
B.查询工具
C. 数据分析工具
D.数据挖掘工具

27/300 【多选】
可视化技术广泛应用于()的处理和分析。
A.大规模
B.高纬度
C.非结构化数据
D.结构化数据

28/300 【多选】
大数据平台安全主要包括()。
A.基础设施安全
B.传输交换安全
C. 存储安全
D.平台管理安全

29/300 【多选】
()是大数据平台安全运行的基础。
A.物理安全
B.网络安全
C.虚拟化安全
D.计算安全

30/300 【多选】
大数据保护的基本原则包括()。
A.数据主权原则
B.数据保护原则
C.数据自由流通原则
D.数据安全原则

31/300 【多选】
大数据的精髓是()。
A.不是随机样本而是全部数据
B.不是精确性而是混杂性
C.不是因果关系而是相关关系
D.不是实时变化而是全量变化

32/300 【多选】
大数据产生的经历了哪些阶段。()
A.数据积累阶段
B.运营式系统阶段
C.用户原创内容阶段
D.感知式系统阶段

33/300 【多选】
大数据分析相关技术主要特征包括()
A.机器学习，全量特征
B.数据背后事件关联性分析
C.基于海量数据为基础
D.基于精确样本为基础

34/300 【单选】
在Excel中，下面关于单元格的叙述正确的是()。
A.在编辑的过程中，单元格地址在不同的环境中会有所变化
B.工作表中单元格是由单元格地址来表示的
C.为了区分不同工作表中相同地址的单元格地址，可以在单元格前加上工作表的名称，中间用“#”间隔
D.A4表示第4列第1行的单元格

35/300 【单选】
使用自动填充方法输入数据时，若在A1输入2，然后选中A1，再拖动填充柄至A10，则A1:A10区域内单元格填充的数据为()。
A.全2
B.全4
C.全0
D. 2,3,4,11

36/300 【单选】
当鼠标指针位移到工作表中选定区域的填充柄上时，指针变为()光标。
A.黑箭头
B.空心十字
C.黑十字
D.空心箭头

37/300 【单选】
若要将610031作为文本型数据输入单元格，应输入()。
A. /610031
B. ''610031’
C. '+610031
D. ’610031

38/300 【单选】
利用Excel的自定义序列功能建立新序列。在输入的新序列各项之间要用()加以分隔。
A.全角分号
B.半角分号
C.全角逗号
D.半角逗号

39/300 【单选】
对于Excel的自动填充功能，正确的说法是()。
A.数字、日期、公式和文本都是可以进行填充的
B.日期和文本都不能进行填充
C.只能填充数字和日期系列
D.不能填充公式

40/300【单选】
在默认的情况下，Excel自定义单元格格式使用的是“G/通用”格式，当数值长度超出单元格长度时用()显示。
A.分节记数法
B.普通记数法
C.科学记数法
D.以上都不是

41/300 【单选】
Excel可以把工作表转换成Web页面所需的()格式。
A. EXE
B.HTML
C.BAT
D.TXT

42/300【单选】
在Excel中，获取外部数据的来源不包括()。
A.现有连接
B.来自Access
C.来自网站
D.来自word

43/300 【单选】
将TXT文档数据导入到Excel中，是在Excel中的()菜单中完成的。
A.数据
B.插入
C.文件
D.开始

44/300【单选】
Excel中，如果需要在单元格中将600显示为600.00，应该将单元格的数据格式设置为()。
A. 常规
B.数值
C.日期
D.文本

45/300 【单选】
在Excel中，想计算包含数字的单元格个数，应选择函数()。
A.sum
B. count
C. max
D. average

46/300 【单选】
小李使用Excel统计自己一周的支出情况，在单元格 B3~B9中，依次存放了周一到周日的支出费用，想在单元格B10中求出一周的平均费用，应选用公式()。
A.AVERAGE(B3:B9)
B.SUM(B3:B9)
C.AVERAGE(B1:B7)
D.SUM(B1:B7)

47/300 【单选】
小王使用Excel指定旅游计划时，在单元格A3~A6中存放了各项费用，单元格A7中使用了函数 SUM(A3:A6)，单元格A7显示出()。
A.各项费用的平均值
B.各项费用的和
C.各项费用中的最大值
D.各项费用中的最小值

48/300【单选】
在文档窗口中，可以同时编辑多个Excel工作簿，但在同一时刻()工作簿窗口的标题栏颜色最深。
A.正式
B.临时
C.活动
D.数据源

49/300 【判断】
在电子表格MicrosoftExcel中，单元格中的公式可以复制。()
A.正确
B. 错误

50/300 【判断】
设在单元格A1中有公式:=B1+B2，若将其复制到单元格C1中则公式为=D1+D2。
A.正确
B.错误

51.【判断】
在Excel工作表中，假设A2=7，B2=6.3，选择A2:B2区域，并将鼠标指针放在该区域右下角填充柄上，拖动至E2，则E2=4.2。
A.正确
B.错误

52.【判断】
在把文本文件的数据导入Excel电子表格时，要把文本文件转换为Word文档。
A.正确
B.错误

53.【判断】
在Excel中，用户在工作表里输入日期，1999/10/01形式不符合日期格式。
A.正确
B.错误

54.【判断】
假定单元格B2的内容为2015/6/18，则函数=day(B2)的值为日期数据有两种表示形式，即为2011-12-20和2011/12/20。Day函数读取日期型函数中的日。
A.正确
B.错误

55.【判断】
Excel中，我们创建的图表选择数据区域可以不连续。
A.正确
B.错误

56.【判断】
在Excel数据清单中，按某一字段内容进行归类，并对每一类作出统计的操作是数据透视表。
A.正确
B.错误

57.【判断】
Excel实现统计分析的主要途径是数据分析工具。
A.正确
B.错误

58.【判断】
Excel中可以利用LOOKUP函数实现根据首列查找信息功能。
A.正确
B.错误

59.【判断】
简易采集模式是利用系统内置模板进行数据采集的模式。（)
A.正确
B.错误

60.【判断】
数据采集器是进行数据采集的机器或者工具。
A.正确
B.错误

61.【判断】
http协议中有get方法和post方法。（)
A.正确
B.错误

62.【多选】
常见的爬虫语言有
A.HTML
B. Python
C. Java
D.PHP

63.【多选】
循环采集包括（）。
A.URL循环
B.文本循环
C.单个元素循环
D.随机循环

64.【多选】
如果要对B2、B3、B4三个单元格中的数值求平均值，则公式应该为（）。
A. =AVERAGE(B2:B4)
B.=SUM(B2:B4)
C. =AVERAGE(B2,B3,B4)
D.=(B2+B3+B4)/3

65.【多选】
有关EXCEL嵌入式图表，下面哪个表述是正确的？
A.对生成后的图表进行编辑时，首先要选中图表
B.图表生成后不能改变图表类型，如：三维变二维
C.表格数据修改后，相应的图表数据也随之变化
D.图表生成后可以向图表中添加新的数据

66.【多选】
关于Excel的数据库叙述正确的是（）。
A.一行为一个记录
B.一列为一个字段
C.数据库通常又称数据清单
D.它是一个二维表

67.【多选】
下列关于对Excel中“清除”和“删除”功能的表述，哪些是正确的?
A.“清除”不能删掉单元格中某些类型的数据
B.“删除”单元格有可能影响其它单元格的位置和内容
C.“清除”的对象只是单元格中的内容
D.”删除”的对象不只是单元格中的内容，而且还有单元格本身

68.【多选】
用EXCEL可创建（）图表。
A.二维图表
B.三维图表
C.饼图
D.雷达图

69.【多选】
关于筛选，叙述正确的是
A.自动筛选可以同时显示数据清单和筛选结果
B.高级筛选可以进行更复杂的筛选
C.高级筛选不需要建立条件区，只有数据清单就可以了
D.高级筛选可以将筛选结果放在指定的区域

70.【多选】
在EXCEL中，有关单元格数据的输入、编辑，下面表述正确的是（）。
A.一个工作表中同时可以选定多个活动单元格
B.用鼠标左键单击单元格后便可以向该单元格重新输入数据
C.只允许向活动单元格中输入数据
D.用鼠标左键双击单元格后，就可以编辑该单元格已有的数据

71.【多选】
单元格格式包括数字，（）边框，图案和保护
A.颜色
B.对齐
C.下划线
D.字体

72.【多选】
粘贴原单元格的所有内容包括
A.公式
B.值
C.格式
D.附注

73.【多选】
下面关于工作表命名的说法，正确的有（）。
A.在一个工作簿中不可能存在两个完全同名的工作表
B.工作表可以定义成任何字符，任何长度的名字
C.工作表的名字只能以字母开头，且最多不超过32字节
D.工作表命名后还可以修改，复制的工作表将自动在
后面加上数字以示区别

74.【单选】
SQL语言中的COMMIT语句的主要作用是
A.结束程序
B.返回系统
C.提交事务
D.存储数据

75.【单选】
设有一个关系：DEPT （DNO，DNAME)，如果要找
出倒数第三个字母为W，并且至少包含4个字母的
DNAME，则查询条件子句应写成
WHEREDNAMELIKE ()。
A.LW%’
B.%W’
C.W
D.W%’

76/300【单选】
以下()指令无法增加记录。
A.insert into… values…
B.insert into select…
C. insert into…set
D.insert into update… alter into select…

77/300【单选】
在select语句中,可以使用()子句,将结果集中的数据行根据选择列的值进逻辑分组,以便能汇总表内容的子集,即实现对每个组的聚集计算。
A. limit
B. group by
C. where
D.order by

78/300【单选】
控制台中执行()语句时可以退出MySQL。
A. exit
B.go或quit
C.go或exit
D.exit或quit

79/300【单选】
在MySQL数据库中,通常使用()语句来指定一个已有数据库作为当前工作数据库。
A. using
B. used
C.uses
D.use

80/300【单选】
在创建数据库时,可以使用()子句确保如果数据库不存在就创建它,如果存在就直接使用它。
A.if not exists
B.if exists
C.if not exist
D.if exist

81 /300【单选】
若要计算表中数据的平均值,可以使用() 。
A. sqrt
B.avg
C. square
D.count

82/300【单选】
delete from employee语句的作用() 。
A.删除当前数据库中整个employee表,包括表结构
B.删除当前数据库中employee表内的所有行
C.由于没有where子句,因此不删除任何数据
D.删除当前数据库中employee表内的当前行

83/300【单选】
student表中查询年龄字段age为20或21的、性别字段sex=M的学生的语句是() 。
A.selectfrom student where age=20 and age=21 and sex=“M” ;
B. selectfrom student where age=20 or age=21 and sex=“M “”;
C.select*from student where (age=20 or age=21) and sex=“M” ;
D.select*from student where (age=20 or age=21 and sex=“M””) ;

84/300【单选】
student表中查询按照年龄age从大到小再学号sid从小到大排序() 。
A.order by sid desc, age asc
B.order by age desc,sid
C. order by sid asc, age desc
D. order by age asc, sid desc

85/300【单选】
查询员工工资信息,结果按工资降序排列,正确的是() 。
A.ORDER BY工资
B.ORDER BY工资desc
C.ORDER BY工资asc
D.ORDER BY工资dictinct

86/300【单选】
student表中有姓名字段sname,查询复姓东方的学生的where条件() 。
A. sname=”东方”
B. sname 1ike"东方”
C. sname like"%东方”
D.sname like”东方%"

87/300【单选】
"Select职工号FROM职工WHERE工资>1250”查询的是()。
A.查询工资大于1250的纪录
B.查询1250号记录后的记录
C.检索所有的职工号
D.从[职工]关系中检索工资大于1250的职工号

88/300【单选】
字段age为整数,查询age在20到25之间,以下where条件错误的是()。
A.age between 20 and 25
B. age in (20,21,22,23,24,25)
C.age>=20 and age<=25
D.age in (>=20 and <=25)

89/300【单选】
SQL语言中,条件年龄BETTEEN 15 AND 35表示年龄在15至35之间,并且() 。
A.包括15岁和35岁
B.不包括15岁和35岁
C.包括15岁但不包括35岁
D.包括35岁但不包括15岁

90/300【单选】
sql语句进行降序排序的命令是?()
正确
A. order by字段desc
B. order by字段asc
C. order by字段
D. limit 3

91/300【单选】
有一个student表,有如下四个字段,学号:sid int型;姓名,sname,char型;班号,cno,int型;分数字段score。要求求出每个班级的所有人员的平均分数,如下sql语句正确的为:
A.select avg (score) from student group by cno;
B. select sum (score) from student group by cno;
C. select avg (score) from student;
D. select avg (score) from student group by sid;

92/300【单选】
按照姓名降序排列的SQL语句是() 。
A.ORDER BY DESC NAME
B.ORDER BYNAME DESC
C.ORDER BY NAME ASC
D.ORDER BY ASC NAME

93 /300【单选】
以下删除表记录正确的() 。
A.delete from emp where name=“dony”;
B. Deletefrom emp where name="dony ";
C. Drop from emp where name=“dony”;
D. Dropfrom emp where name=“dony”;

94/300【单选】
SQL语句中使用WHERE子句指出的是() 。
A.查询结果
B.查询视图
C.查询目标
D.查询条件

95/300【单选】
查询语句中order by子句的作用是() 。
A.分组
B.限定
C.排序
D.嵌套

96/300【单选】
有一个student表,有如下三个字段,学号: sid int型;姓名,sname,char型;班号,cno,int型。查询所有学生的学号、班号,查询结果根据学号按降序排列,仅显示前5个学生的信息;如下sQL语句正确的为:
A.select sid, cno from student order by sid desc 1imit 5;
B. select sid, cno from student order by sid asc limit 5 ;
C.select sid, cno from student limit 5 order by sid desc;
D. select sid, cno from student order by sid desc limit 1,5;

97/300【单选】
若要查询成绩score为60-80分之间(包括60分,不包括80分)的学生信息,成绩字段查询准则应该设置为)
A. score=60 and<80
B. score>= 60 and score<80
C. score between 60 and 80
D.score IN(60,80)

98/300【单选】
下列语句正确的是() 。
A.WHERE NAME NULL
B.WHERE NAME IS NULL
C.WHERE NAME=NULL
D. WHERE NAME==NULL

99/300【单选】
有一个student表,有如下三个字段,学号: sno;姓名,sname,性别,sex;成绩,grade;查询性别为“男”的学生的基本情况,并按学号升序排序。
A. selectfrom student where sex=man order by sno desc;
*B.selectfrom student where sex=man order by sno asc;*
C. selectfrom student where sex=nan order by man desc;
D. selectfrom student where sno order by man desc;

100/300【单选】
以下删除记录正确的() 。
A.delete from emp where name=‘dony’;
B. Delete * from emp where name=‘dony’;
C. Drop from emp where name=‘dony’;
D. Drop*from emp where name=‘dony’;

101/300【单选】
设关系数据库中一个表 S 的结构为 S ( SN , CN ,grade )，其中 SN 为学生名， CN 为课程名，二者均为字符型； grade 为成绩，数值型，取值范围0-100。若要把"张二的化学成绩80分"插入 S 中，则可用（)。
A . ADD INTO S VALUES (‘张二’,‘化学’,‘80’)
B . INSERT INTO S VALUES (‘张二’,‘化学’,‘80’)
C . ADD INTO S VALUES (‘张二’,‘化学’,80)
D . INSERT INTO S VALUES (‘张二’,‘化学’,80)

102/300【单选】
现有订单表 orders ，包含用户信息 userid ，产品信息 productid ,以下（）语句能够返回至少被订购过两回的 productid ?
A . select productid from orders where count ( productid )>1
B . select productid from orders where max ( productid )>1
C . select productid from orders where having count ( productid )>1 group by productid
D . select productid from orders group by productid having count ( productid )>1

103/300【单选】
假设订单表 orders 用来存储订单信息， cid 代表客户编号， money 代表单次订购额，现要查询每个客户的订购次数和每个客户的订购总金额，下面（) sql 语句可以返回正确结果。
A . select cid , count ( distinct ( cid )), sum ( money ) from orders group by cid
B . select cid , count ( distinct ( cid )), sum ( money ) from orders order by cid
C . select cid , count ( cid ), sum ( money ) from orders order by cid
D . select cid , count ( cid ), sum ( money ) from orders group by cid

104/300【单选】
现有表 book ，字段： id ( int ), title ( varchar ), price ( float );其中 id 字段设为标识，使用 insert 语句向 book 表中插入数据，以下语句错误的是（)。
A . insert into book ( id , title , price ) values (1,’ java ‘,100)
B . insert into book ( title , price ) values (’ java ',100)
C . insert into book values (’ java ',100)
D . insert book values (‘java ',100)

105/300【单选】
表结构为 score ( sti _ id , names , math , English , VB )，下列语句中正确的是（)。
A . select stu _ id , sum ( math ) from score
B . select sum ( math ), avg ( VB ) from score
C . select *, sum ( english ) from score
D . delete * from score

106/300【单选】
现有客户表customers(主键:客户编号cid)，包含10行数据，订单表orders(外键:客户编号cid)，包含6条数据。执行sql语句:select*from customers right outer join orderson
Customers.cid=orders.cid。最多返回()条记录。
A.10
B.6
C.4
D.0

107/300【单选】
现有表Employee，字段:id(int)，firstname(varchar),lastname(varchar);以下sql语句错误的是()。
A. select firstname+ . +lastname as ‘name’ from employee
B. select firstname+ .'+lastname=‘name’ from employee
C.selectname=firstname++lastname from employee
D. select firstname,lastname from employee

108/300【单选】
SQL语言中删除一个表中所有数据但保留表结构的命令是()。
A.DELETE
B.DROP
C.CLEAR
D.REMORE

109/300【判断】
在SELECT语句中，当使用ORDERBY子句时，一定要使用GROUPBY子句。()
A.正确
B.错误

110/300【判断】
使用INSERT命令一次只能插入一行数据。()
A.正确
B.错误

111/300【多选】
现有书目表book，包含字段:price(float);现在查询一条书价最高的书目的详细信息，以下语句正确的是()。
A. select top 1from book order by price asc
B. select top 1 * from book order by price desc
C. select top 1 * from book where price=(select max(price)from book)
D. select top 1from book where price=max(price)

112/300【多选】
下列选项中，UPDATE语句书写正确的有()。
A.UPDATE SET Columnl=1 FROM table name
B. UPDATE table name SET Columnl=1
C. UPDATE table name SET Column|=1 AND Columnl=2
D. UPDATE table name SET Columnl=1.Columnl=2

113/300【单选】
http状态码中表示访问成功的是()。
A.200
B.501
C.503
D.404

114/300【单选】
人与人之间沟通信息、传递信息的技术，这指的是()。
A.感测技术
B.微电子技术
C.计算机技术
D.通信技术

115/300【单选】
数据清洗的方法不包括()。
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理

116/300【单选】
下列关于舍恩伯格对大数据特点的说法中，错误的是()。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高

117/300【单选】
大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的()。
A.新一代信息技术
B.新一代服务业态
C.新一代技术平台
D.新一代信息技术和服务业态

118/300【单选】
()指组织机构在内部针对动态数据进行的一系列活动的组合。
A.数据采集
B.数据存储
C.数据处理
D.数据传输

119/300【单选】
Excel中优先等级最高的运算符是()。
A.算术运算符
B.比较运算符
C文本运算符
D.引用运算符正确

120/300【单选】
在Excel中，一个工作簿就是一个Excel文件，其扩展名为()。
A.XLSX
B.DBFX
C. EXEX
D.LBLX

121/300【单选】
在Excel中，一个工作簿可以含有()工作表。
A.1个
B.2个
C.多个
D.3个

122/300【单选】
Excel电子表格A1到C5为对角构成的区域，其表示方法是()。
A.A1:C5
B.A1,C5
C.C5;A1
D.A1+C5

123/300【单选】
以下单元格引用中，下列哪一项属于混合引用()。
A.E3
B. $C$18
C. $D$13
D.B$20

124/300【单选】
某公司员工离职后，需要在员工管理系统中将该员工的信息清除，采用的方法是()。
A.删除单元格
B.删除字段
C.删除数据库
D.删除记录

125/300【单选】
选项中删除表的语句是()。
A.DROP
B.ALTER
C.UPDATE
D.DELETE

126/300【单选】
选项中查询毕业学校名称与"清华"有关的记录应该用（)。
A . SELECT * FROM 学习经历 WHERE 毕业学校 LIKE ‘清华＊’
B . SELECT * FROM 学习经历 WHERE 毕业学校＝’％清华％’
C . SELECT * FROM 学习经历 WHERE 毕业学校 LIKE ?清华？
D . SELECT * FROM 学习经历 WHERE 毕业学校 LIKE ‘%清华％’

127/300【单选】
删除 CUSTOMERS 表中 CUSTID =5的记录的语句为（）。
A . DROP FROM CUSTOMERS WHERE CUSTID =5
B . DELETE FROM CUSTOMERS WHERE CUSTID -5
C . SELECT FROM CUSTOMERS WHERE CUSTID =5
D . DROP CUSTOMERS WHERE CUSTID =5

128/300【单选】
查看年龄为20的所有人的记录， SQL 语句为()。
A . SELECT * FROM CUSTOMERS WHERE AGE =20
B . DROP FROM CUSTOMERS WHERE AGE -20
C . SELECT FROM CUSTOMERS WHERE AGE -20
D . DELETE FROM CUSTOMERS WHERE CUSTID =5

129/300【单选】
把 user 表中凡是名字为’ jack '的记录删除的语句为0。
A . delete * from user where name =" jack "
B . drop from user where name =" jack "
C . alter from user where name =" jack "
D . delete user where name =" jack "

130/300【单选】
一个网址中的 HOST 实际上是一个（)。
A . mac 地址
B ．物理地址
C . IP 地址
D ．服务器

131/300【单选】
以网络为本的知识文明，人们所关心的主要安全是0。
A ．人身安全
B ．社会安全
C ．信息安全
D ．设备安全

132/300【判断】
爬虫必须用 python 编写。
A ．正确
B ．错误

133/300【单选】
从大量数据中提取知识的过程通常被称为（)。
A ．数据挖掘
B ．人工智能
C ．数据清洗
D ．数据仓库

134/300【单选】
下列论据中，能够支撑"大数据无所不能"的观点是0。
A ．互联网金融打破了传统的观念和行为
B ．大数据存在泡沫
C ．大数据具有非常高的成本
D ．个人隐私泄露与信息安全担忧

135/300【单选】
下列关于数据的说法，正确的是（)。
A ．只有通过电脑加工的才是数据
B ．互联网成为数据产生的唯一方式，数据量也在不断增长
C ．人工采集数据已经被淘汰了
D ．文本、图像、声音、视频等都是数据的载体，数据形式越来越丰富

136/300【单选】
数据仓库的最终目的是（)。
A ．收集业务需求
B .建立数据仓库逻辑模型
C ．开发数据仓库的应用分析
D ．为用户和业务部门提供决策

137/300【单选】
大数据处理技术和传统的数据挖掘技术的最大的区别是（)。
A ．数据体量大
B ．算法种类多
C ．价值密度低
D ．处理速度快

138/300【单选】
大数据的起源是（)。
A ．金融
B .电信
C ．互联网
D ．公共管理

139/300【单选】
目前社会中，最为突出的大数据环境是（)。
A ．互联网
B ．物联网
C ．综合国力
D．自然资源

140/300【单选】
大数据不是要教机器像人一样思考。相反它是（)。
A ．把数学算法运用到海量的数据上来预测事情发生的可能性
B ．被视为人工智能的一部分
C ．被视为一种机器学习
D .预测与惩罚

141/300【判断】
大数据的4V特点是 Volume （数据量大）、Velocity （处理速度快）、 Variety （多样性）、 Veracity （真实性）。()
A ．正确
B ．错误

142/300【判断】
大数据最重要的特点是数据量大，噪声数据少，所以收集数据过程中要力求精确。()
A ．正确
B ．错误

143/300【多选】
在数据分析中，数据处理是必不可少的一个环节，主要包括（）等数据处理这些方法。
A ．数据清理
B ．数据转换
C ．数据提取
D ．数据汇总与计算

144/300【多选】
大数据有（）特点。
A ．数据量大
B ．速度快、时效高
C ．类型多
D ．价值密度低、含量大

145/300【单选】
(）是大数据分析最重要的应用领域。
A ．可视化分析
B ．语义引擎
C ．预测性分析能力
D ．数据质量管理

146/300【单选】
大数据时代，计算模式发生了转变，从"流程"核心转变为"()"核心。
A ．流程
B ．大数据
C ．数据
D ．自动

147/300【多选】
在大数据时代，数据可视化技术在广泛应用的同时，也面临诸多新的挑战，包括（)。
A ．数据规模
B ．数据融合
C ．图表绘制效率
D .图表表达能力

148/300【单选】
电子表格软件主要用于（）操作。
A .数据库管理
B ．文字处理
C ．数据处理
D ．幻灯片制作

149/300【单选】
在 Excel 某单元格中输入公式"= if (5>=6, T , F )"，结果为（）。
A . T
C .15
D .29

150/300【单选】
某Excel2003工作表中，想利用"筛选"功能，把数学成绩不低于80分的学生全部选出来，筛选的条件应该是（）。
A ．大于或等于
B ．大于
C ．小于
D .小于或等于

151.Excel在公式运算中，如果引用第6行的绝对地址，第D列的相对地址，则应为（D$6）。

153.在Excel中，进行公式复制时（相对地址中所引用的单元格）发生改变

153.在下列Excel运算符中，优先级最高的是（+）。

154.在Excel中，给当前单元格输入数值型数据时，默认为(右对齐)。

155.在工作表的单元格内输入数据时，可以使用自动填充的方法，填充柄是选定区域（右下角）的小黑方块。

156.设在B1单元格存有一公式为:=A$5，将其复制到D1后，公式变为=C$5。(正确)

Excel中可以利用LOOKUP函数实现根据首列查找信息功能。(错误)

158.关于EXCEL图表中“系列”的正确描述包括。
A.一个系列对应工作表中的一行或一列数据
B.一个系列对应工作表中的一个矩形区域的数据
C.一个系列在图表上用同一种颜色表示
D.一个图表中可以有多个系列

159 /300(多选
关于分类汇总，叙述正确的是（）。
A.分类汇总前首先应按分类字段值对记录排序
B.分类汇总只能按一个字段分类
C.只能对数值型字段进行汇总统计
D.汇总方式只能求和

160/300[多选]
在EXCEL中，可以对表格中的数据进行（）等统计处理。
A.求和
B.汇总
C.排序
D.索引

161/300 (单选
设有一个关系:DEPT (DNO，DNAME)，如果要找出倒数第三个字母为W，并且至少包含4个字母的DNAME，则查询条件子应写成WHERE DNAME LIKE （）。
A._W%
B.%W
C.W
D.W %

162 /300(单选
创建数据库的语句是 ()。
A.insert database 数据库名
B.create database 数据库名
C.use database 数据库名
D.select database 数据库名

163 /300(单选)
向数据表中插入一条记录用以下 () 关键字
A. CREATE
B.INSERT
C.SAVE
D.UPDATE

164 /300 (单选
使用insert命令插入记录时使用 ()关键字会忽略导致重复关键字的错误记录。
A. no same
B. ignore
C. repeat
D.unique

165 /300 (单选
SQL语句中修改表结构的命令是。
A. modify table
B. modify structure
C. alter table
D. alter structure

166 /300 (单选
关于语句limit 5,5，说法正确的是 ()。
A.表示检索出第5行开始的5条记录
B.表示检索出行6开始的5条记录
C.表示检索出第6行开始的5条记录
D.表示检索出行5开始的前5条记录

167 /300(单选
在select语句的where子句中，使用正则表达式过滤数据的关键字是。
A. like
B.againset
C.match
D. regexp

168 /300 (单选]
查找条件为:姓名不是NULL的记录 (。
A.WHERE NAME!NULL
B.WHERE NAME NOT NULL
C.WHERE NAME IS NOT NULL
D.WHERE NAME != NULL

169 /300 (单选
以下聚合函数求个数的是 (。
A.AVG
B.SUM
C.MAX
D.COUNT

170 /300 (单选
以下语句不正确的是 (。
A. select * from emp;
B. select name,sal from emp;
C. select * from emp order by dept;
D. select * from emp where dept=1 and sal<300;

171/300 (单选如何统计每个学科的最高分 ()。
A.select学生，max (成绩) from A group by 学生;
B.select 学生，max (成绩) from A group by 学科;
C.select学生，max (成绩) from A orderby学生;
D.select 学生，max (成绩) from A group by 成绩;

172 /300 (判断]
SQL中通配符”%”表示任意单个字符。(
A.正确
B.错误

173 /300 (判断]
以下SQL，收入 BETWEEN 2000AND 5000，表示收入在2000至5000之间，包括2000但不包括5000。()
A.正确
B.错误

174 /300(多选
关于检索结果排序，正确的是 ()。
A.关键字DESC表示降序，ASC表示升序
B.如果指定多列排序，只能在最后一列使用升序或者降序关键字
C.如果指定多列排序，可以在任意列使用升序或降序关键字
D.关键字ASC表示降序，DESC表示升序

175 /300[多选]
某查询语句中有“%田_”语句，则可能的查询结果有（）。
A.张田
B.陈力田
c.田华
D.刘田耕

176/300【多选】
学生成绩表grade中有字段score(float)，现在要把所有在55分至60之间的分数提高5分，以下sal语句正确的是()。
A.Update grade set score=score+5
B. Update grade set score=score+5 where score>=55orscore<=60
C. Update grade set score=score+5 where score between 55 and 60
D. Update grade set score=score+5 where score>=55 and score<=60

177/300【单选】
现有书目表book，包含字段:价格price(float)，类别tvpe(char):现在查询各个类别的平均价格、类别名称，以下语句正确的是()。
A. select avg(price),type from book group by type
B. select count(price),type from book group by price
C.select avg(price),type from book group by price
D. select count (price),type from book group by type

178/300【单选】
update student set s_name=’王军’wheresid=1该代码执行的是哪项操作?()。
A.添加姓名叫王军的记录
B.删除姓名叫王军的记录
C.返回姓名叫王军的记录
D.更新姓名叫王军的记录

179/300【判断】
某查询语句中的条件中有(姓名like”%海)子句，在查询结果中可能含有“刘大海”。()
A.正确
B. 错误

180/300 【单选】
某商场管理系统中的商品数据被员工恶意删除、修改，导致商品信息出错。这主要属于信息系统应用安全风险中的()。
A.人为因素
B.网络因素
C.硬件因素
D.自然灾害

181/300【单选】
密码作为保障信息安全的基本方法，应该()。
A.使用个人的出生日期作为密码
B.使用空密码
C.在任何场合都使用相同的密码
D.设置安全复杂的密码定期更换

182/300 【单选】
防火墙是一种将内部网和公众访问网分开的方法它实际上是一种()。
A.字符串匹配技术
B.防病毒技术
C.入侵检测技术
D.访问控制技术

183/300 【判断】
格式化过后的计算机，原来的数据就找不回来了。()
A.正确
B. 错误

184/300 【判断】
计算机信息系统的安全威胁同时来自内、外两个方面。()
A.正确
B.错误

185/300【多选】
可能会遇到以下哪些形式的钓鱼()?
A.姜太公钓鱼
B.克隆网站钓鱼
C.短信网络钓鱼
D.电子邮件钓鱼

186/300【多选】
当心邮件中的附件信息，不要轻易点击下载诸如 word、pdf、excel、PPT、rar等文件都可能植入木马或间谍程序，尤其是附件中直接带有后缀为()的可执行文件，千万不要点击，同时确保电脑安装了杀毒软件。
未选择
A. .dll
B. .exe
C. .vbs
D. .bat

187/300【单选】
邮箱中收到一封陌生的带附件的邮件，附件名为 KB435287exe升级补丁，你会怎么做()?
A.将补丁下载并分发到同事一起打补丁
B.立即删除并反馈给相关部门
C.立即执行该补丁文件进行系统更新
D.好奇下载到本地进行研究

188/300 【单选】
以下哪种操作不会增加使用邮箱的安全性()?
A.开启安全登录码
B.异地随意登录公司邮箱
C.企业邮箱绑定手机
D.定期修改密码

189/300【单选】
你正在一家酒店开会的时候，需要发送一封紧急的邮件。你带着公司配备的智能手机，可是酒店里的5G网络信号不好，你扫描到了一个开放式的无线网络接入点，便打算通过无线网络传输邮件，这方法正确么()?
A.正确，反正是开放的，无所谓
B. 不正确，开放式的无线网络很慢，且邮件会等很久
C.正确，因为邮件很重要
D.不正确，开放式的无线网络接入点不安全

190/300【单选】
现在信息安全越来越被人们所关注，下列说法正确的是()。
A在计算机和手机只要安装了杀毒软件，就不会感染计算机病毒
B保持个人计算机的卫生，能有效防止计算机病毒的入侵
C.手机系统是安全的，手机APP可以随意下载
D.及时安装系统软件的补丁程序，可以有效防止病毒入侵

191/300【单选】
随意点击未知来源邮件中的链接有什么影响()?
A.影响办公效率
B.无所谓
C.可能中木马、中毒
D.没有影响

192/300【单选】
遇到可疑邮件可以怎么办()?
A.直接响应
B.置之不理
根据邮件导向进行操作
D.电话联系发件人核实后，再次向相关部门确认

193/300【单选】
小王是某公司的员工，正当他在忙于一个紧急工作时，接到一个陌生的电话:“小王您好我是某某系统管理员，咱们的系统发现严重漏洞，需要进行紧急升级，请提供您的账户信息"，以下哪种做法正确() ?
A.配合升级工作，立即提供正确的账户信息
B.事不关己，直接拒绝
C.身份不明确，电话号码不认识，直接拒绝
D.先忙手头工作，再提供账户信息

194/300【单选】
如何确认是否为公司内部邮箱()?
A.签名中有公司logo
B.正文中有公司上级领导的名字
C.有公司相关信息
D.发件人后缀是@hongyaa.com结尾的一级域名

195/300 【单选】
下列不属于常见爬虫类型的是()。
A.通用网络爬虫
B.增量式网络爬虫
C.浅层网络爬虫
D.聚焦网络爬虫

196/300【单选】
下列不属于聚焦网络爬虫的常用策略的是()。
A.基于深度优先的爬取策略
B.基于内容评价的爬取策略
C.基于链接结构评价的爬取策略
D.基干语境图的爬取策略

197/300【单选】
下列不属于常用反爬虫手段的是()。
A.访问频度
B.验证码校验
C.账号权限
D. 人工筛选

198/300 【单选】
下列属于反爬虫目的的是()。
A.限制访问人数
B.防止网站信息被竞争对手随意获取
C.限制用户访问权限
D.变换网页结构

199/300 【单选】
下列关于Python爬虫库的功能，描述不正确的是()。
A.通用爬虫库-urllib3
B.通用爬虫库-Requests
C.爬虫框架-Scrapy
D.HTML/XML解析器pycurl

200/300 【单选】
下列不属于Socket库中的方法是()。
A.服务器端方法
B.公共方法
C.通信方法
D.客户端方法

201 /300 【单选】
下列属于HTTP必须实现的请求方法的是()。
A. GET 与 HEAD
B.POST与 DELETE
C.TRACE和OPTIONS
D.OPTIONS和CONNECT

202/300 【单选】
下列关于HTTP状态码类型描述错误的是()。
A.4XX表示客户端可能发生错误
B.5XX表示服务器可能发生错误
C.1XX表示请求已被服务器接受，无须后续处理
D.3XX表示客户端的请求需采取进一步操作

203/300 【单选】
下列不属于HTTP头部类型的是()。
A.通用头
B.回复头
C.请求头
D.响应头

204/300 【单选】
下列有关Cookie机制描述错误的是()。
A.服务器能通过Cookie识别用户
B.通过Cookie验证后不需重新提交表单
C.Cookie按内存式或硬盘式进行存储
D.Cookie 不存在时效性

205/300 【单选】
下列不属于HTTP请求过程的是()。
A.生成请求
B.超时设置
C.请求重定向
D.搜索文档

206/300 【单选】
下列关于Chrome开发者工具描述错误的是()
A.元素面板可查看元素在页面的对应位置
B.源代码面板可查看HTML源码
C.网络面板无法查看 HTML 源码
D.网络面板可查看HTTP头部信息

207/300 【单选】
下列关于Xpath中功能函数描述错误的是()。
A.contains方法可用于选取以指定值开头的节点
B.and方法可用于选取同时包含两种指定值的节点
C.text函数可用于选取包含指定文本内容的节点
D.text函数可提取节点文本内容

208/300 【单选】
下列关于BeautifulSoup中对象类型描述错误的是()。
A.name方法可以获取及修改Tag对象名称
B.attrs方法可获取 Tag 对象的 HTML属性，返回值为列表形式
C.string方法可获取Tag对象中的文本字符串内容
D.NavigableString对象无法被编辑，但可以进行替换

209/300 【单选】
下列关于JSON模块描述错误的是()。
A.JSON模块可实现在Python中对JSN编码及解码的两种操作
B.将数据存储为JSON文件是一个编码过
C.dump方法可将JSON对象写入文件内
D.dump方法可生成一个字符串

210/300【单选】
下列不属于动态网页的是()。
A.京东首页
B.CSDN首页
C.微博首页
D. Selenium 官网

211/300【多选】
下列Selenium库的方法中，通过元素名称进行多元素定位的是()。
A. find element by name
B. find elements by name
C. find_elements_by_id
D. find_elements_by_class_name

212/300【单选】
下列连接MongoDB数据库的代码中，错误的是()。
A.pymongo.MongoClient()
B. pymongo.MongoClient(27017)
C.pymongo.MongoClient(‘localhost’)
D. pymongo.MongoClient('localhost,27017)

213/300【单选】
表单登录需要使用的请求方法是()
A.GET
B.POST
C. PUT
D.DELETE

214/300【单选】
使用Requests库配置代理IP发送请求的参数是()。
A. proxies
B. agency
C.IP
D. url

215/300 【单选】
获取代理IP的方法有()。
A.VPN
B.IP代理池
C.ADSL宽带拨号
D…以上皆是

216/300【多选】
Requests库甲携带Cookie友送请求的参数是 cookies，它接收的数据类型包括()
A.dict
B.Cookie.Jar
C.list
D.str

217/300 【单选】
关于LWPCookieJar对家，下列说法错误的是()。
A.用于存储和加载 Cookie
B.存储Cookie的方法是save
C.加载Cookie的方法是load
D.FileCookieJar 是LWPCookieJar的子类

218/300【单选】
下列不属于Scrapy框架的基本组成部分的是()
A.引擎与调度器
B.下载器与 Spiders
C.Item Pipelines
D.解析中间件

219/300 【单选】
下列对于Scrapy数据流向描述错误的是()。
A.引擎仅需要负责打开一个网站，并找到该网站的 Spiders,并向该Spiders 请求第一个要爬取的 URL
B.调度器返回下一个要爬取的URL给引擎，引擎将URL通过下载器中间件(请求方向)转发给下载器(Downloader)
C.Spiders处理响应并返回爬取到的ltems及(跟进的)新的请求给引擎解析中间件
D.一旦网页下载完毕，下载器会生成一个该网页的响应，并将其通过下载器中间件(返回响应方向)发送给引擎

220/300 【单选】
下列对于Scrapy常用命令及其作用描述正确的是()。
A.startproject是一个全局命令，主要用于运行一个独立的爬虫
B.genspider是一个项目命令，主要用于创建爬虫模
C.crawl是一个项目命令，主要用于启动爬虫
D. list是一个全局命令，主要用于列出项目中所有可用的爬虫

221/300 【单选】
下列对于Scrapy爬虫项目目录说法错误的是()。
A.spiders 目录用于存放用户编写的爬虫脚本
B.items脚本定义了一个ltem类，能够存储爬取的数据
C. settings脚本用于设置参数
D.pipelines脚本定义了一个Pipeline类，可以根据需求将数据保存至数据库、文件等

222 /300 【单选】
下列对于Scrapy的设置说法错误的是()。
A.Scrapy设置允许自定义所有Scrapy组件的行为，包括核心、扩展、管道和爬虫本身
B.DOWNLOAD DELAY设置能够限制爬取的速度
C.HTTPCACHE ENABLED设置能够启用HTTP缓存，并设置路径
D.DOWNLOADER MIDDLEWARES 设置能够激活用户定制的下载器中间件

223/300 【单选】
以下选项中合法的是()。
A.爬取百度的搜索结果
B.爬取淘宝的商品数
C.出售同学的个人信息
D.为高利贷提供技术服务

224/300【单选】
网站的根目录下有一个文件告诉爬虫哪些内容可以被爬取，这个文件叫做()。
A.rule.txt
B. spider.txt
C. network.txt
D. robots.txt

225/300 【单选】
()是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
A.MapReduce
B.IBM
C.Nutch
D.Hadoop

226 /300[单选]
HDFS中的数据块(block)默认保存几份?()
A.3份
B.2份
C.1份
D.不确定

227/300[单选]
Hadoop集群中存在的最主要瓶颈是()。
A.CPU
B.网络
C.磁盘IO
D.内存

228/300[单选]
关于MapReduce的说法正确的是()。
A.MapReduce1.0用YARN框架来进行资源调度的
B.MapReduce是基于内存计算的框架
C.MapReduce是分布式文件存储系统
D.MapReduce1.0既是一个计算框架又是一个资源调度框架。

229/300[单选]
关于Hadoop MapReduce 分片 (split)概念，下列说法不正确的是()
A.Hadoop为每个split创建一个Map任务
B.split的多少决定了Map任务的数目
C.大多数情况下，理想的分片大小是一个HDFS块对应个split。
D.split 是一个物理概念。

230/300[单选]
Hadoop组件在企业应用中，能用于数据挖掘的产品()
A.Hive
B.Pig
C.Mahout
D.Hbase

231/300[单选]
以下关于Hive操作描述不正确的是()
A.Hive是一个建立在hadoop文件系统上的数据仓库架构，可以用其对HDFS上
B.Hive依赖于MapReduce处理数据
C.Hive的加载数据时候，可以用1ocal进行修饰，表示从某个本地目录下加载数据
D.Hive一般可以用于实时的查询分析

232/300[单选]
关于HBase下面说法正确的是()。
A.HBase是一个稀疏、多维度、排序的映射表，这张表的索引是行键、列。
B.每个值是一个未经解释的字符串，没有数据类型程序员要自己去对它进定义。
C.用户在表中存储数据，每一行都有一个可排序的行键和任意多的列。
D.以上说法都正确

233/300[单选]
配置JDK环境变量时，需要对下列哪个文件进行修改
A.hadoop-env.sh
B.core-site.xml
C.hdfs-site.xml
D. profile

234/300[单选]
面选项中哪一项可以单独启动namenode进程命令
A.hadoop-daemon.sh start namenode
B.hadoop-daemon.sh namenode start
C.start namenode hadoop-daemon.sh
D.start hadoop-daemon.sh namenode

235/300[单选]
以下对Hadoop主要配置文件描述正确的是()
A.core-site.xm1:Hadoop核心全局配置文件，可在其它配置文件中引用该文件
B.hdfs-site.xm1:HDFS配置文件，继承core-site.xml配置文件。
C.mapred-site.xm1:MapReduce配置文件，继承core-site.xml配置文件
D.以上都正确

236/300[单选]
启动Hadoop集群，要启动内部的集群框架是下列的哪个选项()。
AHadoop集群和HDFS集群框架
BYARN集群和MapReduce集群框架
C.HDFS集群和YARN集群框架
D.HDFS集群和MapReduce集群框架

237/300[单选]
在下列哪个配置文件中可以修改数据块的副本数量
A. core-site.xml
B.hdfs-site.xml
C.slaves
D.hadoop-env.sh

238/300[单选]
Hadoop集群启动完成后，通过jps指令查看各节点的服务进程，主节点上一定会存在下列哪个进程()
A.NodeManager
B.NameNode
C.DataNode
D.SecondaryNameNode

239/300[单选]
Hadoop集群的计算资源是由以下哪一项进行管理
A.NameNode
B.DataNode
C.ResourceManager
D.NodeManager

240/300[单选]
下面哪个选项负责HDFS数据存储
A.NameNode
B.DataNode
C.SecondaryNameNode
D.NodeManager

241/300[多选]
下面关于Hbase的特性描述正确的是()
A高可靠性
B.高性能
C.面向列
D可伸缩

242/300[多选]
下列哪些选项是安装HBase前所必须安装的?
A操作系统
B.JDK
C.Shell Script
D.Java Code

243/300[多选]
HBase官方版本可以安装在()操作系统上
A.CentOS
B.Ubuntu
C.RedHat
D.Windows

244/300[多选]
关于HadoopHDFS块的设计的优点，下面说法正确的是()
A支持大规模的文件存储
B.简化系统设计
C.适合数据备份
D.能够实现余备份机制

245/300[多选]
对于Hadoop中client上传文件的描述正确的是
A.数据经过NameNode传递给DataNode。
B.Client端将文件以Block为单位，管道方式依次传到DataNode。
C.Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作
D.当某个DataNode失败，客户端会继续传给其它DataNode.

246/300[多选]
下列选项中,哪些不是Spark的重要角色()。
A.Nodemanager
B.Resourcemanager
C.Worker
D. Driver

247/300[多选]
以下属于HiveSQL中DDL(数据定义语言)的是?
A修改表
B.删除表
C.数据导入
D.建表

248/300[多选]
Spark适用于以下哪些场景?
A.交互式查询
B.实时流处理
C.批处理
D.图计算

249/300[多选]
以下哪些是Kafka实际的应用场景?
A.网站活性跟踪
B.日志收集
C.聚合统计系统运营数据(监控数据)
D.资源管理

250/300[多选]
flink支持的时间操作类型包括以下哪些选项?
A.结束时间
B.处理时间
C.采集时间
D.事件时间

251【多选】下列属于Flume数据监控的指标是？
A. Sink 写入数据量
B. Datanode 数量
C. Channel 缓存数据量
D. Source 接受数据量

252【多选】调用Zookeeper客户端命令中包含哪些信息？
A. Ip地址
B. 端口号
C. 服务器名称
D. 用户名

253【多选】以下关于Kafka Partition说法正确的有？
A. 引入Partition机制，保证了Kafka的高吞吐能力。
B. 每个Partition都是有序且不可变的消息队列。
C. Partition数量决定了每个consumer group中并发消正确费者的最大数量。
D. 每个Partition在存储层面对应一个log文件。

254【多选】以下哪些是Spark服务的常驻进程？
A. JobHistory
B. JDBCServer
C. SparkResource
D. NodeManager

255【多选】基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力，如下属于分布式存储组件的有？
A. MapReduce
B. Spark
C. HDFS
D. HBase

256【多选】Hadoop通过ResourceManager对集群资源进行管理，它的主要功能有？
A. 集群资源调度
B. 应用程序管理
C. 集群资源管理
D. 日志管理

257【多选】以下关于Hadoop的HDFS描述正确的有？
A. HDFS由NameNode, DataNode, client组成。
B. HDFS备 NameNode上的元数据是主NameNode同步过去的。
C. HDFS采用就近的机架节点进行数据的第一副本存储。
D. HDFS适合写一次，多次读取的读写。

258【多选】Hadoop系统中 YARN支持哪些资源类型的管理？
A. 内存
B. CPU
C. 网络
D. 磁盘空间

259【多选】以下哪些是Spark可以提供的功能？
A. 分布式内存计算引擎
B. 分布式文件系统
C. 集群资源的统一调度
D. 流处理功能

260【多选】YARN客里调度器的主要特点有哪些？
A. 容里保证
B. 灵活比
C. 多重租赁
D. 动态更新配置文件

261【多选】Spark可以接收哪些来源的数据？
A. YARN
B. HDFS
C. HIVE
D. HBase

262【多选】关于SecondaryNameNode哪项是正确的？
A. 它是NameNode的热备
B. 它对内存没有要求
C. 它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间
D. SecondaryNameNode应与NameNode部署到一个节点

263【多选】下面哪个组件可以在Hadoop集群中代替MR做一些计算？
A. Spark
B. Sqoop
C. Hive
D. Avro

264【多选】Hadoop MapReduce对外提供了5个可编程组件，以下哪个选项中的方法或任务不全在这5个编程组件中？
A. Partitioner和Combiner
B. Split和Sort
C. InputFormat和OutputFormat
D. Mapper和Reducer

265【多选】YARN主要包含的模块有以下哪些？
A. ApplicationMaster
B. ResourceManager
C. NodeManager
D. QuorumJournalManager

266【多选】下面哪些不是Hadoop2.x的组件？
A. Spark
B. Hive
C. HBase
D. Yarn

267【判断】HQL中删除表的命令是deletetable。
A. 正确
B. 错误

268【判断】安装完全分布式Apache Hadoop的核心配置文件有core-site.xml,hdfs-site.xml,mapred-site.xmlyarn-site.xml。
A. 正确
B. 错误

269【判断】Hdfs，yarn，hbase，以及spark资源监控，spark任务监控的默认web端口分为50070808816010，8080,4040。
A. 正确
B. 错误

270【判断】spark的on yarn client模式启动命令为spark-submit–master yarn-client或spark-shell --master yarn-client。
A. 正确
B. 错误

271 【判断】MapReduce设计的一个理念就是“计算向数据靠拢”，而不是“数据向计算靠拢”，因为，移动数据需要大量的网络传输开销。
A. 正确
B. 错误

272【判断】Flume的数据流可以根据headers的信息发送到不同的channel中。()
A. 正确
B. 错误

273【判断】Secondary namenode就是namenode出现问题时的备用节点。
A. 正确
B. 错误

274【判断】HDFS分布式文件系统不可以调整冗余数据存储的位置。
A. 正确
B. 错误

275【判断】HDFS中当数据节点发生故障，或者网络发生断网时，名称节点就无法收到来自一些数据节点的心跳信息，这时，这些数据节点就会被标记为“宕机”，节点上面的所有数据都会被标记为“不可读”，名称节点不会再给它们发送任何I/0请求。
A. 正确
B. 错误

276/300【判断】
HDFS 中每个数据节点会定期向名称节点发送信息，向名称节点报告自己的状态。
A ．正确
B ．错误

277/300【判断】
Hadoop 框架是用 Java 实现的，所以 MapReduce 应用程序则一定要用 Java 来写。
A ．正确
B ．错误

278/300【判断】
MapReduce 的核心理念是将一个大的运算任务分解到集群每个节点上，充分运用集群资源，缩短运行时间。
A ．正确
B ．错误

279/300【判断】
Sink 取走数据并写入目的地后，会将 event 从 channel 中删除（)。
A ．正确
B ．错误

280/300【判断】
Flume 中 source 必须确切的与一个 channel 关联（)。
A ．正确
B ．错误

281/300【判断】
Kafka 日志的清理方式有两种： delete 和 compact 。默认值是 delete 。()
A ．正确
B ．错误

282/300【判断】
HDFS 存储数据时，关键数据根据实际业务需要保存在具有高度可靠性的节点中，通过修改 DataNodo 的存储策略，系统可以将数据强制保存在指定的节点组中。()
A ．正确
B ．错误

283/300【判断】
Spark on Yarn - client 适合用于生产环境是因为可以更快的看到 APP 的输出。()
A ．正确
B ．错误

284/300【判断】
Zookeeper 所有节点都可以处理读请求。()
A ．正确
B ．错误

285/300【判断】
HBase 可以有列，可以没有列族（ column family )。
A ．正确
B ．错误

286/300【判断】
ApplicationMaster 采用轮询的方式通过 RPC 协议向 ResourceManager 申请和领取资源（)
A ．正确
B ．错误

287/300【判断】
Hive 不支持超时重试机制。()
A ．正确
B ．错误

288/300【判断】
假设 HDFS 在写入数据是只存2份，那么在写入过程中， HDFS Client 先将数据写入DataNode1，再将数据写入DataNode2。()
A ．正确
B ．错误

289/300【判断】
Flume 架构中，一个 sink 可以连接多个 channel 。()
A ．正确
B ．错误

290/300【判断】
Kafka 是一个高吞吐，分布式，基于发布订阅的消息系统，利用 kafka 技术可在廉价 PCServer 上搭建起大规模消息系统。
A ．正确
B .错误

291/300【判断】
Flink 是一个批处理和流处理结合的统一计算框架，其核心是一个数据分发以及并行计算的流数据处理引擎。
A ．正确
B ．错误

292/300【判断】
Spark Streaming 计算基于 DStream 将流式计算分解成一系列短小的批处理作业（)
A ．正确
B ．错误

293/300【判断】
导入数据到 Hive 表时不会检查数据合法性，只会在读取数据时候检查。
A ．正确
B .错误

294/300【判断】
Flume 的 properties . protertises 配置文件中可以配置多个 channel 来传输数据。
A ．正确
B ．错误

295/300【判断】
Hive 中" Group by "指的是通过一定的规则将每一个数据集划分成若干个小的数据集然后针对若干个小的数据集进行数据分组处理。
A ．正确
B ．错误

296/300【判断】
HBase 的最小存储单元是 Region 。
A ．正确
B ．错误

297/300【判断】
Hive 是一种数据仓库处理工具，使用类 sql 的 HiveSql 语言实现数据查询功能，所有 Hive 的数据都存储在 HDFS 中。
A ．正确
B ．错误

298/300【判断】
Hadoop 系统中，如果 HDFS 文件系统的备份因子是3，那么 MapReduce 每次允许 task 都是从3个有副本的机器上传输需要的处理文件。()
A ．正确
B ．错误

299/300【判断】
MapReduce 过程中、默认情况下，一个分片就是一个块，也是一个 maptask 。
A ．正确
B ．错误

300/300【单选】
Requests 模块中， headers 参数的作用是（)。
A ．输入网址
B ．模拟浏览器
C .提供代理 ip
D ．设置超时时间

标签：大数据数据分析信息可视化

本文转载自: https://blog.csdn.net/weixin_51988549/article/details/131135108
版权归原作者 unicorn－x 所有，如有侵权，请联系我们删除。

校内大数据课题目

发表评论

“校内大数据课题目”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航