Part 1 大数据模块(3题):
1、以下关于特征选择中的互信息法描述中,理解正确的是哪些?(多选题)
A.互信息法是从信息熵的角度分析特征和输出值之间的关系评分
B.在Python工具的sklearn模块中,可使用mutual_info_classif(分类)和mutual_info_regression(回归)来计算各个输入行征和输出值之间的互信息
C.互信息的结果对离散化的方式不敏感
D.互信息值越大,说明该特征和输出值之间的相关性越大,越需要保留
E.互信息法属于一种过滤算法,此类算法独立于任何模型
正确答案:ABDE
2、针对以下描述,属于大数据实时检索技术场景并且对应场景特点描述均正确的是哪些?(多选题)
A.要求1秒以内响应,高并发(100以上请求)查询条件复杂(80%查询是主键查询),其他是简单条件组合查询,使用ElasticSearch作为检索引擎
B.运营商话费明细清单查询场景,主要根据ID(用户手机号码)、时间段进行用户话费清单、流量清单查询,使用HBase作为查询组件
C.车联网进行快速车辆信息检索场景,根据ID(身份证、车牌号等)进行查询可用于实时布控、车辆轨迹绘制,快速完成信息汇集,使用ElasticSearch作为检索引擎
D.运营商用户信息查询场景,可用于根据用户信息表多个字段进行关联查询,并对查询结果进行汇聚、分析
正确答案:BC
3、在本机通过Beeline连接hive,执行LOAD DATA LOCAL INPATH ‘home/xiaoming/.txt' OVERWRITE INTOTABLE tb1;语句,下列描述正确的是?(单选题)
A.将HDFS目录/home/xiaoming/下匹配到txt后缀的文件导入数据表tb1,覆盖原来的数据表
B.将本机目录/home/xiaoming/下匹配到txt后缀的文件导入数据表tb1,覆盖原来的数据表
C.将HDFs目录/home/xiaoming/下匹配到txt后缀的文件导入数据表tb1,追加到原来的数据表
D.将本机目录/home/xiaoming/下匹配到文件名是.txt的文件导入数据表tb1,追加到原来的数据表
E.将本机目录/home/xiaoming/下匹配到文件名是.txt的文件导入数据表tb1,合并到原来的数据表
正确答案:B
Part 2 AI模块(9题):
1、在无人驾驶汽车的场景中,计算机视觉技术被广泛应用于环境感知和决策制定。这些环境可能包括各种天气条件、不同的道路类型、以及各种交通参与者(如行人、自行车、其他汽车等)。在这些情况下,无人驾驶汽车需要准确地识别和理解其周围环境,以做出安全和有效的驾驶决策。以下关于计算机视觉在无人驾驶中的应用,正确的有哪些项?(多选题)
A.通过目标检测类算法,计算机视觉可以实现对道路、行人、车辆等物体的准确识别。
B.利用SLAM技术,可以实现对环境的三维重建,有助于无人驾驶汽车的导航和路径规划。
C.立体视觉可以用于估计物体的深度信息,有助于无人驾驶汽车避免碰撞。
D.计算机视觉无法处理在复杂环境下的场景理解,如雨天、雪天等恶劣天气。
正确答案:ABC
2、在机器翻译或者文本摘要等自然语言处理场景中,需要理解和生成自然语言来完成特定的任务。不同的文本可能包括不同的语言、语境和语气(如正式、非正式、口语、书面语等)。在这些情况下,自然语言处理系统需要使用不同的技术以准确地理解和生成语言。以下关于自然语言处理的描述,正确的是哪一项?(单选题)
A.词嵌入是一种将词语映射到高维空间的技术,使得语义相近的词语在高维空间中的距离较远。
B.循环神经网络(RNN)由于其循环结构,无法处理序列数据,如文本。
C.Transformer模型中的自注意力机制可以捕捉序列中的长距离依赖关系。
D.在处理自然语言任务时,模型无需考虑上下文信息,因为每个词语都是独立的。
正确答案:C
3、在智能家居设备的应用中,语音识别技术被广泛用于设备控制和用户交互。这些设备可能包括各种智能音箱、智能电视、智能空调等。在这些情况下,智能家居设备需要准确地识别和理解用户的语音指令,以提供准确和便捷的服务。以下关于语音识别在智能家居设备中的应用,正确的有哪些项?(多选题)
A.传统算法结合深度学习,语音识别可以实现对用户语音的准确识别。
B.利用语音理解技术,可以实现对用户语音的模拟,有助于智能家居设备的交互。C.语音识别可以用于理解用户的意图习惯,有助于智能家居设备提供个性化服务。
D.通过鲁棒性算法和降噪技术,语音识别可以较好地实现在噪声环境中的语音理解。
正确答案:ACD
4、在深度学习领域,MindSpore作为华为推出的一款全场景AI计算框架,已经在众多AI应用中得到了广泛的应用。MindSpore深度学习框架可以支持一行代码切换动态图和静态图模式以及在不同芯片上运行,适合工业界和学术界的不同开发场景。下列哪一项是MindSpore设置动态图并在昇腾芯片上运行的代码?(单选题)
A.mindspore.set_context(mode=mindspore.PYNATIVE_MODE,device_target='Ascend')。
B.mindspore.set_context(mode=mindspore.GRAPH_MODE,device_target='Ascend')。
C.mindspore.set_context(mode=mindspore.PYNATIVE_MODE,device_target='GPU')。
D.mindspore.set_context(mode=mindspore.GRAPH_MODE,device_target='GPU')。
正确答案:A
5、在深度学习框架MindSpore中,动态图和静态图是两种重要的计算模式。它们各自具有独特的特性和优势。以下关于MindSpore动态图和静态图特性的描述,正确的有哪些项?(多选题)
A.动态图模式下,程序按照代码的编写顺序执行,在执行正向过程中根据反向传播的原理,动态生成反向执行图。
B.静态图模式下,程序在编译执行时先生成神经网络的图结构,然后再执行图中涉及的计算操作。
C.静态图模式比较适合网络固定且需要高性能的场景。
D.在动态图模式下,没有Python语法限制。
正确答案:ABCD
6、某公司正在开发一款自动驾驶汽车,他们希望汽车能够实时检测到路上的行人、车辆、交通标志等物体,以便做出正确的驾驶决策。为了实现这个目标,他们选择使用YOLO算法进行实时的物体检测。以下关于YOLO算法的描述,正确的是哪一项?(单选题)
A. YOLO算法将图像分割成多个小格子,每个格子预测多个边界框和类别概率
B. YOLO算法无法处理实时物体检测任务
c. YOLO算法需要预先确定物体的大小和位置
D. YOLO算法无法检测小物体
正确答案:A
7、某新闻推荐平台希望通过用户的历史阅读记录来预测用户未来可能感兴趣的新闻类型。他们收集了用户在过去一年中阅读的新闻文章,并记录了每篇文章的主题、发布时间、阅读时长等信息。为了更准确地预测用户的阅读兴趣,他们选择了LSTM算法来处理这个问题。以下关于LSTM算法的描述,正确的有哪些项?(多选题)
A.LSTM算法具有长期记忆能力,可以处理长序列数据
B.LSTM算法中的门控机制可以有效地解决梯度消失和梯度爆炸问题
C.LSTM算法无法处理时间序列数据
D.LSTM算法中的隐藏状态可以在整个序列中传递信息
E.LSTM算法需要预先确定序列的长度
正确答案:ABD
8、假设你是一家全球领先的电商公司的首席数据科学家,你正在研究如何使用机器学习技术来提高产品销售。你的团队已经收集了大量的用户行为数据,包括用户的浏览历史、购买历史、搜索关键词等。你决定使用集成学习算法来预测用户是否会购买某个产品。在众多的集成学习算法中,你选择了随机森林算法作为你的模型。以下哪个选项最能描述随机森林算法的工作原理?(单选题)
A.随机森林算法通过创建多个决策树,并将它们的预测结果进行平均,以得到最终的预测结果。
B.随机森林算法仅使用一个决策树进行预测,但是它会随机选择特征进行分割。
C.随机森林算法通过创建多个强学习器,并将它们的预测结果进行平均,以得到最终的预测结果。
D.随机森林算法仅使用一个强学习器进行预测,但是它会随机选择特征进行分割。
正确答案:A
9、在一个金融科技公司,数据科学家们正在使用机器学习模型预测用户的信用评分。他们决定使用集成学习方法来提高预测的准确性。以下哪些算法是集成学习的一种?(多选题)
A.随机森林
B.AdaBoost
C.梯度提升树
D.线性回归
E.支持向量机
正确答案:ABC
Part 3 云模块(8题):
1、C公司是一家初创公司,主要业务是订餐服务,主要产品是APP+小程序。所有业务均部署在华为云上,现需要根据业务需求,设计华为云上的业务架构。现已知业务需求如下(1)、业务完成部署后,由客户自行运维管理,该企业仅有一名IAAS层的运维工程师;(2)节假日会有活动,存在不可预期的业务压力突增需求;(3)、由于涉及到用户优惠券发放、用户支付等场景,对数据库的安全可靠有非常高的要求;(4)、企业初创期间,访问量较小,需要尽量控制成本,同时要考虑后续业务增长后,架构可平滑扩展以支持业务发展。
根据以上需求,你会如何为C公司进行架构设计?(单选题)
A.采用ECS+AS+ELB的组合支撑应用层,采用主备模式的RDS实例支撑数据层,并定期对数据进行备份
B.采用ECS+AS+ELB的组合支撑应用层,采用单节点模式的RDS实例支撑数据层,并定期对数据进行备份
C.采用CCE+ELB的组合支撑应用层,采用主备模式的RDS实例支撑数据层,并定期对数据进行备份
D.采用CCE+ELB的组合支撑应用层,采用单节点模式的RDS实例支撑数据层,并定期对数据进行备份
正确答案:A
2、某图片服务商对外提供高清图片以供用户二次创作,这些图片均通过网页方式为其用户呈现(用户支付费用后,该图片服务商提供相应的下载链接给到其用户)。当前有近160TB的存量数据,存放于该图片服务商自有的小型数据中心,还会源源不断的产生新的数据(平均每月2TB左右),对于存量数据,还会根据其用户需要下载下来进行加工的需求。现在该图片服务商要将所有的图片数据迁移到华为云,你作为一名对接该客户的云服务架构师,你认为如下哪个方案是最优方案?(单选题)
A.存量数据和后续新增的数据均通过DES数据快递服务完成迁移,迁移到OBS桶中
B.存量数据和后续新增的数据均通过DES数据快递服务完成迁移,迁移到SFS文件服务中
C.存量数据采用DES一次性完成迁移,然后通过CSG云存储网关服务将后续新增数据持续同步至云上OBS
D.存量数据采用DES一次性完成迁移,然后通过CSG云存储网关服务将后续新增数据持续同步至云上SFS
正确答案:C
3、某大型快消品集团正在为其云下数据库迁移到云上寻找方案。由于其数据量庞大,云下数据库采用自研分布式中间件实现水平分库(MySQL 5.7),后端多个分片由多台虚拟机承载。客户希望迁移上云后,能充分发挥云服务便捷、弹性等优势,帮助集团快速完成数字化转型的同时,又需要性能能满足企业未来几年的业务增长需求,且迁移过程尽可能缩短停服时长。如下方案中,能满足客户需求的最佳方案是哪一个?(单选题)
A.使用SMS主机迁移服务,将云下分布式数据中间件主机及数据库分片主机均迁移到华为云上的ECS弹性云服务器
B.使用SMS主机迁移服务完成分布式数据库中间件主机的迁移,然后使用DRS数据复制服务将后端数据平迁到华为云上的RDS数据库服务实例
C.云上创建DDM+DRS的分布式数据库架构,然后为云下数据库实例分别创建DRS实时迁移任务将数据迁移至DDM
D.将云下数据库数据分别导出后,上传到云上导入RDS实例
正确答案:C
4、某单位的福利性消费券业务由报名和登记2个子业务系统构成,该业务所有系统均跑在华为云上,为方便问题定位,该2个子业务系统需要进行日志采集,且根据政策要求,所有日志均需要长期存储,近30天的日志需要被实时检索。已知该2个子业务系统均运行在多个ECS弹性云服务器上,请问,考虑成本因素,在华为云上,该2个子业务系统的日志采集和配置方案中,如下哪个方案最好?(单选题)
A.使用华为云上的LTS日志服务,将2个子业务系统放到同一个日志组下的同一个日志流进行日志采集,并配置30天的存储,同时配置日志转储,将日志转储到OBS桶中长期存储。
B.使用华为云上的LTS日志服务,将2个子业务系统放到同一个日志组下的不同日志流进行日志采集,并配置30天的存储,同时配置日志转储,将日志转储到OBS桶中长期存储。
C.使用ECS自建ELK日志系统,然后通过Logstash分别对2个子业务系统日志进行采集,并配置从Kafka将日志转储至OBS进行长期存储,使用Kibana进行可视化日志检索。
D.登录到每个子业务系统运行的多个ECS上手动采集日志,使用文本工具进行检索,并手动将日志上传到OBS桶中保存。
正确答案:B
5、某地医保平台经过统一的微服务改造后,所有业务系统运行在华为云上的CCE容器引擎上,并通过ServiceStage平台对这些服务进行统一的运维管理,在业务全链路压测阶段,发现个别微服务总是请求失败,导致整个医保服务不可用的情况,针对该问题,首选想到使用服务治理的方式进行解决,如下关于该问题的分析及提供的解决方案的描述,正确的有哪些项?(多选题)
A.对请求失败的微服务进行分析,如果是资源不足造成请求失败,则可通过对该微服务单独扩容后再进行测试
B.对请求失败的微服务进行分析,如果是资源不足造成请求失败,则可通过服务治理中的负载均衡策略,将请求流量均衡到其他实例上
C.对整体服务进行分析,如果该请求失败的微服务不影响当前整体医保业务逻辑,则可通过服务治理中的降级策略或熔断策略,屏蔽该微服务的访问,避免其造成整体服务的宕机
D.对整体服务进行分析,如果该请求失败的微服务对整个医保业务逻辑至关重要,但是一旦并发达到一定量就必然报错影响整个业务逻辑,则可通过服务治理中的限流策略,控制访问该微服务的请求量大小,避免流量冲击破坏整个医保系统
正确答案:ACD
6、某基金管理平台运行在华为云上,采用标准的三层架构(接入、应用、数据),接入层对外提供Web页面,应用层实现主要业务逻辑,接入和应用层都是运行在ECS弹性云服务器上,数据层采用华为DDM+DRS的组合,实现分布式数据存储。该平台的安全方面要求甚高,如下哪些方案你会向客户进行推荐?(多选题)
A.三层架构之间通过安全组严格控制访问端口,应用层只开放指定端口供接入层访问,数据层只开放指定端口供应用层访问
B.接入层前面添加WAF应用防火墙,识别并阻断SQL注入、跨站脚本攻击、网页木马上传等,保护接入层的Web服务安全稳定
C.接入层和应用层的ECS开启HSS主机安全防护功能可有效防止网页被篡改
D.接入层使用共享型ELB作负载均衡时,监听器的前端协议和后端协议均选择HTTPS协议
E.企业运维人员统一通过CBH云堡垒机的方式接入到基金管理平台,对相关资源进行统一运维,由CBH实例对相关运维操作进行审计
正确答案:ABCE
7、某互联网创业公司设立了开发部、测试部和运维部,对应着华为云上的开发环境、测试环境和生产环境,环境之间需要严格隔离,同时又有点对点互通的需求(方便版本包传递等),为了保证工作效率,三个部门的所有员工在华为云上均有自己的账号。该公司要求严格控制网络访问和员工权限,关于几个环境的网络规划和员工权限的管理,如下方案描述中,合理的方案有哪些项?(多选题)
A.开发环境、测试环境和生产环境放到3个独立VPC,通过VPC Endpoint实现点对点互通需求
B.开发环境、测试环境和生产环境放到同一个VPC下的不同子网,通过网络ACL隔离
C.为所有员工创建IAM用户,单独授权
D.为所有员工创建IAM用户,并根据部门进行分组,给分组授权
正确答案:AD
8、某秒杀应用涉及多个微服务,全部部署到华为云上后,在业务正式上线前,需要模拟大量用户并发以完成全链路压测,检测各个微服务及整个应用系统的健壮性和性能,并能为应用侧快速发现性能问题,假设你作为一名架构师,如下哪些方案有助于完成本次任务?(多选题)
A.使用华为云上的性能测试CodeArts PerfTest平台,通过现有模板快速创建PerfTest测试工程,对秒杀业务接口执行测试
B.可通过客户本地导出的JMeter测试工程文件,在CodeArts PerfTest平台创建JMeter测试工程,对秒杀业务接口执行测试
C.压测过程中,配合ServiceStage平台的应用拓扑分析和调用链跟踪工具,实现微服务调用关系和异常访问的监控,帮助性能问题的快速定位
D.压测过程中,当发生业务接口响应异常时,通过CES查看业务应用使用的基础资源监控信息,可快速判断是否为资源负载过高导致,有助于问题快速定位
正确答案:ABCD
版权归原作者 gaogao_jack 所有, 如有侵权,请联系我们删除。