此为第一章绪论部分
一. 单选题
- 移动运营商对客户的流失进行预测,可以使用下面哪种机器学习方法比较合适( )
A. 一元线性回归分析
B. 关联方法
C. 聚类算法
D. 多层前馈网络
正确答案: A
- 下面哪种说法有关机器学习的认识是错误的?( )
A. 高质量的数据、算力和算法对一个机器学习项目是必不可少的。
B. 深度学习是机器学习的一类高级算法,可以处理图像、声音和文本等复杂数据。
C. 机器学习算法很多,后期出现的算法比早期出现的算法性能好。
D. 机器学习可以在一定程度上模仿人的学习,并能增强人的决策能力。
正确答案: C
- 以下哪个步骤不是机器学习所需的预处理工作( )
A. 数值属性的标准化
B. 变量相关性分析
C. 异常值分析
D. 与用户讨论分析需求
正确答案: D
- 数据预处理对机器学习是很重要的,下面说法正确的是( )
A. 数据预处理的效果直接决定了机器学习的结果质量
B. 数据噪声对神经网络的训练没什么影响
C. 对于有问题的数据都直接删除即可
D. 预处理不需要花费大量的时间
正确答案: A
- 谷歌新闻每天收集非常多的新闻,并运用( )方法再将这些新闻分组,组成若干类有关联的新闻。于是,搜索时同一组新闻事件往往隶属同一主题的,所以显示到一起。
A. 回归
B. 分类
C. 聚类
D. 关联规则
正确答案: C
- 机器学习项目实施的过程中错误的说法是( )
A. 机器学习合适算法的选择在分析前一般很难确定
B. 这是数据分析师的工作,不需要用户参加
C. 很多机器学习工具遵循一定的机器学习步骤
D. 机器学习的过程不是简单的
正确答案: B
- 机器学习方法传统上可以分为( )类。
A. 3
B. 7
C. 4
D. 2
正确答案: A
- 有关机器学习工程师下面说法正确的是( )
A. 不需要了解一定的相关业务知识
B. 不需要熟悉数据的提取和预处理
C. 需要一定的数据分析实际项目训练
D. 培训后就能胜任实际数据分析
正确答案: C
- 哪种开发语言最适合机器学习?( )
A. HTML
B. Python
C. C
D. Java
正确答案: B
- 移动运营商对客户进行细分,以设计套餐和营销活动,可以使用下面哪种机器学习方法( )
A. 贝叶斯分类器
B. 关联方法
C. 聚类算法
D. 多层前馈网络
正确答案: C
- 以下关于特征选择的说法正确的是?
A. 选择的特征越少越好
B. 选择的特征需尽可能反映不同事物之间的差异
C. 选择的特征越多越好
D. 以上说法均不对
正确答案: B
- 建立一个模型,根据已知的多个变量值来预测其他某个变量值属于数据挖掘的哪一类任务( )
A. 分类规则
B. 回归分析
C. 聚类
D. 信息检索
正确答案: B
- 哪一个是机器学习的合理定义?
A. 机器学习是计算机编程的科学
B. 机器学习从标记的数据中学习
C. 机器学习是允许机器人智能行动的领域
D. 机器学习能使计算机能够在没有明确编程的情况下学习
正确答案: D
- 有关机器学习预处理不正确的说法是( )
A. 预处理是机器学习一个不可少的环节
B. 预处理只要做一次就可以
C. 预处理涉及数据的清洗、格式转换、空值的填补等很多工作
D. 预处理的过程可能本身就是一个机器学习过程
正确答案: B
- 一个计算机程序从经验E中学习任务T,并用P来衡量表现。并且,T的表现P随着经验E的增加而提高。假设我们给一个学习算法输入了很多历史天气的数据,让它学会预测天气。什么是P的合理选择?
A. 正确预测未来日期天气的概率
B. 天气预报任务
C. 计算大量历史气象数据的过程
D. 以上都不是
正确答案: A
- ( )是可用于标记数据的机器学习算法。
A. 聚类算法
B. 关联规则算法
C. 以上都不是
D. 回归算法
正确答案: D
- 维克托·迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据中间的相关关系可以通过以下哪个算法直接挖掘( )。
A. K-means
B. Bayes Network
C. C4.5
D. Apriori
正确答案: D
- 回归问题和分类问题的区别是什么?
A. 回归问题与分类问题在输入属性值上要求不同
B. 回归问题有标签,分类问题没有
C. 回归问题输出值是连续的,分类问题输出值是离散的
D. 回归问题输出值是离散的,分类问题输出值是连续的
正确答案: C
- 哪些机器学习模型经过训练,能够根据其行为获得的奖励和反馈做出一系列决策
A. 以上全部
B. 监督学习
C. 强化学习
D. 无监督学习
正确答案: C
- 2006年IEEE国际数据挖掘会议选出了数据挖掘领域中最重要的10个算法,其中不属于这10类算法的是( )。
A. Apriori算法
B. 支持向量机
C. Adaboost算法
D. 卷积神经网络
正确答案: D
- 机器学习这个术语是由( )定义的?
A. 以上都不是
B. Arthur Samuel
C. James Gosling
D. Guido van Rossum
正确答案: B
- 下列说法正确的是( )。
A. 分类和聚类都是有指导的学习
B. 分类和聚类都是无指导的学习
C. 分类是有指导的学习,聚类是无指导的学习
D. 分类是无指导的学习,聚类是有指导的学习
正确答案: C
- ( )是机器学习的一部分,与神经网络一起工作。
A. 深度学习
B. 人工智能
C. A和B
D. 以上都不是
正确答案: A
- 有关数据质量不正确的说法是( )
A. 错误的数据将可能产生有害于决策的结果
B. 因为数据量很大,所以数据质量差一些也对机器学习没多大影响
C. 数据预处理的重要目的是提高机器学习结果的质量
D. 从业务系统提取的脏数据需要预处理才能进行建模工作
正确答案: B
- 以下说法正确的是( )
A. 机器学习的目的在于从数据中发现有用的信息
B. 机器学习的主要任务是从数据中发现潜在的规律,从而能更好地辅助决策或实现机器自动行动
C. 机器学习只是对计算机仿真方法产生的数据进行模式的发掘
D. 机器学习就是用可视化方法展示数据中的多维度信息
正确答案: B
二. 多选题
26. 机器学习的方法由( )等几个要素构成。
A. 损失函数
B. 优化算法
C. 模型
D. 模型评估指标
正确答案: ABCD
- 下列哪些学习问题不属于监督学习?( )
A. 聚类
B. 回归
C. 分类
D. 降维
正确答案: AD
三. 判断题
28. 根据肿瘤的体积、患者的年龄来判断良性或恶性,这是一个回归问题。
A. 对
B. 错
正确答案: 错
- 大部分的机器学习工程中,数据搜集、数据清洗、特征工程这三个步骤占绝大部分时间,而数据建模,占总时间比较少。
A. 对
B. 错
正确答案: 对
- 已知你朋友的信息,比如经常发email的联系人,或是你微博的好友、微信的朋友圈,我们可运用聚类方法自动地给朋友进行分组,做到让每组里的人们彼此都熟识。
A. 对
B. 错
正确答案: 对
版权归原作者 打算改个好听的名字 所有, 如有侵权,请联系我们删除。