机器学习是人工智能(artifcial intelligence)研究发展到一定阶段的必然产物。
一:机器需要推理能力
二十世纪五十年代到七十年代初,人工智能研究处于“推理期”。那时人们以为只要能赋予机器逻辑推理能力,机器就具有智能。这一阶段的代表性工作主要有 A. Newell 和 H. Simon 的“逻辑理论家”程序以及此后的“通用问题求解”程序等,这些工作在当时取得了令人振奋的结果。例如,“逻辑理论家”程序在1952年证明了著名数学家罗素和怀特海的名著《数学原理》中的38条定理,在1963年证明了全部 52条定理,特别值得一提的是,定理2.85甚至比罗素和怀特海证明得更巧妙。ANewell 和 H. Simon 因为这方面的工作获得了 1975年图灵奖。
二:机器需要有知识
随着研究向前发展,人们逐渐认识到,仅具有逻辑推理能力是远远实现不了人工智能。后续学者认为机器具有智能,就必须设法使机器拥有知识。从二十世纪七十年代中期开始,人工智能研究进入了”知识期”。在这一时期,大量专家系统问世。
但是,人们逐渐认识到,专家系统面临“知识工程瓶颈”,简单地说,就是由人来把知识总结出来再教给计算机是相当困难的。于是,一些学者想到,如果机器自己能够学习知识该多好。
三:机器要能自己学习
事实上,图灵在1950年关于图灵测试的文章中,就曾提到了机器学习的可能;
二十世纪五十年代初已有机器学习的相关研究,
五十年代中后期,基于神经网络的“连接主义”学习开始出现,
在六七十年代,基于逻辑表示的“符号主义”(symbolism)学习技术蓬勃发展,
以决策理论为基础的学习技术以及强化学习技术等也得到发展,
二十多年后红极一时的统计学习理论的一些奠基性结果也是在这个时期取得。
二十世纪八十年代机器学习成为一个独立的学科领域、各种机器学习技术百花初绽。
符号主义
“从样例中学习”的一大主流是符号主义学习。其代表包括决策树和基于逻辑的学习。
典型的决策树学习以信息论为基础,以信息熵的最小化为目标,直接模拟了人类对概念进行判定的树形流程。
基于逻辑的学习的著名代表是归纳逻辑程序设计(Inductive Logic Programming,简称ILP),可看作机器学习与逻辑程序设计的交叉,它使用一阶逻辑(即谓词逻辑)来进行知识表示,通过修改和扩充逻辑表达式来完成对数据的归纳。
符号主义学习占据主流地位与整个人工智能领域的发展历程是分不开的。人工智能在二十世纪五十到八十年代经历了“推理期”和“知识期”,在“推理期”人们基于符号知识表示、通过演绎推理技术取得了很大成就,而在“知识期”人们基于符号知识表示、通过获取和利用领域知识来建立专家系统取得了大量成果,因此,在“学习期”,符号知识表示很自然地受到青睐。事实上,机器学习在二十世纪八十年代正是被视为“解决知识工程瓶颈问题的关键”而走上人工智能主舞台的。
决策树学习技术由于简单易用,到今天仍是最常用的机器学习技术之一。ILP具有很强的知识表示能力,可以较容易地表达出复杂数据关系,而且领域知识通常可方便地通过逻辑表达式进行描述,因此,ILP不仅可利用领域知识辅助学习,还可通过学习对领域知识进行精化和增强。
然而,由于表示能力太强,直接导致学习过程面临的假设空间太大、复杂度极高,因此,问题规模稍大就难以有效进行学习,九十年代中期后这方面的研究相对陷入低潮。
连接主义
二十世纪九十年代中期之前,“从样例中学习”的另一主流技术是基于神经网络的连接主义学习。连接主义学习在二十世纪五十年代取得了大发展,但因为早期的很多人工智能研究者对符号表示有特别偏爱,所以当时连接主义的研究未被纳入主流人工智能研究范畴。尤其是连接主义自身也遇到了很大的障碍,(当时的)神经网络只能处理线性分类,甚至对“异或”这么简单的问题都处理不了。
1983 年,利用神经网络求解“流动推销员问题”这个著名的难题取得重大进展,使得连接主义重新受到人们关注。与符号主义学习能产生明确的概念表示不同,连接主义学习产生的是“黑箱”模型,因此从知识获取的角度来看,连接主义学习技术有明显弱点。然而,由于有一些有效的算法,使得它可以在很多现实问题上发挥作用。
连接主义学习的最大局限是其“试错性”,简单地说,其学习过程涉及大量参数,而参数的设置缺乏理论指导,主要靠手工“调参”;夸张一点说,参数调节上失之毫厘,学习结果可能谬以千里。
统计学习
二十世纪九十年代中期,“统计学习”闪亮登场并迅速占据主流舞台,代表性技术是支持向量机(Support Vector Machine,简称SVM)以及更一般的“核方法”(kernel methods)。这方面的研究早在二十世纪六七十年代就已开始,但直到九十年代中期,统计学习才开始成为机器学习的主流,一方面是由于有效的支持向量机算法在九十年代初才被提出,其优越性能到九十年代中期在文本分类应用中才得以显现;
另一方面,正是在连接主义学习技术的局限性凸显之后,人们才把目光转向了以统计学习理论为直接支撑的统计学习技术。事实上,统计学习与连接主义学习有密切的联系,在支持向量机被普遍接受后,核技巧(kernel trick)被人们用到了机器学习的几乎每一个角落,核方法也逐渐成为机器学习的基本内容之一。
深度学习
二十一世纪初,连接主义学习又卷土重来,掀起了以“深度学习”为名的热潮。所谓深度学习,狭义地说就是“很多层”的神经网络。在若干测试和竞赛上,尤其是涉及语音、图像等复杂对象的应用中,深度学习技术取得了优越性能。
以往机器学习技术在应用中要取得好性能,对使用者的要求较高。而深度学习技术涉及的模型复杂度非常高,以至于只要下工夫“调参”把参数调节好,性能往往就好。因此,深度学习虽缺乏严格的理论基础,但它降低了机器学习应用者的门槛,为机器学习技术走向工程实践带来了便利。
本小节主要使用书籍内容,做了部分删减。
**参考《机械学习》 周志华 清华大学出版社 2016年版 **
版权归原作者 学长小陈来帮你 所有, 如有侵权,请联系我们删除。