近日,图灵奖得主Yann LeCun发表了长达62页的论文,综述了他近10年对于AI行业发展大方向的思考,并对将来10年提出了“自主智能”架构(autonomous intelligence)的新方向。他认为,让机器更加懂得通用智能的关键,就在于“自主”二字。
通用人工智能的困境:举一不能反三
“通用人工智能”(AGI,也即强人工智能)的出现尚显遥远。究其原因,在于当前AI仍高强度依赖于海量的训练数据,与千万乃至上亿级数的被动式监督学习训练,才可实现一点点人类认知能力的复用。
当前AI可使用强大算力处理人类无法顾及的千亿级数据,但在主动的领悟能力方面,可能连2~3岁小朋友都不如。
就像一位老师教学,监督式训练与学习短时间内无法穷举所有可能性,而当相应规则变得复杂,相应数据缺乏,产生的训练数据种类无法穷举,AI就无法进行主动有效的学习。
例如,普通青年平均20小时即可学会开车,能从各类简单规则中举一反三学会驾驶,不必穷举所有情况。
但在拥有极度复杂的道路状况与事故的可能性之下,一个优秀的自动驾驶技术却需要上百万甚至数十亿条标注数据,在虚拟环境中上百万次强化学习才能生成,而其可靠性还不一定比拟人类。
如何让机器具备一定的自主性,从被动接受数据与训练转变成为主动学习,提高学习效率,这便正是图灵奖得主Yann LeCun考虑的方向。
"自主智能"与自主学习:AI未来的方向
Yann LeCun提出了“自主智能”的新架构,其中包含了六个可微模块,每个模块都可容易地计算一些目标函数,以及相对应的梯度估计,并将梯度信息传播到上游模块。
其中包含了:“配置模块”、“感知模块”、“世界模型模块”、“成本模块”、“行动模块"与"短期内存模块”。
配置器(Configurator)是他所构想的新结构中的顶层模块,负责从其他模块中获取输入,并根据任务要求来调节其他模块的参数,从而预先配置感知(perception)、世界模型(world model)、成本(cost)和参与者(actor)的相应值。也使得配置器模块变得更像一个大脑中枢,具备更自主输出结果的能力。
配置器模块的理念与机器学习中的元学习(Meta-learning)相一致。Meta-learning旨在让机器learning to learn,也即让机器通学会学习的方法。
有别于传统机器学习先进行人为调参等工作,然后直接训练特定任务下的深度模型;Meta-learning则是会让机器预先学习所有需要人为设置和定义的参数变量,其中就包括了让机器预先去学习如何预处理数据、选择网络结构、设置超参、定义损失函数等等工作,从这些学习历史中获得的经验让机器拥有了元知识,从而在未来仅需极少量样本,即可快速适应和掌握新的任务。
Meta-learning的理念让机器学习过程变得更加自主,从而很好替代人类工程师许多工作。
LeCun也提出,AI想要突破现在的瓶颈,必须让机器自主学习,从而能够填补缺失的信息,预测将要发生的事情,并预测行动的影响。
用自主学习应对超大规模精细化的未来
同时,由于超大规模的大范围应用场景涌现,以及精细化的个性算法需求激增,使得AI模型的生产呈现大量且多元的趋势,在不同行业、不同场景、不同环境、运行在不同设备上,算法都需要进行大规模的个性化开发。AI的数量规模,有望在未来出现爆炸性增长。
以视觉算法为例,从前的算法仅部署于有限的交通或物业监控摄像头,仅承担识别人脸、车辆等通用功能。但近年来,更加定制化、精细化的算法需求,已经开始摆上各种智慧场景的台面。今后随着硬件出货量的增加与普及,AI会渗透入各行业细枝末节的场景中,比如:
广东的木材加工厂会用到AI,用来识别木料碎屑的堆积情况,及时提醒工人清理避免火灾隐患;内蒙古的奶牛牧场会用到AI,来识别奶牛草料堆积情况并定时给奶牛皮肤浇水;上海的车间工厂需要用到AI,帮助管理员判断员工是否过度疲劳;甚至你住的小区也会用到AI,当老人摔倒、垃圾满溢时,AI都可以做到第一时间响应。
所有这些超大规模的部署场景需求,使得AI无法再像水、电、煤一样进行标准化的供应,AI算法将会依赖于每个行业、每个场景、每个需求、每次设计和迭代一样,成为海量碎片化与精细化的定制产品。
在超大规模精细化的趋势下,Yann LeCun也认为使用通用大模型、靠纯粹数据堆叠、让机器被动学习、反复人工调参的老路,已经无法走通,他也指出让机器学习更加自主,将是未来AI发展最重要的方向。
共达地的AutoML自动化训练
让AI学会“自主学习”这个方向上,共达地正在致力于用AutoML技术,将LeCun与meta-learning的理念付诸实践。
在人力密集且重复度极高的AI研发流程下,共达地依托业内领军的AutoML技术,用AI训练AI,摆脱业内常调侃为“只有人工,毫无智能”的繁冗研发AI流程,用前所未有的加速动能,为AI产业带来质变。
通过半监督式学习的数据工程;自动调节模型结构、超参、Loss函数与Head等方式;以及自动根据芯片算子调节神经网络结构等技术,共达地可将原本的训练时间由3至6个月缩短至了两周内,一键即可下发至云/边多端设备之中。并且无需任何算法团队0代码经验也可操作,仅需上传数据点击训练即可生成媲美人类工程师精度的AI算法。
部署之后,在运维团队中无需专业算法工程师的参与,可持续自动获取现场数据,对算法进行迭代优化,让精度接近场景理想值。
目前共达地AI广泛于智慧城市、智慧工业、智慧园区、智慧楼宇等各场景之中。
参考:A Path Towards Autonomous Machine Intelligence | OpenReview
版权归原作者 科技新观察 所有, 如有侵权,请联系我们删除。