斯坦福大学教授、DeepLearning.AI的创始人吴恩达(Andrew Ng)发表了一场发人深省的主题演讲。吴恩达以其“人工智能是新的电力”的论断而闻名,他强调了AI作为一项通用技术的巨大应用前景。在此次演讲中,他特别强调了AI代理(AI agents)这一人工智能领域中最引人注目的技术。
AI代理被普遍认为将是生成式AI未来的核心应用,其创新潜力正吸引着全球的关注。这项技术不仅有望彻底改变企业的运作方式,还可能引发新的增长浪潮。吴恩达强调,生成式AI通过利用大型语言模型,极大地简化了开发流程——以往需要6个月才能完成的项目,现在可能只需10天就能完成。这种效率的提升正在根本上改变企业的创新模式。在成本大幅降低的情况下,企业可以尝试多种创新方案,而不是将所有资源投入到单一项目中。例如,一家公司可以同时推进20个创新项目,即使其中18个未能成功也无伤大雅。这种低成本、快速试错的能力,极大地加快了企业创新的速度和灵活性。尽管软件开发仍然包括产品设计、AI集成、系统安全性和合规性等多个环节,但生成式AI的出现使得许多步骤变得更加高效,促使企业重新考虑其创新项目的优先级。
然而,要充分释放AI代理的潜力,仍需面对几个关键的技术挑战:
- 首先是对半导体技术进步的需求,因为代理式工作流会消耗大量的“tokens”;
- 其次是提高文本生成速度的迫切需求,这直接影响到AI自我对话的效率;
- 此外,基础模型的持续优化、编排层的发展以及多代理协作机制的完善,都是推动这一技术发展的重要因素。
演讲文稿
如果让我选择今天最值得关注的一项人工智能技术,我认为是AI代理(AI agents)。我希望与大家分享我在技术领域的观察,以及为什么我认为这项技术如此重要。
1、AI的机会在哪里
你们可能听我说过,“人工智能是新的电力”,这是一项具有广泛应用前景的通用技术。因此,无论是在台湾还是全球范围内,我们需要努力探索如何将这项了不起的新技术应用于更多领域。
虽然目前关于人工智能有许多炒作和热情,但人们经常会问我:最大的机会在哪里?我通常将人工智能分为几层结构:AI技术价值金字塔基础模型层Foundation ModelsAI基础模型云层Cloud Layer云计算基础设施半导体层台湾制造计算芯片硬件支持AI技术架构层级示意图
最底层是半导体层,然后是云层,再往上是基础模型层(Foundation Models)。
每当出现像人工智能这样的技术浪潮时,大部分的媒体关注点都会集中在这些技术层面上。这没问题,但从定义上来说,为了让这些技术层成功运转,还需要另一层表现得更好,那就是应用层。应用层需要创造更多的收入,才能支付底层技术的开发成本。因此,尽管基础模型和其他技术层受到媒体的热议,但应用层的表现必须更出色。对于许多台湾企业来说,我认为最好的机会就是专注于构建这些新技术所能支持的应用。
2、AI代理工作流
目前,大多数人使用大型语言模型(如ChatGPT、Gemini或Anthropic的Claude)的方法是向模型输入提示词,然后让它直接生成一篇文章。这就像向一个人请求写文章,但要求对方从第一句话写到最后一句话,中途不能使用回退键。
作为人类,我并不以这种方式完成我的最佳写作,但即使是在这种苛刻的限制下,人工智能依然表现得相当不错。然而,借助代理式工作流,我们可以让人工智能的表现更上一层楼。例如,你可以先让AI写一个文章提纲,然后询问它是否需要进行网络搜索。如果需要,就抓取相关网页内容作为上下文,供模型参考。接着生成第一版草稿,再让它自己审阅并提出改进意见,最终完成优化。这种工作流更加迭代:思考、修改、再思考,重复数次,直到得到更高质量的成果。
今年早些时候,我的团队在一个名为AI Benchmark的测试中收集了一些数据,这个测试用来评估AI在解决编码问题上的能力:
- GPT-3.5的成功率为48%。
- GPT-4的成功率上升到67%。
虽然GPT-4相较于GPT-3.5有显著提升,但更大的改进来自于结合代理式工作流。通过这种工作流,GPT-4的表现进一步提升,甚至超越了模型代际之间的性能差距。接下来,我想简单解释一下AI代理如何工作,希望能解开一些疑问。
作为开发者,我们有多种设计模式来编程AI代理,其中一种基础但非常重要的模式是反思设计模式(Reflection Design Pattern)。
例如,我让AI为某项任务写代码,AI会生成一段代码。然后,我可以将这段代码再提供给AI,并要求它审查代码,找出改进的方式。这种模式被称为反思工作流:让AI审视自己生成的内容,并找出改进空间。如果AI发现了问题,就可以进一步让它完善代码,生成新的版本。通过这样的流程,AI不仅能生成更好的代码,还能不断优化自身的输出质量。通过反思工作流(Reflection Workflow),AI的输出质量确实能有所提升。当然,这不是魔法,也无法发现所有问题,更不能保证100%有效,但相较于没有反思工作流,这种方法的确表现更好。
在构建AI代理系统时,我们不仅可以让一个大型语言模型(LLM)反思自己的输出,还可以采用另一种常见的设计模式——多代理协作(Multi-Agent Collaboration)。例如,你可以指示一个语言模型扮演“编写代码”的角色,而另一个语言模型扮演“评估代码”的角色。更进一步,你甚至可以让两个AI代理彼此对话,从而产生更好的工作成果。当人们看到这些设计模式的实际细节时,会发现它并不像表面看上去那样神秘。在代理式AI设计模式中,另一个越来越多被采用的能力是调用用户功能(User Function Calling)。AI系统可以调用工具,例如执行网络搜索、运行代码、调用API发起退款请求、提取日历数据,甚至点击网页操作。通过调用这些功能,AI能够执行越来越多的任务,扩展了其能力范围。
3、关键的AI能力
假设你向AI提出一个复杂指令,比如“生成一幅女孩在看书的图像,其姿势与男孩一致,并描述这幅图像”。AI可以分解任务,制定一个行动顺序,例如:
- 1、确定姿势;
- 2、生成女孩的图像;
- 3、将图像转换为文字;
- 4、最后生成描述。
AI不仅能执行单一操作,还能够规划出一系列复杂任务的步骤,从而完成更复杂的工作。此外,多代理协作正被越来越多的团队应用于实践。他们不仅设计单一AI代理,而是设计多个AI代理协作完成任务。我的一位朋友Joe Mora提到过,可以用管理者的心态来思考问题:如果你作为管理者,会雇佣3-4个人来完成一项任务,例如写代码或设计营销方案,那么不妨思考如何设计3-4个AI代理,让它们协作完成这些任务。这种方法在利用AI系统完成工作时是一个非常有效的设计模式。
随着这些设计模式的逐步成熟,AI开发者现在拥有了比以往更加丰富的工具组合,可以构建更强大的AI工作流。这也促使AI技术栈中出现了一个新的编排层(Orchestration Layer)。之前我展示过一个AI技术栈的图,现在我们可以看到,一个新兴的编排层正用于协调基础模型(Foundation Models)。编排的含义是,通过软件协调多个功能调用和基础模型的使用。而在过去一年中,编排层正变得越来越具备代理功能。
例如,你可能听说过一个叫LangChain的开源工具,它在两年前开始流行,如今已经演变为一个更具代理功能的平台,能够更高效地构建AI应用程序。这些编排工具的进步,使得开发应用变得更加容易。但这一点并没有改变我之前提到的看法:AI技术栈中最有价值的部分一定是应用层。只有应用层表现得更好,才能推动整个技术栈的成功。
我们团队DeepLearning.AI有幸与几乎所有全球顶尖的生成式AI公司合作,开发并免费分享AI课程。这些课程帮助开发者学习如何利用这些工具,尤其是构建基于代理式工作流的AI应用。
4、AI发展趋势
谈到人工智能的发展趋势,AI代理的确是我认为值得关注的一项技术,但它并不是唯一的趋势。我想快速分享五个我认为最重要的AI趋势:
关键AI发展趋势半导体技术进步更快的文本生成基础模型优化编排层演化多代理协作AI趋势
1、半导体技术进步代理式工作流会消耗大量的“tokens”,即文本生成的最小单位,因为它们需要不断迭代输出和输入。这就需要更快、更高效的文本生成能力。
2、更快的文本生成随着代理式工作流的普及,当AI在“自我对话”时,文本生成速度变得至关重要。例如,我的团队有些AI工作流可能需要20分钟才能完成,因为它们在与自己对话。若文本生成速度更快,这些任务可能只需5分钟,显著提升效率。
3、基础模型优化我们正在见证基础模型变得越来越强大,与之相应的AI代理设计也在不断提升。
4、编排层演化编排层正变得更具代理功能,为开发复杂的AI应用提供了更多可能性。
5、多代理协作多个AI代理的协同工作,已经成为开发者构建复杂工作流的有效工具。
在当下,我认为台湾的生态系统非常适合深度参与人工智能的前沿发展。这种参与不仅局限于技术层面,还涉及到创新过程的变革。一个显著的趋势是生成式AI正在改变企业的创新流程。过去,我们使用监督学习或预测型人工智能开发系统时,通常需要经历以下几个阶段:
- 收集大量数据;
- 训练模型;
- 部署模型。
这一过程可能需要6到12个月。然而,生成式AI通过大型语言模型(LLM)简化了这一流程。现在,我们可以直接编写提示词(prompt)并快速部署原型。一个过去可能需要6个月才能完成的项目,现在可能只需要10天。这极大地改变了企业的创新流程。
如果构建和部署原型的成本变得如此之低,那么公司可以同时尝试20个想法,而不是押注于一个想法。如果其中18个失败了,也没关系,直接丢弃这些失败的想法。这种快速试错的能力显著提高了企业创新的速度。尽管软件开发包含许多步骤,例如产品设计、AI集成、系统安全性和合规性等,但生成式AI让其中某些步骤变得更加高效。这种变革让公司重新思考如何优先处理创新项目。
5、创新的速度
关于创新的速度,人们常提到“快速失败(fail fast)”。生成式AI显著提升了快速失败的能力,从而改变了企业的创新方式。虽然“快速行动,打破常规”(Move Fast and Break Things)这一口号曾引发争议,但我并不认为我们应该停止快速行动。相反,我认为应该快速行动,同时承担责任。通过安全且负责的方式快速构建原型,企业和初创团队能够实现更高效的创新。
另一个值得注意的趋势是文本处理革命。像ChatGPT这样的工具已经证明了文本处理的潜力。但不太为人所知的是,图像处理革命也即将到来。这不仅包括图像生成,还包括图像分析和理解。这些技术将带来新的应用,例如制造业、自驾车、安全系统等领域。虽然图像处理技术还不如文本处理技术成熟,但它正在快速进步。例如,我们团队构建了一些具有代理式工作流(agentic workflows)的视觉AI,用于分析图像。这种技术将解锁许多新应用。
例如,许多企业可能在云存储中保存了大量的图片或视频,却没有办法从中获取价值。现在,随着视觉AI的进步,企业可以对这些图像和视频进行分析,这将创造全新的商业机会。
另一个影响开发者的重要趋势是数据重力(Data Gravity)的减弱。在技术领域,数据重力是指数据存储在某个云服务上后,很难将数据传输到另一个云服务进行处理。过去,从一个云端传输1TB数据到另一个云端是不可想象的,因为传输成本太高。然而,生成式AI的计算工作负载极其密集,与计算成本相比,数据传输成本显得微不足道。例如,从一个云端传输1GB数据可能只需10美分,而处理这些数据可能需要30到40美元。因此,越来越多的AI工作负载将数据在不同云服务之间传递进行处理。这一趋势为企业和初创公司创造了更多机会。
最后,数据工程的重要性愈发凸显。为了让组织为AI做好准备,数据基础设施的建设至关重要。尤其是对于非结构化数据(如文本、图像和音频)的管理,这些数据在企业中正变得越来越重要。过去,数据工程主要集中在表格数据(structured data)上,因为这是AI价值最大的领域。但现在,随着AI对文本、图像和音频的理解能力大幅提升,许多企业开始重构数据工程,重点处理非结构化数据,以更好地利用这些AI能力。这将为企业带来新的增长点和竞争优势。
6、AI应用案例
我想与大家分享五个可能与许多企业相关的重要趋势。中国台湾和全球范围内都在发生许多事情,而我个人花了很多时间思考企业创新的议题。我对初创企业和AI创业充满期待,但同时我也认为帮助大型企业采用AI技术,将是推动台湾乃至全球经济增长的重要途径。
以下是来自宾夕法尼亚大学和其合作研究人员的一张图表。图表的横轴是薪资水平,纵轴是不同职位受到AI自动化影响的程度。
有趣的是,受到这波AI自动化浪潮影响较大的,是高薪职位。这与早期的AI浪潮有所不同,早期的AI更倾向于自动化低薪、重复性的工作,比如工厂和工业自动化。而如今的这一代AI,更多地影响到了知识型工作。不过,也不用担心,图表中的曲线在高薪区间略有下降,因此在座各位的职位应该还是相对安全的。同时,AI在知识型工作中的应用还有巨大的潜力,可以显著提高效率。
我的团队AI Fund一直致力于帮助企业创新,并与合作伙伴共同推动AI创业。让我简单分享一个我们使用的流程,这个流程在实践中效果很好,希望对在座的一些人也有所启发。
几年前,三井公司找到我,提出让AI Fund利用AI分析全球航运的天气和洋流数据,从而优化航运路径,帮助船只提高燃油效率。这最终发展为一家名为Bearing AI的公司。
我们的流程如下:
- 市场验证:我们首先确认这个想法是否有市场需求,以及技术上是否可行。
- 寻找联合创始人:在这个案例中,我们招募了一位名为Dylan Kyle的联合创始人,他是一位有成功创业经验的企业家。
- 原型开发:与创始人一起,在3个月内开发出初步的技术原型。
- 投资与扩展:如果原型证明了项目的潜力,我们会为初创企业投资100万美元,推动公司快速发展。
最终,Bearing AI成功地为超过600艘船舶提供优化服务,每艘船每年平均节省50万美元的燃油费用,同时减少约10%的二氧化碳排放。这种方法证明了AI团队与行业专家合作的重要性。
为了帮助更多企业发掘和执行AI机会,我们总结了一套实用的“企业AI创新指南”:
企业AI创新指南1高管简报AI技术商业视角2头脑风暴集思广益3任务分解任务空间分析4优先级设定项目可行性评估步骤一步骤二步骤三步骤四企业AI项目规划与实施路线图
- 高管简报:为企业高管提供关于AI技术的简要介绍,让他们以非技术的商业视角理解AI的工作原理。例如,我们在Coursera上的课程《Generative AI for Everyone》就帮助许多高管快速入门;
- 头脑风暴:在了解AI基本原理后,团队可以集思广益,提出AI项目的想法。我们发现,几乎每个团队都会有很多创意;
- 任务分解分析:使用任务空间分析将工作分解为各个任务,评估哪些任务适合AI自动化。这一方法有助于发现企业中隐藏的AI机会。例如,客户服务代表的工作包含多种任务,而AI对某些任务的潜力可能非常高,而对其他任务的潜力较低;
- 优先级设定与决策:在生成10到50个AI项目想法后,对每个项目的技术可行性和市场潜力进行分析,确定优先级。
值得注意的是,这套方法并不仅仅是为了节省成本。实际上,许多企业在发现某些任务因AI变得“1000倍更便宜”时,会选择将这些任务执行“1000倍”,从而推动业务增长,而不仅仅是成本节约。
最终,大多数企业会面临“自建还是购买”(build vs. buy)的决策。如果可以直接购买现成的解决方案,那当然很好。但因为AI技术还相对新颖,很多时候企业需要的解决方案还没有人开发,这就需要选择自建或投资的方式。
例如,在三井公司的案例中,由于三井不想负责管理整个AI优化团队,我们与三井共同创立了Bearing AI,这不仅为三井节省了大量管理成本,还帮助他们高效地实现了燃油优化和减排目标。
我们发现,这种分工协作的模式,可以有效地推动AI初创企业的高效建立和快速发展。这种合作模式让公司能够充分利用AI技术的好处,而不需要完全承担开发和管理的责任。从长远来看,围绕设备战略和培训的工作将变得非常重要。我相信在全球范围内,围绕人工智能仍有许多工作需要完成,而我个人也非常期待在台湾开展更多相关的工作。台湾不仅为初创企业,也为大型企业提供了巨大的机会。
7、AI安全与治理
在结束之前,我想分享关于人工智能治理的一些观察。
当我与各国政府、董事会和高管沟通时,他们经常问我如何从监管或公司治理的角度管理人工智能。我认为在思考人工智能治理时,必须区分技术和应用。
例如,电动机是一种技术,也是一种通用技术,它可以被应用到搅拌机、电动车、透析机甚至是导弹中。有些应用是我们希望更多发展的,有些则可能需要限制。因此,技术本身是一种工具,而应用则是为特定需求而设计的具体实现。同样,大型语言模型(LLM)也属于技术,它们可以被用于多种不同的应用。风险通常更多地来自应用,而不是技术本身。例如:
如果你开发了一台搅拌机,那就需要确保搅拌机的安全性。
如果你开发了一辆电动车,那需要确保电动车的安全性。
搅拌机和电动车的安全标准显然完全不同。如果要求一个电动机制造商确保电动机只会被安全使用,这是不切实际的。人工智能技术也是如此。如果某人将AI用于医疗设备,责任更多地应该由医疗设备制造商承担,而不是由基础模型的开发者来承担。
过去一年半,美国和欧洲一些大型科技公司在游说立法方面表现得非常积极。他们试图推动一些法规,将负担转嫁给开源社区和开放权重模型的开发者。幸运的是,我们成功阻止了最糟糕的那些规定。如果这些限制性法规得以通过,开源技术的发展将受到严重影响。实际上,如果没有开源技术,台湾将很难获得尖端的AI技术。因此,推动反对限制开源的法规符合台湾以及全球大多数国家的利益。目前台湾在这一点上选择了明智的道路,我希望未来能继续保持这种态度。
希望我们的团队能与大家密切合作,共同推动更多AI相关的工作,为台湾的经济增长做出贡献。
非常感谢大家邀请我回到这里,也期待未来能够通过AI Fund和DeepLearning.AI团队与在座的各位进行更多合作!
注:本文来源于AI深度研究员
版权归原作者 AI天才研究院 所有, 如有侵权,请联系我们删除。