主流的Agent
- Coze
- Dify
- AutoGpt
- Gpts
Agent和LLM的区别
LLM是大语音模类似大脑,能理解用户说的话,做一些回复。但是它无法执行具体的action。Ai Agent定义是智能体,它基于LLM这个大脑,去完成大脑发出的指令。所以,从形式上Agent像是一个工作流,能完成一连串的任务。
Agent工作流的方式
Agent会组合LLM、规划(Planning)、记忆(Memory)、工具(Tool Use)来完成一个具体的任务。规划(Planning)不同Agent在形式上会有所区别,Coze和Dify是通过可视化的方式,由用户手工组合不同工具。AutoGPT是通过agent自己,生成完成任务所需的步骤,自动执行。所以,Coze和Dify更像一个saas平台,能快速组装出一个应用。
记忆(Memory)功能分为短期和长期记忆。短期记忆包括用户输入过的指令、任务的上下文等;长期记忆一般是使用向量数据库存储额外的知识或信息,补充模型缺少的信息。
工具(Tool Use)是执行具体action的方式,可以是一段脚本代码、API、其他工作流等。
Coze-扣子
扣子是字节推出的AI聊天机器人和应用编辑开发平台。可以创建Bot、插件、工作流、图像流、知识库、卡片。
Bot
可以通过页面配置的方式,快速搭建一个聊天机器人。
Demo:扣子
工作流
编排一套任务,由用户自己组装处理逻辑。与之前的低代码平台一样,多了一个大模型,可以理解非结构化的信息。
图片流
是工作流的一个垂直图形处理场景,可以方便的对图形做一些处理。
知识库
这里的知识库形式上跟我们日常看到的表格一样,区别是存放在向量数据库里,会对每一行记录使用大模型embedding出一个向量,通过向量相似度进行搜索内容。
Dify
Dify是苏州语灵人工智能科技有限公司推出的大语音模型的应用开发平台。可以创建聊天助手、Agent、工作流。
聊天助手
通过LLM+知识库+工具快速搭建一个聊天助手。还支持ASR、TTS、内容审查等辅助功能。
Demo:https://udify.app/chat/GaEpueMaeAsvipjW
Agent
agent的功能和聊天助手基本一样。
工作流
工作流通过集成各种工具来实现具体任务。
AutoGPT
AutoGPT会根据用户的需求,自动生成计划,然后自动执行。通过执行的结果,在修正前面的计划。通过不断迭代,最终完成任务。
Gpts
ChatGPT有一个Gpts商场,在这里我们可以创建聊天机器人(会员功能)。
创建Gpt
创建聊天的配置大概是下面这样,内容比较简单。
添加Action
另外,ChatGPT也支持插件(Actions)的功能,可以在聊天框里选择需要的插件。在聊天过程中,会在合适的时机调用插件功能。下面是一个检查URL地址是否可用的插件:
感受
Ai Agent的目的是让大语言模型能真正执行任务,而不是像个顾问只能提供建议。但完成日常中一个简单的任务,真正拆解下来也是有很多个步骤,需要很多前置知识。像开发过程中碰到的BUG,需要我们不断去想解决方案和调试。虽然调试方法有一些固定的模式,但是过程中未知因素很多。要让Agent来排查BUG,就好像让中文系博士生来写代码一样,他要从0了解很多知识。
Agent使用的场景是流程确定,过程重复的任务。例如爬虫,给一个URL让它去读取页面内容,这是一个相对确定和重复的事情。
现阶段Agent虽然无法很好的替代日常的任务,但有了大语言模型的加持,让Agent变的有想象力。随着Agent能力的迭代,场景的渗透,现在看是复杂的任务,相信将来只需要一句话就能完成。
版权归原作者 李昂的数字之旅 所有, 如有侵权,请联系我们删除。