- RAG的概念 RAG的全称是Retrieval-Augmented Generation,中文翻译为检索增强生成。它是一个为大模型提供外部知识源的概念,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉。
「检索(Retrive)」 根据用户请求从外部知识源检索相关上下文。为此,使用嵌入模型将用户查询嵌入到与向量数据库中的附加上下文相同的向量空间中。这允许执行相似性搜索,并返回矢量数据库中最接近的前 k 个数据对象。
「增强(Augment)」 用户查询和检索到的附加上下文被填充到提示模板中。
「生成(Generate)」 最后,检索增强提示被馈送到 LLM。
1.RAG既是大语言模型(LLM)较为热门的应用开发架构,也是其在垂直领域的应用拓展。
它能在LLM强大功能的基础上,通过拓展访问特定领域数据库或内部知识库,以补足通用模型在垂直领域的知识短板。
2.在LLM的基础上,RAG能通过数据内循环,更好地解决数据来源问题。
增强搜索与生成功能的同时,能减少行业用户对数据私密性与安全性的顾虑。这也推动其成为各类大模型落地项目不可缺少的技术组件。
3.RAG的利用,能有效减少模型幻觉的发生,进一步提升大模型检索和生成性能。
因为训练成本相对较低,RAG目前已拓展到企业信息库建设、AI文档问答、业务培训、科研等场景,搭配AI agent,极大地加快了大模型的商业化进程。
为了提高RAG的智能化程度和应用价值,人们甚至在原来的检索增强生成体系的基础上,推出了Self-RAG(即自反思的检索增强生成方法),以进一步提升检索效率和大模型生成质量。这算是RAG的一大升级与进化了。
版权归原作者 归来少年Plus 所有, 如有侵权,请联系我们删除。