构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库
本文将构建一个端到端的时序智能体管道,实现从原始数据到动态知识库的转换,并在此基础上构建多智能体系统以验证其性能表现。
Adaptive-k 检索:RAG 系统中自适应上下文长度选择的新方法
Adaptive-k 代表了 RAG 系统从固定检索向智能化、查询感知检索的技术范式转变。该技术实现了显著的效率提升——在保持或提高准确性的同时,token 减少高达 99%。
RAG系统文本分块优化指南:9种实用策略让检索精度翻倍
本文将深入分析九种主要的文本分块策略及其具体实现方法。下图概括了我们将要讨论的内容。
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文提出的多模态RAG方法采用模态特定处理、后期融合和关系保留的技术架构,在性能表现、准确性指标和实现复杂度之间实现了最佳平衡。通过遵循该技术路线,能够构建一个有效处理复杂文档中全部信息的RAG系统。
RAG-MCP:基于检索增强生成的大模型工具选择优化框架
RAG-MCP框架不仅具有学术价值,更解决了AI助手和自主代理发展面临的核心瓶颈。随着我们期望LLM在动态环境中执行日益复杂的任务,其高效利用多样化外部工具的能力变得尤为关键。
SecMulti-RAG:兼顾数据安全与智能检索的多源RAG框架,为企业构建不泄密的智能搜索引擎
本文深入剖析SecMulti-RAG框架,该框架通过集成内部文档库、预构建专家知识以及受控外部大语言模型,并结合保密性过滤机制,为企业提供了一种平衡信息准确性、完整性与数据安全性的RAG解决方案,同时有效控制部署成本。
LangChain RAG入门教程:构建基于私有文档的智能问答助手
本文详述了如何通过检索增强生成(RAG)技术构建一个能够利用特定文档集合回答问题的AI系统。
RAL-Writer Agent:基于检索与复述机制,让长文创作不再丢失关键信息
RAL-Writer Agent是一种专业的人工智能写作辅助技术,旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战,确保全文保持连贯性和相关性。
RAG-Gym: 基于过程监督的检索增强生成代理优化框架
本文介绍了RAG-Gym框架,这是一种通过在搜索过程中实施细粒度过程监督来增强信息搜索代理的统一优化方法。
信息检索系统评估指标的层级分析:从单点精确度到整体性能度量
现代评估指标体系正是基于这些真实用户行为模式设计的,并且随着研究不断深入,评估方法也在持续演进以捕获更多细微交互特征。
百度智能云千帆大模型平台引领企业创新增长
提供了最专业的应用开发工具、最丰富的大模型、最全面的工具链。千帆 ModelBuilder 提供的就是全流程的、模型训练和模型精调的工具链,包含:数据管理、训练模式、开发工具、评估优化、推理部署、大模型周边系统。除了智能体作为应用载体之外,还有非常多的企业级传统应用,过去是通过写代码的方式开发,今天
解读双编码器和交叉编码器:信息检索中的向量表示与语义匹配
在信息检索领域(即从海量数据中查找相关信息),双编码器和交叉编码器是两种至关重要的工具。它们各自拥有独特的工作机制、优势和局限性。本文将深入探讨这两种核心技术。
25 个值得关注的检索增强生成 (RAG) 模型和框架
本文深入探讨 25 种先进的 RAG 变体,每一种都旨在优化检索和生成过程的特定方面。从标准实现到专用框架,这些变体涵盖了成本限制、实时交互和多模态数据集成等问题,展示了 RAG 在提升 NLP 能力方面的多功能性和潜力。
香港大学神作 LightRAG 横空出世!AI 检索生成系统革命,秒懂复杂信息,动态数据无所遁形!
香港大学研发的LightRAG系统,结合图结构索引和双层检索机制,显著提升大型语言模型的信息检索效率和准确性。它能捕捉复杂实体关系,通过增量更新算法,快速适应新数据,无需重建知识库。
GraphRAG-Local-UI - 基于 GraphRAG 支持本地的聊天UI
虽然主要应用程序仍然有效,但我正在积极开发用于索引/提示调整和查询/聊天的单独应用程序,所有这些都是围绕强大的中央应用程序接口构建的。我对GraphRAG本地UI生态系统的愿景是成为使用GraphRAG和本地LLM的终极工具集,尽可能多地结合很酷的功能和知识图谱工具。在塑造这个项目的未来时,非常需要
Github上的十大RAG(信息检索增强生成)框架
随着对先进人工智能解决方案需求的不断增长,GitHub上涌现出众多开源RAG框架,每一个都提供了独特的功能和特性。
RAPTOR:多模型融合+层次结构 = 检索性能提升20%,结果还更稳健
RAPTOR通过结合多个检索模型,构建层次化的信息组织结构,并采用递归摘要等技术,显著提升了检索系统的性能和适应性。
llamaindex 使用向量存储索引(VectorStoreIndex)
在实际应用中,结合不同的向量存储和自定义节点处理,可以实现更复杂和精细的检索需求。向量存储(Vector Stores)是检索增强生成(RAG)的关键组件,因此你几乎会在使用LlamaIndex构建的每个应用程序中直接或间接地使用它们。有关如何使用持久向量存储的更多信息,请参阅下面的“使用向量存储”
【拥抱AI】RAG数据清洗工具MinerU
MinerU模型是一个一站式、开源的高质量数据提取工具,它包含两个核心功能模块:Magic-PDF和Magic-Doc。Magic-PDF专注于将PDF文档转换为Markdown格式,而Magic-Doc则致力于网页和电子书的信息提取。