百度智能云千帆大模型平台引领企业创新增长

提供了最专业的应用开发工具、最丰富的大模型、最全面的工具链。千帆 ModelBuilder 提供的就是全流程的、模型训练和模型精调的工具链,包含:数据管理、训练模式、开发工具、评估优化、推理部署、大模型周边系统。除了智能体作为应用载体之外,还有非常多的企业级传统应用,过去是通过写代码的方式开发,今天

解读双编码器和交叉编码器:信息检索中的向量表示与语义匹配

在信息检索领域(即从海量数据中查找相关信息),双编码器和交叉编码器是两种至关重要的工具。它们各自拥有独特的工作机制、优势和局限性。本文将深入探讨这两种核心技术。

25 个值得关注的检索增强生成 (RAG) 模型和框架

本文深入探讨 25 种先进的 RAG 变体,每一种都旨在优化检索和生成过程的特定方面。从标准实现到专用框架,这些变体涵盖了成本限制、实时交互和多模态数据集成等问题,展示了 RAG 在提升 NLP 能力方面的多功能性和潜力。

香港大学神作 LightRAG 横空出世!AI 检索生成系统革命,秒懂复杂信息,动态数据无所遁形!

香港大学研发的LightRAG系统,结合图结构索引和双层检索机制,显著提升大型语言模型的信息检索效率和准确性。它能捕捉复杂实体关系,通过增量更新算法,快速适应新数据,无需重建知识库。

GraphRAG-Local-UI - 基于 GraphRAG 支持本地的聊天UI

虽然主要应用程序仍然有效,但我正在积极开发用于索引/提示调整和查询/聊天的单独应用程序,所有这些都是围绕强大的中央应用程序接口构建的。我对GraphRAG本地UI生态系统的愿景是成为使用GraphRAG和本地LLM的终极工具集,尽可能多地结合很酷的功能和知识图谱工具。在塑造这个项目的未来时,非常需要

Github上的十大RAG(信息检索增强生成)框架

随着对先进人工智能解决方案需求的不断增长,GitHub上涌现出众多开源RAG框架,每一个都提供了独特的功能和特性。

RAPTOR:多模型融合+层次结构 = 检索性能提升20%,结果还更稳健

RAPTOR通过结合多个检索模型,构建层次化的信息组织结构,并采用递归摘要等技术,显著提升了检索系统的性能和适应性。

llamaindex 使用向量存储索引(VectorStoreIndex)

在实际应用中,结合不同的向量存储和自定义节点处理,可以实现更复杂和精细的检索需求。向量存储(Vector Stores)是检索增强生成(RAG)的关键组件,因此你几乎会在使用LlamaIndex构建的每个应用程序中直接或间接地使用它们。有关如何使用持久向量存储的更多信息,请参阅下面的“使用向量存储”

【拥抱AI】RAG数据清洗工具MinerU

MinerU模型是一个一站式、开源的高质量数据提取工具,它包含两个核心功能模块:Magic-PDF和Magic-Doc。Magic-PDF专注于将PDF文档转换为Markdown格式,而Magic-Doc则致力于网页和电子书的信息提取。

闭源与开源嵌入模型比较以及提升语义搜索效果的技术探讨

对于嵌入技术的新手,希望本文能为你提供有价值的见解。对于已经熟悉这一领域的读者,希望本文关于使用较小与较大嵌入模型的经济性分析能够带来新的思考。值得注意的是,在大型语言模型(LLM)领域,许多闭源模型正在领先;但在嵌入模型方面,情况并非如此。本文的一个重要结论是:不要忽视较小的、计算效率更高的模型。

CODEXGRAPH:突破代码与AI的壁垒,开启智能编程新时代

论文首先介绍了大型语言模型(LLMs)在代码生成和理解任务中的重要性,但也指出当前LLMs在处理整个代码库时面临的挑战。这些挑战包括难以处理长上下文输入以及在复杂代码结构中进行推理的能力不足。现有的解决方案,如基于相似性的检索方法和手动工具/API,虽然在特定任务中有效,但在应对复杂的代码库任务时表

GraphRAG 与 RAG 的比较分析

Graph RAG 技术通过引入图结构化的知识表示和处理方法,显著增强了传统 RAG 系统的能力。它不仅提高了信息检索的准确性和完整性,还为复杂查询和多步推理提供了更强大的支持。

让模型评估模型:构建双代理RAG评估系统的步骤解析

我们将介绍一个基于双代理的RAG(检索增强生成)评估系统。该系统使用生成代理和反馈代理,基于预定义的测试集对输出进行评估。或者更简单的说,我们使用一个模型来评估另外一个模型的输出。

MemLong: 基于记忆增强检索的长文本LLM生成方法

本文将介绍MemLong,这是一种创新的长文本语言模型生成方法。MemLong通过整合外部检索器来增强模型处理长上下文的能力,从而显著提升了大型语言模型(LLM)在长文本处理任务中的表现。

检索增强生成RAG系列9--RAG开源开发框架

当然还有许多优秀的框架没有介绍,有些可能也跟RAG相关比如open-webui等,这里就不一一列举。无论你使用较为底层Langchain或者LlamaIndex,还是使用dify较为低代码方式构建你的RAG,都是要根据你的业务场景来决定选择哪些开发框架。这里只是提供对于相关实践信息供大家参考,主要是

深入 Dify 源码,洞察 Dify RAG 核心机制

之前深入源码对 Dify 的完整流程进行了解读,基本上梳理了 Dify 的实现流程与主要组件。但是在实际部署之后,发现 Dify 现有的 RAG 检索效果没有那么理想。因此个人结合前端页面,配置信息与实现流程,深入查看了私有化部署的 Dify 的技术细节。将核心内容整理在这边,方便大家根据实际的业务

基于Neo4j将知识图谱用于检索增强生成:Knowledge Graphs for RAG

Write advanced Cypher queries to retrieve relevant information from the graph and format it for inclusion in your prompt to an LLM.

构建基于 LlamaIndex 的RAG AI Agent

构建基于 LlamaIndex 的RAG AI智能体

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈