RAG - overfit.cn

LangChain RAG入门教程：构建基于私有文档的智能问答助手

本文详述了如何通过检索增强生成(RAG)技术构建一个能够利用特定文档集合回答问题的AI系统。

Deephub 5 天前 0 收藏

RAL-Writer Agent：基于检索与复述机制，让长文创作不再丢失关键信息

RAL-Writer Agent是一种专业的人工智能写作辅助技术，旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战，确保全文保持连贯性和相关性。

Deephub 19 天前 0 收藏

RAG-Gym: 基于过程监督的检索增强生成代理优化框架

本文介绍了RAG-Gym框架，这是一种通过在搜索过程中实施细粒度过程监督来增强信息搜索代理的统一优化方法。

Deephub 1 个月前 0 收藏

信息检索系统评估指标的层级分析：从单点精确度到整体性能度量

现代评估指标体系正是基于这些真实用户行为模式设计的，并且随着研究不断深入，评估方法也在持续演进以捕获更多细微交互特征。

Deephub 1 个月前 0 收藏

百度智能云千帆大模型平台引领企业创新增长

提供了最专业的应用开发工具、最丰富的大模型、最全面的工具链。千帆 ModelBuilder 提供的就是全流程的、模型训练和模型精调的工具链，包含：数据管理、训练模式、开发工具、评估优化、推理部署、大模型周边系统。除了智能体作为应用载体之外，还有非常多的企业级传统应用，过去是通过写代码的方式开发，今天

overfit同步小助手 2024-11-26 08:04:39 0 收藏

解读双编码器和交叉编码器：信息检索中的向量表示与语义匹配

在信息检索领域（即从海量数据中查找相关信息），双编码器和交叉编码器是两种至关重要的工具。它们各自拥有独特的工作机制、优势和局限性。本文将深入探讨这两种核心技术。

Deephub 2024-11-20 09:51:24 0 收藏

25 个值得关注的检索增强生成 (RAG) 模型和框架

本文深入探讨 25 种先进的 RAG 变体，每一种都旨在优化检索和生成过程的特定方面。从标准实现到专用框架，这些变体涵盖了成本限制、实时交互和多模态数据集成等问题，展示了 RAG 在提升 NLP 能力方面的多功能性和潜力。

Deephub 2024-11-17 10:22:05 0 收藏

香港大学神作 LightRAG 横空出世！AI 检索生成系统革命，秒懂复杂信息，动态数据无所遁形！

香港大学研发的LightRAG系统，结合图结构索引和双层检索机制，显著提升大型语言模型的信息检索效率和准确性。它能捕捉复杂实体关系，通过增量更新算法，快速适应新数据，无需重建知识库。

overfit同步小助手 2024-11-15 04:01:39 0 收藏

GraphRAG-Local-UI - 基于 GraphRAG 支持本地的聊天UI

虽然主要应用程序仍然有效，但我正在积极开发用于索引/提示调整和查询/聊天的单独应用程序，所有这些都是围绕强大的中央应用程序接口构建的。我对GraphRAG本地UI生态系统的愿景是成为使用GraphRAG和本地LLM的终极工具集，尽可能多地结合很酷的功能和知识图谱工具。在塑造这个项目的未来时，非常需要

overfit同步小助手 2024-11-09 23:04:19 0 收藏

Github上的十大RAG(信息检索增强生成)框架

随着对先进人工智能解决方案需求的不断增长,GitHub上涌现出众多开源RAG框架,每一个都提供了独特的功能和特性。

Deephub 2024-10-31 09:22:52 0 收藏

RAPTOR：多模型融合+层次结构 = 检索性能提升20%，结果还更稳健

RAPTOR通过结合多个检索模型，构建层次化的信息组织结构，并采用递归摘要等技术，显著提升了检索系统的性能和适应性。

Deephub 2024-10-25 09:35:35 0 收藏

llamaindex 使用向量存储索引（VectorStoreIndex）

在实际应用中，结合不同的向量存储和自定义节点处理，可以实现更复杂和精细的检索需求。向量存储（Vector Stores）是检索增强生成（RAG）的关键组件，因此你几乎会在使用LlamaIndex构建的每个应用程序中直接或间接地使用它们。有关如何使用持久向量存储的更多信息，请参阅下面的“使用向量存储”

overfit同步小助手 2024-10-12 15:01:37 0 收藏

【拥抱AI】RAG数据清洗工具MinerU

MinerU模型是一个一站式、开源的高质量数据提取工具，它包含两个核心功能模块：Magic-PDF和Magic-Doc。Magic-PDF专注于将PDF文档转换为Markdown格式，而Magic-Doc则致力于网页和电子书的信息提取。

overfit同步小助手 2024-10-05 17:01:27 0 收藏

闭源与开源嵌入模型比较以及提升语义搜索效果的技术探讨

对于嵌入技术的新手，希望本文能为你提供有价值的见解。对于已经熟悉这一领域的读者，希望本文关于使用较小与较大嵌入模型的经济性分析能够带来新的思考。值得注意的是，在大型语言模型（LLM）领域，许多闭源模型正在领先；但在嵌入模型方面，情况并非如此。本文的一个重要结论是：不要忽视较小的、计算效率更高的模型。

overfit同步小助手 2024-10-02 18:04:49 0 收藏

闭源与开源嵌入模型比较以及提升语义搜索效果的技术探讨

Deephub 2024-10-01 10:01:16 0 收藏

CODEXGRAPH：突破代码与AI的壁垒，开启智能编程新时代

论文首先介绍了大型语言模型（LLMs）在代码生成和理解任务中的重要性，但也指出当前LLMs在处理整个代码库时面临的挑战。这些挑战包括难以处理长上下文输入以及在复杂代码结构中进行推理的能力不足。现有的解决方案，如基于相似性的检索方法和手动工具/API，虽然在特定任务中有效，但在应对复杂的代码库任务时表

overfit同步小助手 2024-09-21 19:01:29 0 收藏