大语言模型 - overfit.cn

LangChain RAG入门教程：构建基于私有文档的智能问答助手

本文详述了如何通过检索增强生成(RAG)技术构建一个能够利用特定文档集合回答问题的AI系统。

Deephub 1 天前 0 收藏

基于LlamaIndex实现CodeAct Agent：代码执行工作流的技术架构与原理

本文将详细阐述如何利用LlamaIndex框架从底层构建CodeAct Agent，深入剖析其内部工作机制，以及如何在预构建解决方案的基础上进行定制化扩展。

Deephub 2 天前 0 收藏

FlashTokenizer: 基于C++的高性能分词引擎，速度可以提升8-15倍

FlashTokenizer是一款面向高性能计算的CPU分词引擎，专门针对BERT等Transformer架构的大型语言模型进行了底层优化。该引擎基于高效C++实现，采用了多项性能优化技术，确保在维持词元切分准确性的同时，大幅提升处理速度。

Deephub 6 天前 0 收藏

DAPO: 面向开源大语言模型的解耦裁剪与动态采样策略优化系统

字节跳动提出的解耦裁剪和动态采样策略优化(DAPO)算法，完整开源了一套最先进的大规模RL系统，该系统基于Qwen2.5-32B基础模型在AIME 2024测试中取得了50分的优异成绩。

Deephub 11 天前 0 收藏

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

OpenAI提出的CLIP和Google研发的SigLIP模型重新定义了计算机视觉与自然语言处理的交互范式，

Deephub 12 天前 0 收藏

SWEET-RL：基于训练时信息的多轮LLM代理强化学习框架

本文将深入分析SWEET-RL如何改进AI代理在复杂协作任务中的训练方法。

Deephub 13 天前 0 收藏

RAL-Writer Agent：基于检索与复述机制，让长文创作不再丢失关键信息

RAL-Writer Agent是一种专业的人工智能写作辅助技术，旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战，确保全文保持连贯性和相关性。

Deephub 15 天前 0 收藏

SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架

该模型的核心创新在于**完全依靠强化学习机制（无需人工标注的交互轨迹）**来学习最优的搜索查询策略及基于检索知识的推理方法，从而显著提升问答任务的性能表现。

Deephub 20 天前 0 收藏

GoT：基于思维链的语义-空间推理框架为视觉生成注入思维能力

GoT框架通过引入"思维链"机制突破了这一限制，该机制在生成图像前会展开结构化推理过程。

Deephub 23 天前 1 收藏

RAG-Gym: 基于过程监督的检索增强生成代理优化框架

本文介绍了RAG-Gym框架，这是一种通过在搜索过程中实施细粒度过程监督来增强信息搜索代理的统一优化方法。

Deephub 24 天前 0 收藏

FANformer：融合傅里叶分析网络的大语言模型基础架构

FANformer通过将傅里叶分析网络(Fourier Analysis Network, FAN)整合到Transformer的注意力机制中，形成了一种创新的模型结构。

Deephub 2025-03-11 10:26:27 0 收藏

S3FT选择性自监督微调：通过智能选择训练样本提升大模型整体表现

选择性自我监督微调（Selective Self-to-Supervised Fine-Tuning，S3FT）是一种创新的大语言模型微调方法，该方法通过部署专门的语义等价性判断器来识别训练集中模型自身生成的正确响应。

Deephub 2025-03-10 09:49:13 0 收藏

大语言模型中的归一化技术：LayerNorm与RMSNorm的深入研究

本文将系统分析归一化技术的必要性，并详细阐述为何原始Transformer架构中的LayerNorm在LLama模型中被RMSNorm所替代的技术原理。

Deephub 2025-03-09 10:00:12 0 收藏

Chain of Draft: 借鉴人类草稿思维让大型语言模型更快地思考

这个研究探讨了大型语言模型（LLMs）在执行复杂推理任务时面临的计算资源消耗与响应延迟问题。研究特别聚焦于思维链（Chain-of-Thought, CoT）提示范式的效率局限性。

Deephub 2025-03-07 17:55:27 0 收藏

深入解析Tiktokenizer：大语言模型中核心分词技术的原理与架构

Tiktokenizer通过整合这些方法，构建了一个通用且适应性强的工具，能够应对各种文本处理场景的需求。

Deephub 2025-03-04 10:19:59 0 收藏

LLM模型添加自定义Token代码示例：为Llama 3.2模型添加思考与回答标记

本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练，使模型能够有效地利用这些新增token。

Deephub 2025-02-28 20:36:22 0 收藏

Logic-RL: 小模型也能强推理，通过基于规则的强化学习提升大语言模型结构化推理能力

这篇论文探讨了基于规则的强化学习（RL）如何解锁LLM中的高级推理能力。通过在受控的逻辑谜题上进行训练并强制执行结构化的思考过程，即使是相对较小的模型也能开发出可转移的问题解决策略。

Deephub 2025-02-26 10:14:50 0 收藏

SelfCite: 通过自监督奖励提升LLM对上下文内容的引用质量

SelfCite 提出了一种新颖的自监督方法，通过上下文消融技术和自监督奖励机制，提升大型语言模型 (LLM) 对上下文内容的引用质量，生成更准确、更可靠的句子级别引用，从而提高基于上下文的生成任务的整体性能。

Deephub 2025-02-25 10:17:40 0 收藏

SmolLM2：多阶段训练策略优化和高质量数据集，小型语言模型同样可以实现卓越的性能表现

，SmolLM2 通过创新的多阶段训练策略、高质量数据集的构建与优化，以及精细的模型后训练调优，在 1.7B 参数规模下实现了卓越的性能表现，并在多个基准测试中超越了同等规模甚至更大规模的语言模型。

Deephub 2025-02-23 10:11:50 0 收藏

DeepMind发布Matryoshka（套娃）量化：利用嵌套表示实现多精度LLM的低比特深度学习

本文将介绍 Google DeepMind 提出的 Matryoshka 量化技术，该技术通过从单个大型语言模型 (LLM) 实现多精度模型部署，从而革新深度学习。我们将深入研究这项创新技术如何提高 LLM 的效率和准确性。

Deephub 2025-02-18 10:08:19 0 收藏