人工智能 - overfit.cn

三个工具，让 agent 在一次对话里完成研究、写码、调试与保存

其实只要有三个工具就能把 agent 从聊天机器人变成能干活的东西

Deephub 2026-05-10 22:00:38 0 收藏

用 Playwright 和 LLM 实现自愈测试自动化

Playwright 是一个用于 Web 自动化和端到端测试的开源框架。

Deephub 2026-05-07 21:39:25 0 收藏

为什么 MCP 在协议层会有 prompt injection的问题：工具描述如何劫持 agent 上下文

MCP（Model Context Protocol）当初被设计成 AI agent 的通用集成层，但它的架构有一个根本缺陷：

Deephub 2026-05-06 21:42:39 0 收藏

BM25 + Vectors：为什么真实 RAG 系统通常两者都需要

RAG 是一个先选内容再做生成的系统；retriever 不搜索文档，它搜索 chunks。

Deephub 2026-04-30 21:19:27 0 收藏

从无状态到有状态：长时运行 Agent 的 5 种架构模式

生产级 AI 不是单轮里把 agent 调得多聪明，而是看它能否在很多轮、很多天、很多次交接之间保持可靠。

Deephub 2026-04-29 21:44:57 0 收藏

LangChain 生态里的三层抽象:LangGraph、create_agent、Deep Agents

把它们看作不同抽象层级的工具更容易理解。LangGraph 在最底层,所有控制都掌握在开发者手里;

Deephub 2026-04-28 19:46:06 0 收藏

DeepSeek-V4 深度解读：百万上下文背后的工程细节

本文围绕三个问题：长上下文效率到底怎么破（架构）；万亿 MoE 怎么稳定训练（基础设施 + trick）；十几个领域专家如何合并成一个模型（后训练）。

Deephub 2026-04-27 21:03:14 0 收藏

Graphify：为代码库构建知识图谱，以图遍历替代向量检索

Graphify 是一个 Python 工具，同时也是一个 Claude Code skill。它把分析工作一次性做完，把所有内容压缩成一张可查询的知识图谱，放到磁盘上。

Deephub 2026-04-26 19:53:29 0 收藏

2026年的 ReAct Agent架构解析：原生 Tool Calling 与 LangGraph 状态机

本文要做的是一个 Research Brief Agent：会上网搜索、抓取真实 URL、压缩证据，最终产出一份带真实引用的结构化简报。

Deephub 2026-04-25 20:30:37 0 收藏

LangChain 还是 LangGraph？一个是编排一个是工具包

现在介绍LangGraph 和 LangChain 的文章。每一篇的结论都差不多：简单流程用 LangChain，复杂的用 LangGraph。

Deephub 2026-04-24 20:58:15 0 收藏

LLM 幻觉的架构级修复：推理参数、RAG、受约束解码与生成后验证

大型语言模型可以写代码、起草合同、总结论文，但它有一个致命缺陷：撒谎的时候极其自信。

Deephub 2026-04-23 20:34:15 0 收藏

时间序列预测增强方法总结：频域、分解、patch

数据增强是现代机器学习中一个绕不开的环节。

Deephub 2026-04-22 21:38:45 0 收藏

为生产级 AI Agent 构建持久化记忆:五阶段流水线与四种设计模式

不是每个 Agent 都需要这一套。如果你的 Agent 只处理单轮事务或无状态查询，这就是过度工程。记忆不是一项特性，它是 Agent 身份、连续性与信任的根基。

Deephub 2026-04-21 23:05:48 0 收藏

Claude Opus 4.7 系统 Prompt 泄露：其中的10 个核心设计决策解读

Claude 4.7刚发布不久他的Prompt就已经被Hack出来了，仔细看 Claude 的系统设计会发现一件有意思的事：它不只追求聪明，还在试图约束自身的行为。

Deephub 2026-04-20 21:56:09 0 收藏

无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析

传统 RAG 的假设：相关性等于语义相似度。PageIndex 的假设：相关性等于结构化推理。

Deephub 2026-04-14 21:34:14 0 收藏

从检索到回答：RAG 流水线中三个被忽视的故障点

RAG 的搭建门槛不高，但要让一个 RAG 系统在生产环境中达到可信赖的程度，所需时间远不止于此。

Deephub 2026-04-13 19:52:14 0 收藏

Karpathy的LLM Wiki：一种将RAG从解释器模式升级为编译器模式的架构

Karpathy没有发明新技术，他在清晰阐述一个工作流模式，让LLM天生擅长的事——快速阅读、综合、交叉引用、一致地遵循约定——去接替人类一直需要但从未能持续做好的工作。

Deephub 2026-04-12 21:15:09 0 收藏

向量相似性搜索详解：Flat Index、IVF 与 HNSW

Flat Index、IVF 和 HNSW：你需要了解的向量搜索算法

Deephub 2026-04-11 18:17:12 0 收藏

拆解推荐系统：候选生成、过滤、排序、多样性的分层设计

本文梳理一条可以实际构建并持续扩展的端到端推荐 Pipeline。

Deephub 2026-04-10 20:41:18 0 收藏

Prompt、Context、Harness：AI Agent 工程的三层架构解析

三者不是竞争关系而是分层。Prompt 关注如何表达任务；Context 关注模型在执行任务时看到什么；Harness 关注模型运行其中的系统。

Deephub 2026-04-09 20:15:56 0 收藏

1
2
3
4
5
6
7

登录可以使用的更多功能哦！登录

OpenCV Python Pytorch Tensorflow 强化学习搜索和推荐数据分析数据挖掘机器学习概率论深度学习目标检测神经网络线性代数结构化数据自动驾驶自然语言处理计算机视觉语义分割语音识别

作者榜

资讯小助手

资讯同步

内容小助手

文章同步

Deephub

公众号：deephub-imba

奕凯

公众号：奕凯的技术栈