人工智能深度学习 - overfit.cn

GPU集群扩展：Ray Serve与Celery的技术选型与应用场景分析

当你需要处理大规模并行任务，特别是涉及GPU集群的场景时，Ray Serve和Celery是两个主要选择。但它们的设计理念完全不同

Deephub 2025-09-05 20:21:46 0 收藏

DINOv3上手指南：改变视觉模型使用方式，一个模型搞定分割、检测、深度估计

DINOv3是Meta推出的自监督视觉骨干网络，最大的亮点是你可以把整个backbone冻住不动，只训练一个很小的任务头就能在各种密集预测任务上拿到SOTA结果。

Deephub 2025-09-04 20:49:20 0 收藏

微软rStar2-Agent：新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

Microsoft Research最近发布的rStar2-Agent展示了一个令人瞩目的结果：一个仅有14B参数的模型在AIME24数学基准测试上达到了80.6%的准确率，超越了671B参数的DeepSeek-R1（79.8%）。

Deephub 2025-09-03 20:21:39 0 收藏

Memento：基于记忆无需微调即可让大语言模型智能体持续学习的框架

Memento框架通过基于记忆的在线强化学习实现低成本持续适应，完全避免了对LLM的微调需求。

Deephub 2025-09-02 19:50:17 0 收藏

多智能体系统设计：5种编排模式解决复杂AI任务

我们这里分析5种主流的智能体编排模式，每种都有其适用场景和技术特点。

Deephub 2025-08-31 20:03:10 0 收藏

R-Zero：通过自博弈机制让大语言模型无需外部数据实现自我进化训练

R-Zero框架实现了大语言模型在无外部训练数据条件下的自主进化与推理能力提升。

Deephub 2025-08-27 20:28:04 0 收藏

匹配网络处理不平衡数据集的6种优化策略：有效提升分类准确率

匹配网络（**Matching Networks**）是基于度量的元学习方法，通过计算查询样本与支持集中各样本的相似性实现分类。

Deephub 2025-08-25 21:55:43 0 收藏

HiRAG：用分层知识图解决复杂推理问题

该系统基于图检索增强生成（GraphRAG）的核心思想，通过引入层次化架构来处理不同抽象层次的知识复杂度。

Deephub 2025-08-24 20:07:05 0 收藏

这也许就是DeepSeek V3.1性能提升的关键：UE8M0与INT8量化技术对比与优势分析

UE8M0作为FP8格式家族中的一个特殊变体，我们今天来看看这个UE8M0到底是什么。

Deephub 2025-08-23 21:07:29 0 收藏

PyTorch 2.0性能优化实战：4种常见代码错误严重拖慢模型

我们将深入探讨图中断（graph breaks）和多图问题对性能的负面影响，并分析PyTorch模型开发中应当避免的常见错误模式。

Deephub 2025-08-22 19:46:03 0 收藏

近端策略优化算法PPO的核心概念和PyTorch实现详解

本文提供了PPO算法的完整PyTorch实现方案，涵盖了从理论基础到实际应用的全流程。

Deephub 2025-08-21 21:36:18 0 收藏

RAG系统文本检索优化：Cross-Encoder与Bi-Encoder架构技术对比与选择指南

本文将深入分析这两种编码架构的技术原理、数学基础、实现流程以及各自的优势与局限性，并探讨混合架构的应用策略。

Deephub 2025-08-20 20:33:40 0 收藏

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

GPT-OSS通过创新的量化技术实现了突破性进展。该系统能够在单个80GB GPU上运行1200亿参数模型，同时保持竞争性的基准测试性能。

Deephub 2025-08-17 21:16:41 0 收藏

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍使用四块Framework主板构建AI推理集群的完整过程，并对其在大语言模型推理任务中的性能表现进行了系统性评估。

Deephub 2025-08-16 20:14:46 0 收藏

ReasonRank：从关键词匹配到逻辑推理，排序准确性大幅超越传统方法

本文深入分析ReasonRank，一个采用自动化数据合成框架和两阶段训练策略（监督微调+强化学习）的先进段落重排器，该系统在信息检索领域实现了突破性的推理能力

Deephub 2025-08-15 19:58:29 0 收藏

Dots.ocr：告别复杂多模块架构，1.7B参数单一模型统一处理所有OCR任务

本文将深入分析Dots.ocr的技术架构特点、性能表现以及在实际应用中的价值，探讨这一模型如何在参数效率与处理能力之间找到最佳平衡点。

Deephub 2025-08-13 20:45:27 0 收藏

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

JAX代表了Python高性能数值计算领域的重要进展。通过提供与NumPy兼容的接口，结合强大的函数转换能力以及基于加速线性代数的高效硬件执行

Deephub 2025-08-12 20:28:25 0 收藏

提升LangChain开发效率：10个被忽视的高效组件，让AI应用性能翻倍

本文将系统分析LangChain框架中十个具有重要价值但使用率相对较低的核心组件，通过技术原理解析和实践案例说明，帮助开发者构建更高效、更智能、更具适应性的AI应用系统。

Deephub 2025-08-11 21:11:35 0 收藏

大型动作模型LAM：让企业重复任务实现80%效率提升的AI技术架构与实现方案

本文将深度剖析LAMs的技术架构，详细阐述其核心组件的设计原理、功能实现机制以及在实际业务场景中的应用模式

Deephub 2025-08-10 20:06:02 0 收藏

论文解读：单个标点符号如何欺骗LLM，攻破AI评判系统

本研究深入揭示了现有LLM评判器面临的系统性安全隐患，并提出了有效的防御解决方案。通过Master-RM模型的成功构建，证明了针对性的对抗训练能够在保持模型通用性能的前提下显著提升安全防护能力。

Deephub 2025-08-07 20:41:02 0 收藏

1
2
3
4
5
6
7
8
9

登录可以使用的更多功能哦！登录

OpenCV Python Pytorch Tensorflow 强化学习搜索和推荐数据分析数据挖掘机器学习概率论深度学习目标检测神经网络线性代数结构化数据自动驾驶自然语言处理计算机视觉语义分割语音识别

作者榜

资讯小助手

资讯同步

内容小助手

文章同步

Deephub

公众号：deephub-imba

奕凯

公众号：奕凯的技术栈