DeepSeek - overfit.cn

DeepSeek R1 的完整训练流程核心在于，在其基础模型 DeepSeek V3 之上，运用了多种强化学习策略。本文将从一个可本地运行的**基础模型**起步，并参照其技术报告，**完全从零开始构建** DeepSeek R1

Deephub 2025-02-24 11:20:25 1 收藏

本文介绍 DeepSeek-TS，该框架受到 DeepSeek 中高效的多头潜在注意力（MLA）和群组相对策略优化（GRPO）技术的启发，并将其应用于多产品时间序列预测。

Deephub 2025-02-08 10:16:35 0 收藏

DeepSeek-R1 通过创新的训练策略实现了显著的成本降低，同时保持了卓越的模型性能。本文将详细分析其核心训练方法。

Deephub 2025-02-05 09:48:25 0 收藏

登录可以使用的更多功能哦！登录

资讯同步

文章同步

公众号：deephub-imba

公众号：奕凯的技术栈