人工智能 - overfit.cn

标签噪声下的模型评估：如何准确评估AI模型的真实性能，提高模型性能测量的可信度

本文将深入探讨如何在考虑测试数据标签错误的前提下，估计模型的"真实"准确率，并分析标签噪声与模型性能评估之间的复杂关系。

Deephub 1 小时前 0 收藏

VideoMind：Chain-of-LoRA突破时间盲区让AI真正看懂长视频

**VideoMind** 是一种专为应对长视频中时间定位理解挑战而设计的新型视频语言代理。它不仅“观看”视频，还“分析”视频，采用一种结合了专门角色和名为 **Chain-of-LoRA** 的创新技术的策略。

Deephub 1 天前 0 收藏

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

本研究首先介绍经典GAN损失函数的理论基础，随后使用PyTorch实现包括原始GAN、最小二乘GAN(LS-GAN)、Wasserstein GAN(WGAN)及带梯度惩罚的WGAN(WGAN-GP)在内的多种损失函数。

Deephub 2 天前 0 收藏

DAPO: 面向开源大语言模型的解耦裁剪与动态采样策略优化系统

字节跳动提出的解耦裁剪和动态采样策略优化(DAPO)算法，完整开源了一套最先进的大规模RL系统，该系统基于Qwen2.5-32B基础模型在AIME 2024测试中取得了50分的优异成绩。

Deephub 3 天前 0 收藏

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

OpenAI提出的CLIP和Google研发的SigLIP模型重新定义了计算机视觉与自然语言处理的交互范式，

Deephub 4 天前 0 收藏

SWEET-RL：基于训练时信息的多轮LLM代理强化学习框架

本文将深入分析SWEET-RL如何改进AI代理在复杂协作任务中的训练方法。

Deephub 5 天前 0 收藏

时间序列异常检测：MSET-SPRT组合方法的原理和Python代码实现

MSET-SPRT框架通过上述两种技术的协同作用，为多元数据异常检测提供了准确且高效的解决方案，特别适用于高维度、高相关性的时间序列数据分析。

Deephub 6 天前 0 收藏

RAL-Writer Agent：基于检索与复述机制，让长文创作不再丢失关键信息

RAL-Writer Agent是一种专业的人工智能写作辅助技术，旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战，确保全文保持连贯性和相关性。

Deephub 7 天前 0 收藏

分位数回归+共形预测：Conformalized Quantile Regression实现更可靠的预测区间

本文将深入探讨CQR的理论基础、技术实现、与传统方法的比较，以及它在医疗、金融、能源和气候科学等多个领域的实际应用。

Deephub 8 天前 0 收藏

SANA-Sprint：基于连续时间一致性蒸馏的单步扩散模型，0.1秒即可生成图像

Nvidia 提出的 SANA-Sprint 是一种**混合蒸馏框架**，它整合了**连续时间一致性模型 (sCM)** 和 **潜在对抗扩散蒸馏 (LADD)**，

Deephub 9 天前 0 收藏

广义优势估计(GAE)：端策略优化PPO中偏差与方差平衡的关键技术

GAE的理论基础建立在资格迹(eligibility traces)和时序差分λ(TD-λ)之上，是近端策略优化(PPO)算法的重要基础理论

Deephub 10 天前 0 收藏

FlowMo: 模式搜索+扩散模型提升图像Token化性能

这个研究提出了FlowMo，一种基于Transformer的扩散自编码器，在多种比特率条件下实现了图像Token化的最新技术水平

Deephub 11 天前 0 收藏

SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架

该模型的核心创新在于**完全依靠强化学习机制（无需人工标注的交互轨迹）**来学习最优的搜索查询策略及基于检索知识的推理方法，从而显著提升问答任务的性能表现。

Deephub 12 天前 0 收藏

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

生成模型已成为人工智能领域的关键突破，赋予机器创建高度逼真的图像、音频和文本的能力。在众多生成技术中，扩散模型和Flow Matching尤为引人注目。

Deephub 13 天前 0 收藏

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

本文将深入探讨如何混合AMD/NVIDIA GPU集群以支持PyTorch分布式训练。

Deephub 14 天前 0 收藏

GoT：基于思维链的语义-空间推理框架为视觉生成注入思维能力

GoT框架通过引入"思维链"机制突破了这一限制，该机制在生成图像前会展开结构化推理过程。

Deephub 15 天前 1 收藏

RAG-Gym: 基于过程监督的检索增强生成代理优化框架

本文介绍了RAG-Gym框架，这是一种通过在搜索过程中实施细粒度过程监督来增强信息搜索代理的统一优化方法。

Deephub 16 天前 0 收藏

MiTS与PoTS：面向连续值时间序列的极简Transformer架构

本文详细阐述了使原始Transformer架构能够高效处理连续值时间序列数据所需的最小化结构调整方案。

Deephub 17 天前 0 收藏

信息检索系统评估指标的层级分析：从单点精确度到整体性能度量

现代评估指标体系正是基于这些真实用户行为模式设计的，并且随着研究不断深入，评估方法也在持续演进以捕获更多细微交互特征。

Deephub 18 天前 0 收藏

PyTorch PINN实战：用深度学习求解微分方程

PINN通过将物理定律（具体表现为微分方程）融入训练过程，显著提高了数据利用效率。

Deephub 19 天前 0 收藏

1
2
3
4
5

登录可以使用的更多功能哦！登录

OpenCV Python Pytorch Tensorflow 强化学习搜索和推荐数据分析数据挖掘机器学习概率论深度学习目标检测神经网络线性代数结构化数据自动驾驶自然语言处理计算机视觉语义分割语音识别

作者榜

资讯小助手

资讯同步

内容小助手

文章同步

Deephub

公众号：deephub-imba

奕凯

公众号：奕凯的技术栈