机器学习/人工智能中的学习证明
在进行任何数学发展之前,我们必须首先了解学习的基础以及它如何与错误的概念密切相关。关于代价函数,它的工作原理是梯度下降原理。本文将回顾梯度下降原理。
CMU 10423 Generative AI:lec1
该文件是卡内基梅隆大学机器学习系的 “10-423/10-623 Generative AI” 课程第一讲的概述。生成式AI的定义和目标:介绍了生成式人工智能(GenAI)的基本概念,并讨论了其在人工智能(AI)的不同子目标(如感知、推理、控制、规划、通信、创造力和学习)中的应用。生成模型的多种形式
【数值模拟】参数化基本概念和参数化建模
介绍了参数化的概念,举例介绍了参数化建模流程,归纳了机器学习模型在参数化建模中的应用
Datawhale AI 夏令营 第五期-CV方向-Task1
基本概念:计算机视觉是研究如何让计算机能够像人类那样“看”的技术。基本流程:输入数据 —> 图像预处理 —> 进一步处理 —> 图像分析与理解主要CV技术:图像分类(Image Classification)、目标定位(Object Localization)、目标检测(Object Detecti
扩散模型理论与公式推导——详细过程速览与理解加深
推荐在简单了解扩散模型原理后再来看本篇文章,加深对理论的理解,本篇只叙述有关扩散模型公式理论的推导~
COLMAP进化版:Global Structure-from-Motion Revisited论文粗读(更新中)
从图像中恢复 3D 结构和相机运动一直是计算机视觉研究的长期焦点,被称为运动结构 (SfM)。这个问题的解决方案分为渐进式和全局式两种。到目前为止,最受欢迎的系统由于其卓越的准确性和鲁棒性而遵循增量范式,而全局方法的可扩展性和效率大大提高。在这项工作中,我们重新审视了全局 SfM 的问题,并提出 G
探秘AI动漫人物识别:MoeFlow
探秘AI动漫人物识别:MoeFlow MoeFlowRepository for anime characters recognition website, powered by TensorFlow项目地址:https://gitcode.com/gh_mirrors/mo/MoeFlow Moe
Transformer模型解析(附案例应用代码)
自注意力机制是Transformer模型的核心,它允许模型在编码每个单词时同时关注序列中的其他单词,从而捕捉到单词之间的依赖关系。位置编码的生成使用了正弦和余弦函数的不同频率,以确保编码在不同维度上具有不同的模式,从而使模型能够区分不同位置的单词。这样,每个头可以学习到序列的不同方面,最终的输出是所
Nat Med·UNI:开启计算病理学新篇章的自监督基础模型|顶刊精析·24-07-31
一作&通讯角色姓名单位(中文)第一作者哈佛医学院布里格姆和妇女医院病理科第一作者Tong Ding哈佛医学院工程与应用科学学院第一作者Ming Y. Lu哈佛医学院和麻省理工学院癌症项目通讯作者哈佛医学院布里格姆和妇女医院病理科这篇文章介绍了一个名为UNI的新型通用自监督模型,它在计算病理学领域通过
Optuna发布 4.0 重大更新:多目标TPESampler自动化超参数优化速度提升显著
Optuna这个备受欢迎的超参数优化框架在近期发布了其第四个主要版本。
监督学习、无监督学习、半监督学习、弱监督学习、强化学习 和 主动学习
弱监督学习通常指的是训练数据的标签质量不完全可靠,可能是不准确的、噪声较多的或是不完全的。例如,利用搜索引擎的结果为图像自动标注标签,这些标签可能不完全准确。
python入门——OSError: [WinError 127] 找不到指定的程序。 Error loading
最近在使用torch的时候突然出现错误,显示OSError: [WinError 127] 找不到指定的程序。我看了一些解决方法,说要重装torch,但我这前几天还没问题,好在我还记得最近下载的包有哪些,最后删除了seaborn包得以解决,在此分享。用anaconda进入环境,然后删除包。
一文理解多标签分类损失函数ASL(Asymmetric Loss)
一文理解asl,从ce到focal loss到asl
【有啥问啥】浅谈Scaling Law
在机器学习和深度学习领域,(扩展定律)描述了模型性能(如准确率、损失等)如何随着模型规模(参数数量)、数据量和计算资源(如计算时间、显存等)的变化而变化。这些定律有助于研究人员和工程师理解如何有效地扩展模型以获得更好的性能。在深度学习的早期阶段,人们主要通过经验和试验来确定模型规模和训练数据量。然而
一文了解人工智能顶会IJCAI 2024的研究热点
本文可视化了人工智能顶会IJCAI 2024的研究热点,归纳和总结了热门研究方向,可以为读者跟踪人工智能的研究热点提供一些有价值的参考。
灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍
灵办AI的新模型为用户提供了丰富的功能和应用场景,包括小灵助手、科研学术深度解读、代码编程支持、学习辅导和图书报告等。每个功能模块都经过精心设计,旨在满足用户在不同领域的需求。通过精准的知识提炼、高效的学习辅导和便捷的编程支持,灵办AI不仅提升了用户的工作和学习效率,也为个人成长和职业发展提供了强有
动量迭代快速梯度符号方法(Momentum Iterative FGSM,MI-FGSM)原理及实现
而动量机制通过累积多次迭代的梯度信息,可以更全面地利用这些梯度信息,从而在更大范围内找到模型的弱点,增强对抗攻击的效果。而动量机制通过累积多个梯度信息,可以帮助模型摆脱局部最优解的困扰,更容易找到全局最优解或更好的局部最优解,从而生成更强的对抗样本。MI-FGSM 将动量引入到 FGSM 中,通过在
20240809 每日AI必读资讯
在多个数学基准测试中数学能力显著超越了开源模型包括Llama-3.1-405B,甚至超过了闭源模型 (包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro )。大多数方法要么在图像的像素层面上逐步生成,要么通过先训练一个压缩图像的模型,再在低分辨率的图像上进行处理。-
梅尔频谱图(Mel Spectrogram)和梅尔频率倒谱系数(MFCC)
音频信号 -> 预处理 -> 分帧 -> 加窗 -> FFT -> 功率谱 -> 梅尔滤波器组 -> 对数压缩 -> 梅尔频谱图。梅尔频谱图是将音频信号的频谱表示转换到梅尔频率标度上,并通过一组梅尔滤波器对频谱进行加权平均后得到的结果。MFCC:通过对梅尔频谱图的离散余弦变换和压缩,提取了更紧凑和不
人工智能的核心技术有哪些?
NLP技术包括文本分类、情感分析、信息抽取等多个方面,能够自动识别文档中的关键信息,如人物、地点、时间等,甚至能够将合同中的条款提取出来制作成表格。它通过声音信息采集、数模转码、过滤、调制解调等步骤,将人类的语音转化为计算机可识别的文本或指令。在机器人技术领域,由于机器人技术涉及多个学科的交叉,没有