【机器学习监督学习】:从原理到实践,探索算法奥秘,揭示数据标注、模型训练与预测的全过程,助力人工智能技术应用与发展
本文详细介绍了五种经典的监督学习算法:线性回归、逻辑回归、支持向量机、决策树和随机森林。线性回归适用于回归问题,模型简单且易于解释。逻辑回归适用于二分类问题,模型简单且易于解释。支持向量机在处理高维数据和非线性可分问题时表现出色。决策树易于理解和解释,但容易过拟合。随机森林通过集成多个决策树,提高了
【AI知识点】内部协变量偏移(Internal Covariate Shift)
内部协变量偏移(Internal Covariate Shift) 是深度学习中的一个概念,它描述了在神经网络训练过程中,每一层的输入分布随着训练过程的变化而变化的现象。这种现象会增加训练的难度,导致网络收敛变慢,甚至可能影响模型的最终性能。

告别Print,使用IceCream进行高效的Python调试
本文将介绍**IceCream**库,这个专门用于调试的工具显著提升了调试效率,使整个过程更加系统化和规范化。
机器学习“捷径”:自动特征工程全面解析
在机器学习项目中,特征工程是影响模型性能的关键步骤。它通过从原始数据中提取出更有用的特征,帮助模型更好地捕捉数据中的模式。然而,传统的特征工程过程往往需要大量的领域知识和实验调整,是一项耗时费力的工作。近年来,自动特征工程(Automated Feature Engineering)技术的兴起,为这
AI基础知识
必会知识
Labelme AI 自动标注版使用说明【附下载链接】
Labelme 是一个开源的图像标注工具,主要用于机器学习和计算机视觉领域的数据集创建。能够帮助用户快速、方便地对图像进行标注,以便为训练模型提供高质量的数据。支持 jpg,jpeg,png,tif,tiff 图像格式,对图像进行多边形矩形、圆形、多段线、线段、点形式的标注,实现AI辅助标注,与手动
AI大模型如何赋能电商行业,引领变革?
AI大模型如何赋能电商行业,引领变革?
OMG-Seg:一个模型搞定所有分割任务的终极解决方案,大幅提升AI自动标注效率!
它采用了一种编码器-解码器架构,并使用任务特定的查询和输出来实现各种分割任务,显著简化了分割任务的部署。分割任务通常要求对图像或视频中的每个像素进行分类,传统上使用单独的模型来处理不同的分割任务,例如语义分割、实例分割、全景分割等。通过一个模型架构的多任务处理,OMG-Seg 展示了其在实际应用中的
LLM:模型微调经验
样本数量一般1万左右的高质量样本即可达到良好效果。对于简单任务,100-300条数据足够;中等难度任务需1000条以上;高难度任务需3000条甚至更多,可能达到10万条。样本质量样本质量优先于数量,高质量样本更有效。需要重点关注样本的多样性和答案质量。继续预训练当领域任务数据与预训练数据集差异较大时
基于AIACC加速器快速实现LLaMA-7B指令微调
是Meta AI在2023年2月发布的开放使用预训练语言模型(Large Language Model, LLM),其参数量包含7B到65B的集合,并仅使用完全公开的数据集进行训练。LLM具有建模大量词语之间联系的能力,但是为了让其强大的建模能力向下游具体任务输出,需要进行指令微调,根据大量不同指令
万余字描述国内外主流车型智能驾驶测试评价体验
车企逐鹿城市 NOA,体验是提高功能渗透率的核心自动驾驶大势所趋,小鹏、蔚来、理想、小米等新势力,长安、赛力斯、江淮、北汽等华为系以及吉利、上汽、长城、广汽等传统车企纷纷入场,竞相推出自家城市 NOA 方案,城市 NOA 正从“0-1”步向“1-10”。提高城市 NOA 渗透率,关键是提高消费者
通义千问AI PPT初体验:一句话、万字文档、长文本一键生成PPT!
通义千问AI PPT初体验:一句话、万字文档、长文本一键生成PPT!
OpenAI 的 o1 与 GPT-4o:深入探究 AI 的推理革命
wp:image在不断发展的人工智能领域,OpenAI 再次凭借其最新产品突破界限:o1 模型和 GPT-4o。作为一名几十年来一直报道科技的人,我见过不少伪装成革命的增量更新。但这个?这不一样。让我们拨开炒作的迷雾,看看这些新模型到底带来了什么。
头歌——人工智能(机器学习 --- 决策树1)
决策树的相关概念:决策树是一种可以用于分类与回归的机器学习算法,但主要用于分类。用于分类的决策树是一种描述对实例进行分类的树形结构。决策树由结点和边组成,其中结点分为内部结点和叶子结点,内部结点表示一个特征或者属性,叶子结点表示标签(脑回路图中黄色的是内部结点,蓝色的是叶子结点)。决策树的一个非常大
Mobile-Agent项目部署与学习总结(DataWhale AI夏令营)
你好,我是GISer Liu,一名热爱AI技术的GIS开发者,本文是DataWhale 2024 AI夏令营的最后一期——赛道,这是作者的学习文档,这里总结一下,和作者一起学习这个多模态大模型新项目吧😀;
ConvGRU原理与开源代码
ConvGRU(卷积门控循环单元)是一种结合了卷积神经网络(CNN)和门控循环单元(GRU)的深度学习模型。与ConvLSTM类似,ConvGRU也主要用于处理时空数据,特别适用于需要考虑空间特征和时间依赖关系的任务,如视频分析、气象预测和交通流量预测等。
【面试】如何度量概率分布的相似度
衡量两个概率分布之间差异的非对称度量,常用于变分推断和信息论。KL散度的对称形式,适合度量两个分布的相似度,广泛应用于GANs。衡量两个分布之间的全局差异,特别适合形状匹配和最优传输问题。度量两个分布之间的最大绝对差异,常用于统计检验和概率模型评价。
大模型-基于大模型的数据标注
法来自于这篇论文:Can Generalist Foundation Models Outcompete Special-Purpose Tuning?
【机器学习】标签编码(Label Encoding)、独热编码(One-Hot Encoding)
字符特征转数值特征的两种编码方式

贝叶斯统计中常见先验分布选择方法总结
本文详细介绍了贝叶斯统计中三种常见的先验分布选择方法:经验贝叶斯方法、信息先验和无信息/弱信息先验。