美团的 AI 面试有点简单
数据增强是一种通过对原始数据集进行变换,生成新的训练样本的技术。这些变换包括图像翻转、旋转、缩放、裁剪以及其他各种手法,通过引入这些变化,可以有效地扩充数据集的规模,提高模型的泛化能力。是不是很简单?将原始数据集做一些变换然后送给模型做训练,此时裁剪出来的图片,可能就是猫咪尖尖的耳朵和大大的眼睛,训
【机器学习】梯度下降函数如何判断其收敛、学习率的调整以及特征缩放的Z-分数标准化
在机器学习中,特征缩放和学习率是两个非常重要的概念,它们对模型的性能和训练速度有显著影响
百川大模型微调指令详解
设定 beta2 为 0.98 比默认的 0.999 稍低,可能会使得优化过程对历史信息的依赖程度降低,从而提高优化过程的灵活性,但也可能增加训练过程中的噪声。在使用 Adam 或其他类似的优化算法(如 RMSprop、Adagrad)时,历史梯度对当前梯度的影响主要体现在如何计算梯度的动量(即梯度
从零入手人工智能(6)—— 聚类
在远古时代,人类就使用聚类算法将不同的物种进行分类,他们会把温和的食草动物归类为“安全动物”,会把长了4条腿的大型食肉猫科动物划分为“危险动物”。同时他们会把这个不同类型动物的特征告诉给他们的后代,后代会根据这些特征标签来对看到的动物进行分类,判断该动物是否存在危险。
深度学习实战:手把手教你构建多任务、多标签模型
在本文中,我们将基于流行的 MovieLens 数据集,使用稀疏特征来创建一个多任务多标签模型,并逐步介绍整个过程。所以本文将涵盖数据准备、模型构建、训练循环、模型诊断,最后使用 Ray Serve 部署模型的全部流程。
AI:224-机器学习在天气预测与气象模拟中的应用(保姆级教学)
本文深入探讨了机器学习在天气预测和气象模拟中的应用及其技术要点。通过机器学习技术,我们可以利用大量的气象数据进行分析和预测,从而提高天气预报的准确性和时效性,支持多个领域的实时决策和应用。
阿里开源语音理解和语音生成大模型FunAudioLLM
阿里开源大模型FunAudioLLM,一个创新的框架,旨在促进人类与大型语言模型(LLMs)之间的自然语音交互。FunAudioLLM的核心是两个开创性的模型:用于语音理解的SenseVoice和用于语音生成的CosyVoice。
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
Gemma 是 Google 推出的轻量级、先进的开放模型系列,采用与 Gemini 模型相同的研究成果和技术构建而成。它们是仅使用解码器的文本到文本大型语言模型(提供英语版本),为预训练变体和指令调整变体具有开放权重。Gemma 模型非常适合各种文本生成任务,包括问题解答、摘要和推理。由于它们相对
国内外自动驾驶算法原理浅谈
国内厂商选择的方式成型快,但上限低。端到端的方式成型较慢,但是一旦预训练完成,将会疯狂迭代成长。但是其实……勤能补拙,不断加规则,总有一天也能应付99%的情况。
结合傅里叶变换和传统特征提取方法,通过XGBoost检测计算机生成图像
我个人认为,在模型无法区分的情况下,使用图像取证工具的人类将比机器学习模型更好地检测CGI,因为人类可以使用他们的先验知识逐个像素地评估图像,而模型只能依赖他们的训练数据。CGI检测模型对世界的了解是不完整的,而人类对世界的了解要大得多。为什么要应用傅里叶变换?而如何检测AI生成的图片变得越来越困难
【机器学习】探索数据矿藏:Python中的AI大模型与数据挖掘创新实践
随着人工智能技术的迅猛发展,AI大模型(如GPT、BERT等)在各类任务中展现了强大的能力。然而,这些大模型的背后是海量数据和复杂的算法支撑。在这篇博客中,我们将深入探讨如何利用Python进行数据挖掘,并结合AI大模型实现更高效、更精准的智能应用。本文将从数据获取与预处理、模型训练与优化、实际应用
评价类模型-基于熵权法的Topsis模型★★★★
基于熵权法的Topsis模型是对Topsis模型的补充,因为层次分析法具有较大的主观色彩,对于最终得分来说,缺乏客观性,而熵权法是基于数据本身进行分析,所以更加推荐使用熵权法。使用步骤与Topsis模型差不多,但是引入新的指标——信息效用值来评价问题,将信息效用值归一化后,再计算对于的权重。熵权法只
SuperCLUE:中文大模型基准测评2024年上半年报告
SuperCLUE是一个中文通用大模型的综合性评测基准,其前身是CLUE(The Chinese Language Understanding Evaluation),自2019年成立以来,CLUE基准一直致力于提供科学、客观和中立的语言模型评测。SuperCLUE继承并发展了CLUE的测评体系,构
【人工智能】人工智能的历史发展与机器学习和神经网络
人工智能是如何工作的?机器学习和神经网络又是什么?
【工具推荐】使用LabelImg进行图像标注的详细教程(安装、使用、进阶技巧)
LabelImg 是一个功能强大且易用的图像标注工具,广泛应用于计算机视觉领域的数据集标注。本文详细介绍了 LabelImg 的简介、安装方法以及具体的使用教程。通过这些步骤,用户可以快速上手并高效完成图像标注任务。
【机器学习】解开反向传播算法的奥秘
在训练神经网络时,我们需要不断调整网络的权重和偏置参数,使得网络在训练数据上的输出值尽可能接近期望的目标值。这个过程可以看作是一个优化问题,目标是最小化一个损失函数(Loss Function)。反向传播算法就是用于计算损失函数关于网络参数的梯度的算法。前向传播(Forward Propagatio
GPT-4o mini:开启人工智能新篇章
GPT-4和GPT-4o不是早就出来了吗?为什么GPT-4o mini的出世引来这么大的轰动呢?因为它免费、因为它快、因为它接口便宜、因为它同步开启了GPT-4o-mini-2024-07-18的微调。因为你还没有点开文章,所以不知道啊~
精简模型,提升效能:线性回归中的特征选择技巧
递归特征消除(RFE)、顺序前向选择(SFFS)、和顺序后向选择(SBFS)都表明,‘weight’、‘model year’和‘horsepower’是最重要的特征。仅使用这三个特征,我们就能获得可靠的 R² 分数0.823,与使用七个特征的基础模型相比,其 R² 分数也是0.823。(这些 R²
【人工智能】穿越科技迷雾:解锁人工智能、机器学习与深度学习的奥秘之旅
在这个科技飞速发展的时代,人工智能(AI)正深刻改变着我们的生活。在本文中,我们将首先概览人工智能的广阔天地,包括其基本概念、发展历程以及推动其发展的三大关键要素,通过生动的案例,让读者对人工智能有一个初步而全面的认识。随后,我们将深入机器学习的腹地,从基础概念讲起,逐步剖析机器学习的工作流程、特征