Datawhale AI 夏令营Task02:从baseline入门深度学习
Task2的内容在Task1的基础上更深入了一些,上次是初窥的话,这次就是深入入门了,已经进了深度学习这扇大门了,哈哈哈哈哈哈。之前就是扒在门框上偷偷看了几眼。言归正传,使用手册因为涉及的内容太多,所以讲的相对浅一些,其中涉及代码的部分也不多,主要是原理,并且更多的内容还需要大家自行查阅。代码的话则
美团的 AI 面试有点简单
数据增强是一种通过对原始数据集进行变换,生成新的训练样本的技术。这些变换包括图像翻转、旋转、缩放、裁剪以及其他各种手法,通过引入这些变化,可以有效地扩充数据集的规模,提高模型的泛化能力。是不是很简单?将原始数据集做一些变换然后送给模型做训练,此时裁剪出来的图片,可能就是猫咪尖尖的耳朵和大大的眼睛,训
【机器学习】梯度下降函数如何判断其收敛、学习率的调整以及特征缩放的Z-分数标准化
在机器学习中,特征缩放和学习率是两个非常重要的概念,它们对模型的性能和训练速度有显著影响
百川大模型微调指令详解
设定 beta2 为 0.98 比默认的 0.999 稍低,可能会使得优化过程对历史信息的依赖程度降低,从而提高优化过程的灵活性,但也可能增加训练过程中的噪声。在使用 Adam 或其他类似的优化算法(如 RMSprop、Adagrad)时,历史梯度对当前梯度的影响主要体现在如何计算梯度的动量(即梯度
从零入手人工智能(6)—— 聚类
在远古时代,人类就使用聚类算法将不同的物种进行分类,他们会把温和的食草动物归类为“安全动物”,会把长了4条腿的大型食肉猫科动物划分为“危险动物”。同时他们会把这个不同类型动物的特征告诉给他们的后代,后代会根据这些特征标签来对看到的动物进行分类,判断该动物是否存在危险。
深度学习实战:手把手教你构建多任务、多标签模型
在本文中,我们将基于流行的 MovieLens 数据集,使用稀疏特征来创建一个多任务多标签模型,并逐步介绍整个过程。所以本文将涵盖数据准备、模型构建、训练循环、模型诊断,最后使用 Ray Serve 部署模型的全部流程。
AI:224-机器学习在天气预测与气象模拟中的应用(保姆级教学)
本文深入探讨了机器学习在天气预测和气象模拟中的应用及其技术要点。通过机器学习技术,我们可以利用大量的气象数据进行分析和预测,从而提高天气预报的准确性和时效性,支持多个领域的实时决策和应用。
机器学习——支持向量机(SVM)(2)
中间的 虚线代表着,当 recall 增加 1%,我们的 FPR 也增加 1%,也就是说,每 捕捉出 一个少数 类,就会 有一个 多数类 被判错,这种情况下,模型的效果就不好,这种 模型捕获 少数类的结果,会让许多多数类 被误伤,从而增加成本。横坐标是 FPR,代表着 模型将多数类判断错误的 能力,
GitHub 斩获近 20,000 Star,创始人揭秘跨平台自动化 APP 开发 | Open AGI Forum
操作系统的垄断格局持续已久,旨在成为跨平台应用开发框架中间地带的Dioxus以黑马之姿亮相Github,颇受欢迎。它未来能成功吗?
阿里开源语音理解和语音生成大模型FunAudioLLM
阿里开源大模型FunAudioLLM,一个创新的框架,旨在促进人类与大型语言模型(LLMs)之间的自然语音交互。FunAudioLLM的核心是两个开创性的模型:用于语音理解的SenseVoice和用于语音生成的CosyVoice。
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
Gemma 是 Google 推出的轻量级、先进的开放模型系列,采用与 Gemini 模型相同的研究成果和技术构建而成。它们是仅使用解码器的文本到文本大型语言模型(提供英语版本),为预训练变体和指令调整变体具有开放权重。Gemma 模型非常适合各种文本生成任务,包括问题解答、摘要和推理。由于它们相对
国内外自动驾驶算法原理浅谈
国内厂商选择的方式成型快,但上限低。端到端的方式成型较慢,但是一旦预训练完成,将会疯狂迭代成长。但是其实……勤能补拙,不断加规则,总有一天也能应付99%的情况。
结合傅里叶变换和传统特征提取方法,通过XGBoost检测计算机生成图像
我个人认为,在模型无法区分的情况下,使用图像取证工具的人类将比机器学习模型更好地检测CGI,因为人类可以使用他们的先验知识逐个像素地评估图像,而模型只能依赖他们的训练数据。CGI检测模型对世界的了解是不完整的,而人类对世界的了解要大得多。为什么要应用傅里叶变换?而如何检测AI生成的图片变得越来越困难
【机器学习】探索数据矿藏:Python中的AI大模型与数据挖掘创新实践
随着人工智能技术的迅猛发展,AI大模型(如GPT、BERT等)在各类任务中展现了强大的能力。然而,这些大模型的背后是海量数据和复杂的算法支撑。在这篇博客中,我们将深入探讨如何利用Python进行数据挖掘,并结合AI大模型实现更高效、更精准的智能应用。本文将从数据获取与预处理、模型训练与优化、实际应用
评价类模型-基于熵权法的Topsis模型★★★★
基于熵权法的Topsis模型是对Topsis模型的补充,因为层次分析法具有较大的主观色彩,对于最终得分来说,缺乏客观性,而熵权法是基于数据本身进行分析,所以更加推荐使用熵权法。使用步骤与Topsis模型差不多,但是引入新的指标——信息效用值来评价问题,将信息效用值归一化后,再计算对于的权重。熵权法只
SpringBoot通过3种方式实现AOP切面
Spring框架凭借多种高效机制,显著增强了代码的功能性,并实现了切面编程(AOP)的精髓。其核心亮点之一,是运用动态代理技术,无需触动源代码即可在Bean的运行时为其动态织入额外功能,如日志记录、安全验证等,从而实现非侵入式的代码增强。此外,Java Agent技术,以AspectJ Weaver
SuperCLUE:中文大模型基准测评2024年上半年报告
SuperCLUE是一个中文通用大模型的综合性评测基准,其前身是CLUE(The Chinese Language Understanding Evaluation),自2019年成立以来,CLUE基准一直致力于提供科学、客观和中立的语言模型评测。SuperCLUE继承并发展了CLUE的测评体系,构
【人工智能】人工智能的历史发展与机器学习和神经网络
人工智能是如何工作的?机器学习和神经网络又是什么?
【工具推荐】使用LabelImg进行图像标注的详细教程(安装、使用、进阶技巧)
LabelImg 是一个功能强大且易用的图像标注工具,广泛应用于计算机视觉领域的数据集标注。本文详细介绍了 LabelImg 的简介、安装方法以及具体的使用教程。通过这些步骤,用户可以快速上手并高效完成图像标注任务。
【机器学习】解开反向传播算法的奥秘
在训练神经网络时,我们需要不断调整网络的权重和偏置参数,使得网络在训练数据上的输出值尽可能接近期望的目标值。这个过程可以看作是一个优化问题,目标是最小化一个损失函数(Loss Function)。反向传播算法就是用于计算损失函数关于网络参数的梯度的算法。前向传播(Forward Propagatio