华为云云耀云服务器L实例评测|在服务器上训练手写数字识别模型并部署到服务器上实现远程调用
今天作者就用华为新出的云耀云服务器L实例来整个活——使用云耀云服务器来训练手写数字识别神经网络,并将该模型部署在云耀云服务器L实现远程调用数字识别服务。测试集准确率99.3%,并提供神经网络代码、服务端代码、客户端代码
LongLoRA:不需要大量计算资源的情况下增强了预训练语言模型的上下文能力
麻省理工学院和香港中文大学推出了LongLoRA,这是一种革命性的微调方法,可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。
LabVIEW AI视觉工具包(非NI Vision)下载与安装教程
LabVIEW AI视觉工具包(非NI Vision)下载与安装教程
分类任务使用Pytorch实现Grad-CAM绘制热力图
给大家打个比方,下图是我输出模型结构的一小块,此时如果我设定target_layers=[model.patch_embed_a],那它就相当于被我设置成一个元组,但这样是无法应用在这个代码上的,我们需要继续细化到某一层,比如改成target_layers=[model.patch_embed_a.
【ChatGPT】ChatGPT使用指南——文本生成
文本摘要任务指的是用精炼的文本来概括整篇文章的大意,使得用户能够通过阅读摘要来大致了解文章的主要内容。抽取式摘要:从原文档中提取现成的句子作为摘要句。压缩式摘要:对原文档的冗余信息进行过滤,压缩文本作为摘要。生成式摘要:基于NLG技术,根据源文档内容,由算法模型自己生成自然语言描述。以下是一个基于m
[ 可视化 ] 经典网络模型 —— Grad-CAM 详解与复现
[ 可视化 ] 经典网络模型 —— Grad-CAM 详解与复现1、Grad-CAM;2、Grad-CAM 详解;论文贡献;原理介绍;Grad-CAM 可视化流程;Grad-CAM 计算;Guided Grad-CAM;实例展示;评估 Grad-CAM 定位能力,Grad-CAM 图像分类、视觉解释
Batchnorm 和Layernorm 区别
对比Batchnorm和Layernorm的区别
深度学习2.神经网络、机器学习、人工智能
深度学习属于机器学习的范畴,深度学习可以说是在传统神经网络基础上的升级,约等于神经网络。深度学习和传统机器学习在数据预处理上都是类似的。核心差别在特征提取环节,深度学习由机器自己完成特征提取,不需要人工提取。学习能力强覆盖范围广,适应性好数据驱动,上限高可移植性好计算量大,便携性差硬件需求高模型设计
Diffusion Models 简单代码示例
扩散模型的目标是通过数据在潜在空间(latent space)的扩散过程,学习数据的潜在向量结构(latent structure),通俗点说,扩散模型学习利用数据逐步变成噪声的过程,学习反向的去噪声过程。基于 GAN 生成模型,基于 VAE 的生成模型,以及基于 flow 的生成模型它们都可以生成
运动想象代码复现,数据集BCI IV-2a
运动想象代码复现
前向传播(Forward Propagation)与反向传播(Back Propagation)举例
前向传播(Forward Propagation)与反向传播(Back Propagation)
使用 Temporal Fusion Transformer 进行时间序列预测
Temporal Fusion Transformer(TFT)是一个基于注意力的深度神经网络,它优化了性能和可解释性,顶层架构如下图所示。TFT架构的优点如下:能够使用丰富的特征:TFT支持三种不同类型的特征:外生类别/静态变量,也称为时不变特征;具有已知输入到未来的时态数据,仅到目前已知的时态数
【AI】AI入门之Nvidia Jetson平台(四)- Xavier NX软件开发环境安装部署
AI人工智能,深度学习,Jetson嵌入式平台,Ubuntu系统
【Debug记录】深度学习Pytorch+Anaconda环境下常见报错的原因及解决方案 | 亲测已解决
001.“AssertionError: Torch not compiled with CUDA enabled”、 002.“RemoveError: 'requests' is a dependency of conda and cannot be removed from conda's o
9月人工智能论文和项目推荐
因为LLM的火爆,所以最近的论文都是和LLM相关的
AI框架:9大主流分布式深度学习框架简介
转载翻译Medium上一篇关于分布式深度学习框架的文章。
人类智能的本质、模型和原理——看了这么多AI人工智能,你有没有思考过到底什么才是 HI 人类智能?
人类智力是一种复杂的现象,涉及到许多不同的领域,包括心理学、神经科学、计算机科学等。数学模型和物理模型是研究人类智力的两个重要工具,可以帮助我们更好地理解人类智力的本质和机制。本文将分别介绍人类智能的本质和背后的数学模型和物理模型,探讨它们在研究人类智力中的作用和应用。
【人工智能】大模型技术生态
大模型技术是指基于深度学习等机器学习技术,利用大规模数据进行训练得到的巨型神经网络模型。它可以在自然语言处理、视觉识别、语音识别等领域中实现更加准确、智能化的任务,具有非常强的应用前景。从模型大小来看,常见的大模型包括BERT、GPT-3、Turing NLG等,其中包含数十亿或数百亿参数,需要庞大
条件DDPM:Diffusion model的第三个巅峰之作
条件DDPM:Diffusion model的第三个巅峰之作
EfficientFormer:高效低延迟的Vision Transformers
我们都知道Transformers相对于CNN的架构效率并不高,这导致在一些边缘设备进行推理时延迟会很高,所以这次介绍的论文EfficientFormer号称在准确率不降低的同时可以达到MobileNet的推理速度。