pytorch性能分析工具Profiler
PyTorch Profiler 是一个开源工具,可以对大规模深度学习模型进行准确高效的性能分析。分析model的GPU、CPU的使用率各种算子op的时间消耗trace网络在pipeline的CPU和GPU的使用情况Profiler利用可视化模型的性能,帮助发现模型的瓶颈,比如CPU占用达到80%,
Stability AI发布基于稳定扩散的音频生成模型Stable Audio
近日Stability AI推出了一款名为Stable Audio的尖端生成模型,该模型可以根据用户提供的文本提示来创建音乐。
基于CNN-Transformer时间序列预测模型
基于CNN-Transformer时间序列预测模型
图注意网络(GAT)的可视化实现详解
能够可视化的查看对于理解图神经网络(gnn)越来越重要,所以在这篇文章中,我将介绍传统GNN层的实现,然后展示ICLR论文“图注意力网络”中对传统GNN层的改进。
GAN(生成式对抗网络)简介
相比于其他生成模型,GAN具有更高的生成能力和更好的生成效果,因此受到了广泛的关注和研究。在未来的发展中,我们可以看到GAN的模型结构和训练方法不断改进,生成模型的质量和多样性不断提高,从而更好地服务于各个领域的应用。GAN在图像生成中的应用最为广泛。GAN在图像生成、文本生成、语音生成等领域都取得
论文中常用的注意力模块合集(上)
在深度卷积神经网络中,通过构建一系列的卷积层、非线性层和下采样层使得网络能够从全局感受野上提取图像特征来描述图像,但归根结底只是建模了图像的空间特征信息而没有建模通道之间的特征信息,整个特征图的各区域均被平等对待。在一些复杂度较高的背景中,容易造成模型的性能不佳,因此可以引入注意力机制,而注意力机制
【AI绘图学习笔记】Latent Diffusion Model(上)——论文解读
我们来看一些主要的生成模型:第一个GAN生成对抗网络,可以分为判别器和生成器两个部分,总体思想就是:我们先对判别器进行训练,让其判断给出的inputxxx是否为生成器所生成的(二分类问题判断real or fake),在一段时间的训练后,判别器的准确度会达到很高的水准。接下来我们再训练生成器使其骗过
cycle_gan使用教程
cycle_gan
Colossal-AI简介
图片来源:分布式系统由多个软件组件组成,在多台机器上运行。例如,传统的数据库运行在一台机器上。随着数据量的爆发式增长,单台机器已经不能为企业提供理想的性能。特别是在双十一这样的网络狂欢节,网络流量会出乎意料的大。为了应对这种压力,现代高性能数据库被设计成在多台机器上运行,它们共同为用户提供高吞吐量
YOLOv5_5.0训练自己的数据集
使用YOLOv5训练自己的数据集
【机器学习】验证集loss震荡(loss的其他问题)
训练过程中发现,train loss一直下降,train acc一直上升;但是val loss、val acc却一直震荡。loss一会上一会下,但是总体趋势是向下的。“loss震荡但验证集准确率总体下降” 如何解决?
Recognize Anything:一个强大的图像标记模型
Recognize Anything是一种新的图像标记基础模型,与传统模型不同,它不依赖于手动注释进行训练;相反,它利用大规模的图像-文本对
【混合精度训练】 torch.cuda.amp.autocast()
【混合精度训练】 torch.cuda.amp.autocast()
深入浅出CenterFusion
结合论文和代码理解CenterFusion
Python SolidWorks 二次开发---Python如何连接SolidWorks
用Python来进行SolidWorks的二次开发其实是有点非主流的,因为Python本身的特性导致程序运行的效率会比VBA等SolidWorks原生支持的二次开发软件运行效率降低50%以上,用Python仅仅是因为语法简单,实现起来快捷,且所开发的功能仅供个人提高效率使用。这里记录一些开发过程,如
用C++部署yolov5模型
要在C语言中部署YoloV5模型,可以使用以下步骤:安装C语言的深度学习库,例如Darknet或者ncnn。下载训练好的YoloV5模型权重文件(.pt文件)和模型配置文件(.yaml文件)。将下载的权重文件和配置文件移动到C语言深度学习库中指定的目录下。在C语言中编写代码,使用深度学习库加载Yol
【人工智能】大模型的本质:在超高维空间上对人类全部知识的高度压缩映射
大模型是指具有超过一千万个参数的深度神经网络模型。目前,大模型主要应用于自然语言处理、图像识别和推荐系统等领域。大模型通常采用非常复杂的结构和算法,以便在海量数据中提取出最有效的特征。本文详细介绍了大模型的定义、本质、优势、挑战、应用、训练技术、评估标准和未来发展趋势。大模型作为人工智能领域的前沿技
网络梯度为None、参数不更新解决思路(又名“魔改代码的报应”)
网络梯度为None、参数不更新的解决思路
PyTorch深度学习实战(15)——迁移学习
迁移学习通过利用相关任务或领域的知识,帮助解决新任务或领域中的学习挑战,可以提高模型的泛化能力、加速模型训练,并在实际应用中取得良好的效果。在图像分类、目标检测、机器翻译等任务中,迁移学习已经展现出巨大的应用价值。在本节中,介绍了迁移学习的基本概念,并使用 PyTorch 构建了迁移学习模型,利用预
基于pointpillars的点云目标检测、测试评估、TensorRT后量化及ROS可视化
参考:https://github.com/traveller59/kitti-object-eval-python,把相应的的依赖函数提取出来了,不需要单独安装second-1.5.1,spconv-1.0。也可以混合精度测试,通过修改config里的yaml参数,测试评估时要保证路径一一对应。可