Yolov5--从模块解析到网络结构修改(添加注意力机制)
文章目录1.模块解析(common.py)01. Focus模块02. CONV模块03.Bottleneck模块:04.C3模块05.SPP模块2.为yolov5添加CBAM注意力机制最近在进行yolov5的二次开发,软件开发完毕后才想着对框架进行一些整理和进一步学习,以下将记录一些我的学习记录。
SE注意力机制
SE注意力机制虽然基础,但是非常好用,也是应用最广泛的注意力机制之一,在此记录学习
Keras可视化神经网络架构的4种方法
keras 中有一些现成的包可以创建我们的神经网络模型的可视化表示。
使用PyTorch进行小样本学习的图像分类
我们将从几个样本中学习的问题被称为“少样本学习 Few-Shot learning”。我们将从几个样本中学习的问题被称为“少样本学习 Few-Shot learning”。少样本学习是机器学习的一个子领域。
【目标检测】YOLOv5遇上知识蒸馏
本文主要来研究知识蒸馏的相关知识,并尝试用知识蒸馏的方法对YOLOv5进行改进。
【CV】第 1 章:计算机视觉和 TensorFlow 基础知识
上述代码导入了机器学习和计算机视觉工作所需的Python库,例如用于处理数组的 NumPy、用于 openCV 计算机视觉工作的 cv2、用于处理Python代码中的图像的 PIL 以及用于绘制结果的M atplotlib。但是,一阶导数法的问题是,根据输入函数的不同,最大值会发生变化,因此无法预先
CSDN独家 | 全网首发 | Pytorch深度学习·理论篇(2023版)目录
本专栏将通过系统的深度学习实例,从可解释性的角度对深度学习的原理进行讲解与分析,通过将深度学习知识与Pytorch的高效结合,帮助各位新入门的读者理解深度学习各个模板之间的关系,这些均是在Pytorch上实现的,可以有效的结合当前各位研究生的研究方向,设计人工智能的各个领域,是经过一年时间打磨的精品
PhyGeoNet一种可用于不规则区域的物理信息极限学习机
主要就是解决了CNN求解域为非规则形状这样问题,同时将物理信息嵌入CNN中,实现了物理数据双驱动。
基于yolov5框架实现人流统计(目标检测算法、目标追踪算法以及越界识别功能)+手机获取统计人数
基于yolov5框架实现人流统计(主要AI算法包括:目标检测算法、目标追踪算法以及越界识别功能)+手机获取统计人数(喵提醒)
手把手带你玩转Spark机器学习-深度学习在Spark上的应用
本文将介绍深度学习在Spark上的应用,我们将聚焦于深度学习Pipelines库,并讲解使用DL Pipelines的方式。我们将讲解如何通过Pipelines实现Transfer Learning,同时通过预训练模型实现来处理少量数据并实现预测。本文主要介绍深度学习在Spark上的应用,以花卉图片
PyTorch中的多GPU训练:DistributedDataParallel
本文将介绍DistributedDataParallel,DDP 基于使用多进程而不是使用多线程的 DP,可以扩充到多机多卡的环境,所以他是分布式多GPU训练的首选。
改进YOLOv5系列:增加Swin-Transformer小目标检测头
增加一个SwinTransformer检测头结构
从0基础文科生到全国亚军,我的人工智能学习路径
绝对不是标题党,第一张图就是真相,3000字零基础长文,主要讲3部分内容:一、我为什么要转型搞人工智能?二、我的人工智能自学方法三、对同样有转型想法的人的建议
基于深度学习的Deepfake检测综述
在过去的几年里已经进行了数百项研究,发明和优化各种使用 AI 的 Deepfake 检测,本文主要就是讨论如何对 Deepfake 进行检测
Pytorch+Python实现人体关键点检测
用Python+Pytorch工程代码对人体进行关键点检测和骨架提取,并实现可视化。
12个常用的图像数据增强技术总结
扩展用于训练模型的数据量的过程称为数据增强。通过训练具有多种数据类型的模型,我们可以获得更“泛化”的模型。
图像处理黑科技—破解文档识别难题(PS检测、弯曲拉平、切边切片、摩尔纹)
我们把 OCR 比做 AI 技术的一双慧眼,帮助人工智能看清所有需要处理的文字内容、符号信息,然而目前低质文档图像的识别问题似乎已经成为 AI 技术落地中的瓶颈,文档图像作为一种非结构化数据,其分析识别面临一些技术难点。
最新|全新风格原创YOLOv7、YOLOv5和YOLOX网络结构解析图
分享一下绘制的全新风格 YOLOv5网络结构图、YOLOv7网络结构图和YOLOX网络结构图
深度学习visio作图技巧
不显示跨线:设计→连接线,取消显示 跨线的勾选。
图卷积神经网络GCN及其Pytorch实现
ICLR作为机器学习方向的顶会,最近看了ICLR2023 Openreview的论文投稿分析,通过2022和2023年论文关键词、标题高频词等信息的可视化比较。根据前十的关键词频率排名频率来看,基本上和去年保持一致,大火的领域依旧大火。但是可以明显看到前五名关键词的频率差距逐渐减少。有意思的是这一关