计算机视觉中的注意力机制
注意力机制(Attention Mechanism)源于对人类视觉的研究。 在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。 上述机制通常被称为注意力机制。 人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度(Acuity),只有视网膜中央凹部位具
简明扼要理解YOLOX
由于疫情已经居家办公2周了,明天就可以正常通勤上班了,内心还有点小小的期待呢。趁着这三月暖暖的春风和屋外喳喳的鸟叫声,咱们来梳理一下YOLOX算法。如果对YOLO 系列算法还不了解的同学,请先找找相关的文章了解一下也可以看看我前面的这篇:简明扼要理解YOLO v3https://blog.csdn.
yoloV5-face学习笔记
yolov5-face是在yolov5的基础上添加了人眼关键点检测。首先放上大佬的开源代码:https://github.com/deepcam-cn/yolov5-face一 代码复现原作者代码的注释非常少,很难直接跑通。1.下载WIDERFace数据集图片上图为https://github.co
[ 注意力机制 ] 经典网络模型3——ECANet 详解与复现
[ 注意力机制 ] 经典网络模型3——ECANet 详解与复现1、Efficient Channel Attention Module2、ECANet 详解3、ECANet 复现简称 ``ECA``,2020年 提出的一种 ``高效通道注意力(ECA)模块`` ;该模块只涉及少数几个 参数,但具有明
混淆矩阵 (Confusion Matrix)
假设现在有一个分类器A,这个分类器A的作用是告诉一张图片是不是汉堡,那我想知道这个分类器A的效果好不好,应该怎么办呢?最简单的方法是将大量的样本放进到费雷其A当中,让他自己判断这些图片是不是汉堡。经过上面的过程就可以得到一张表格:实际上这张表格是非常庞大的。有成千上万的图片,当他的维度十分大的时候是
yolov7:win10下的安装配置以及训练自己的数据集(从VOC转换为YOLO)
Win10下yolov7的安装配置以及训练自己的数据集(从VOC转换为YOLO)
YOLOv5改进之十三:主干网络C3替换为轻量化网络EfficientNetv2
前 言:作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv5的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效
CVPR2022论文列表(中英对照)
CVPR论文列表,中英对照
90+个各种疾病相关医疗数据集
含新冠、传染病、医学图像等
【Pytorch】torch.nn.LeakyReLU()
Hello!ଘ(੭ˊᵕˋ)੭昵称:海轰标签:程序猿|C++选手|学生简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!唯有努力💪本文仅记录自己感兴趣的内容文章仅作为个人学习笔
保姆级官方yolov7的训练自己的数据集以及项目部署
保姆级官方yolov7训练自己数据集的教学,并且可以直接嵌入到项目开发中用于检测
GAN(生成对抗网络)的系统全面介绍(醍醐灌顶)
本文是关于GAN学习的较为系统全面的介绍,主要针对初学者,希望能够对大家带来帮助。
【李宏毅《机器学习》2022】作业1:COVID 19 Cases Prediction (Regression)
文章目录【李宏毅《机器学习》2022】作业1:COVID 19 Cases Prediction (Regression)作业内容1.目标2.任务描述3.数据4.评价指标代码1.下载数据2.导入软件包3.定义公用函数(这一部分不需要修改)4.数据集5.神经网络模型6.特征选择7.训练器8.超参数设置
【深度学习】损失函数详解
损失函数
【OpenCV-Python】:查找物体轮廓+计算轮廓面积、长度、重心
😺一、查找物体轮廓🐶1.1 函数API函数:img, contours, hierarchy = cv2.findContours(image, mode, method[, contours[, hierarchy[, offset ]]]).
学习笔记:多模态
1.多模态数据:不同的存在形式或信息来源均可被称之为一种模态。由两种或两种以上模态组成的数据称之为多模态数据(多模态用来表示不同形态的数据形式,或者同种形态不同的格式,一般表示文本、图片、音频、视频、混合数据)。多模态数据是指对于同一个描述对象,通过不同领域或视角获取到的数据,并且把描述这些数据的每
【深度学习】Pytorch实现CIFAR10图像分类任务测试集准确率达95%
文章目录前言CIFAR10简介Backbone选择训练+测试训练环境及超参设置完整代码部分测试结果完整工程文件Reference前言分享一下本人去年入门深度学习时,在CIFAR10数据集上做的图像分类任务,使用了多个主流的backbone网络,希望可以为同样想入门深度学习的同志们,提供一个方便上手、
GANs系列:CGAN(条件GAN)原理简介以及项目代码实现
cGAN的中心思想是希望 可以控制 GAN 生成的图片,而不 是单纯的随机生成图片。 具体来说,Conditional GAN 在生成器和判别器的输入中 增加了额外的 条件信息,生成器生成的图片只有足够真实 且与条件相符,才能够通过判别器。
YOLO系列 --- YOLOV7算法(三):YOLO V7算法train.py代码解析
YOLO系列 --- YOLOV7算法(三):YOLO V7算法train.py代码解析
CLIP论文详解
CLIP算是在跨模态训练无监督中的开创性工作,作者在开头梳理了现在vision上的训练方式,从有监督的训练,到弱监督训练,再到最终的无监督训练。这样训练的好处在于可以避免的有监督的 categorical label的限制,具有zero-shot性质,极大的提升了模型的实用性能。这篇文章中作者提到早