递归门控卷积HorNet(gn_conv)阅读笔记
HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions ECCV2022程序视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种
基于深度学习的图像超分辨率——综述
基于深度学习的图像超分辨率重建
浅谈CVPR2022的几个研究热点
CVPR2022刚刚结束,作为影响力最广的视觉盛会,今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴,已经磨拳擦掌,准备向CVPR2023投稿了。基于今年的工作,到底哪些领域是CVPR关注的热点?哪些领域的工作,接受度更高,oral的比例更大呢?基于CVPR官方最新的统计信息,
手部21个关键点检测+手势识别-[MediaPipe]
MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架,可以直接调用其API完成目标检测、人脸检测以及关键点检测等。本篇文章介绍其手部21个关键点检测(win10,python版)MediaPipe官网:https://github.com/google
动手学深度学习(五十)——多头注意力机制
文章目录1. 为什么用多头注意力机制2. 什么是多头注意力机制3. 多头注意力机制模型和理论计算4. 动手实现多头注意力机制层小结练习1. 为什么用多头注意力机制所谓自注意力机制就是通过某种运算来直接计算得到句子在编码过程中每个位置上的注意力权重;然后再以权重和的形式来计算得到整个句子的隐含向量表示
Diffusion models代码实战:从零搭建自己的扩散模型
这个系列曾经写过三篇文章专门讲代码,分别从数据集、超参数、loss设计、参数计算、Unet结构、正向过程、逆向过程等部分详细介绍了如何搭建DDPM。Diffusion models领域发展神速,最近半年代表作品有OpenAI的GLIDE、DALL-E 2,Google Brain的ImageGen,
GNN的理解与研究
GNN理解
AlexNet模型及代码详解
Alex在2012年提出的alexnet网络结构模型引爆了神经网络的应用热潮,并赢得了2012届图像识别大赛的冠军,使得CNN成为在图像分类上的核心算法模型。该网络的亮点在于:(1)首次使用了GPU进行网络加速训练。(2)使用了ReLU激活函数,而不是传统的Sigmoid激活函数以及Tanh激活函数
深度学习系列37:CLIP模型
含义:CLIP(Contrastive Language-Image Pre-training)git地址:https://github.com/openai/CLIPpaper:https://arxiv.org/abs/2103.00020安装:pip install git+https://g
Pytorch ----注意力机制与自注意力机制的代码详解与使用
注意力机制的核心重点就是让网络关注到它更需要关注的地方 。当我们使用卷积神经网络去处理图片的时候, 我们会更希望卷积神经网络去注意应该注意的地方,而不是什么都关注 ,我们不可能手动去调节需要注意的地方,这个时候,如何让卷积神经网络去自适应的注意重要的物体变得极为重要。注意力机制 就是实现网络自适应注
MoCo代码分析 [自监督学习]
关键词:MoCo 源码分析。
Yolov5--从模块解析到网络结构修改(添加注意力机制)
文章目录1.模块解析(common.py)01. Focus模块02. CONV模块03.Bottleneck模块:04.C3模块05.SPP模块2.为yolov5添加CBAM注意力机制最近在进行yolov5的二次开发,软件开发完毕后才想着对框架进行一些整理和进一步学习,以下将记录一些我的学习记录。
SE注意力机制
SE注意力机制虽然基础,但是非常好用,也是应用最广泛的注意力机制之一,在此记录学习
Keras可视化神经网络架构的4种方法
keras 中有一些现成的包可以创建我们的神经网络模型的可视化表示。
使用PyTorch进行小样本学习的图像分类
我们将从几个样本中学习的问题被称为“少样本学习 Few-Shot learning”。我们将从几个样本中学习的问题被称为“少样本学习 Few-Shot learning”。少样本学习是机器学习的一个子领域。
【目标检测】YOLOv5遇上知识蒸馏
本文主要来研究知识蒸馏的相关知识,并尝试用知识蒸馏的方法对YOLOv5进行改进。
【CV】第 1 章:计算机视觉和 TensorFlow 基础知识
上述代码导入了机器学习和计算机视觉工作所需的Python库,例如用于处理数组的 NumPy、用于 openCV 计算机视觉工作的 cv2、用于处理Python代码中的图像的 PIL 以及用于绘制结果的M atplotlib。但是,一阶导数法的问题是,根据输入函数的不同,最大值会发生变化,因此无法预先
CSDN独家 | 全网首发 | Pytorch深度学习·理论篇(2023版)目录
本专栏将通过系统的深度学习实例,从可解释性的角度对深度学习的原理进行讲解与分析,通过将深度学习知识与Pytorch的高效结合,帮助各位新入门的读者理解深度学习各个模板之间的关系,这些均是在Pytorch上实现的,可以有效的结合当前各位研究生的研究方向,设计人工智能的各个领域,是经过一年时间打磨的精品
PhyGeoNet一种可用于不规则区域的物理信息极限学习机
主要就是解决了CNN求解域为非规则形状这样问题,同时将物理信息嵌入CNN中,实现了物理数据双驱动。