【电子、电气、人工智能、图像处理、红外】EI会议(2023)

2023年EI会议,领域包括图像处理、电子信息、机械、光学、深度学习、计算机视觉等等

经典神经网络论文超详细解读(一)——AlexNet学习笔记(翻译+精读)

AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)论文超详细解读。翻译+总结

Yolov5--从模块解析到网络结构修改(添加注意力机制)

文章目录1.模块解析(common.py)01. Focus模块02. CONV模块03.Bottleneck模块:04.C3模块05.SPP模块2.为yolov5添加CBAM注意力机制最近在进行yolov5的二次开发,软件开发完毕后才想着对框架进行一些整理和进一步学习,以下将记录一些我的学习记录。

pytorch从零开始搭建神经网络

pytorch教程之nn.Sequential类详解——使用Sequential类来自定义顺序连接模型_LoveMIss-Y的博客-CSDN博客_sequential类pytorch教程之nn.Module类详解——使用Module类来自定义模型_LoveMIss-Y的博客-CSDN博客_torch

语义分割之SegFormer分享

今年可以说是分割算法爆发的一年,首先Vit通过引入transform将ADE20K mIOU精度第一次刷到50%,超过了之前HRnet+OCR效果,然后再是Swin屠榜各大视觉任务,在分类,语义分割和实例分割都做到了SOTA,斩获ICCV2021的bset paper,然后Segformer有凭借对

目标检测: 一文读懂 YOLOX

论文:YOLOX: Exceeding YOLO Series in 2021论文链接:https://arxiv.org/pdf/2107.08430.pdf代码链接:https://github.com/Megvii-BaseDetection/YOLOX.文章目录1 为什么提出YOLOX2 Y

【图像处理】图像离散小波变换(Discrete Wavelet Transform)及python代码实现

Motivation看到有论文用到了图像的Haar Discrete Wavelet Transform(HDWT),前面也听老师提到过用小波变换做去噪、超分的文章,于是借着这个机会好好学习一下。直观理解参考知乎上的这篇文章:https://zhuanlan.zhihu.com/p/22450818

深度学习网络各种激活函数 Sigmoid、Tanh、ReLU、Leaky_ReLU、SiLU、Mish

激活函数的目的就是:梯度为0, 无法反向传播,导致参数得不到更新:随着数据的变化,梯度没有明显变化:梯度越来越大,无法收敛梯度消失问题:1、反向传播链路过长,累积后逐渐减小2、数据进入梯度饱和区如何解决:1、选正确激活函数,relu, silu2、BN 归一化数据3、 resnet 较短反向传播路径

全面解析PaDiM

使用PaDiM网络跑自己的数据集,除去测试时读入dataloader的时间,每张图片测试时间在20-30ms,精度比较高,图像分类准确率99-100,像素分割准确率97以上,但是最大的问题是需要通过分割好的label来确定阈值选取(这一点必定要改过来)。for循环内的二次for循环:在tqdm的fo

YOLOv7中的数据集处理【代码分析】

本文章主要是针对yolov7中数据集处理部分代码进行解析(和yolov5是一样的),也是可以更好的理解训练中送入的数据集到底是什么样子的。数据集的处理离不开两个类,(from torch.utils.data.dataloader import DataLoader),不论什么样的算法,在处理数据集

Transformer前沿——语义分割

Transformer在语义分割领域的发展

【Anaconda创建虚拟环境】报错及解决办法

Anaconda创建虚拟环境的一些报错问题及解决办法记录

如何使用labelImg标注数据集,最详细的深度学习标签教程

深度学习中,做监督学习时需要标注好的数据集。一种利用现成的数据集:比如mnist手写体、ImageNet、COCO、PASCAL VOC、OpenImage等数据集;还有就是我们可以手动标注的数据集。下面教大家如何使用labelImg库来手动标注Dataset。1、打开anaconda命令行界面,如

一文讲解thop库计算FLOPs问题

计算模型的FLOPs及参数大小FLOPS是处理器性能的衡量指标,是“每秒所执行的浮点运算次数”的缩写。FLOPs是算法复杂度的衡量指标,是“浮点运算次数”的缩写,s代表的是复数。一般使用thop库来计算,GitHub:但官网的Readme中详细写出了是用来计算MACs,而不是FLOPs的MACs(M

UNet - unet网络

Unet网络是医学图像分割领域常用的分割网络,因为网络的结构很像个U,所以称为UnetUnet 网络是针对像素点的分类,之前介绍的LeNet、ResNet等等都是图像分类,最后分的是整幅图像的类别,而Unet是对像素点输出的是前景还是背景的分类注:因为Unet 具体的网络框架均有所不同,例如有的连续

【神经网络】(10) Resnet18、34 残差网络复现,附python完整代码

各位同学好,今天和大家分享一下 TensorFlow 深度学习中如何搭载 Resnet18 和 Resnet34 残差神经网络,残差网络利用 shotcut 的方法成功解决了网络退化的问题,在训练集和校验集上,都证明了的更深的网络错误率越小。论文中给出的具体的网络结构如下:Resnet50 网络结构

【深度学习】生成模型:VAE(自编码器)模型解析

本文为自己自学内容的记录,其中多有借鉴别人博客的地方,一并在在参考文献中给出链接,其中大部分截图来自李宏毅深度学习PPT课件。本文前置知识高斯混合模型和EM算法,如果不了解这两种算法直接看VAE模型会有理解上的障碍。其实那么多数学公式推导,我自己都有点晕,但是本质上就是用自编码器去产生很多高斯分布,

yolo车牌识别、车辆识别、行人识别、车距识别源码(包含单目双目)

车牌内容识别时,通过计算候选车牌区域蓝色数值(均值)的最大值,确定最终的车牌区域。对于选定的车牌轮廓,首先进行粗定位,即对车牌进行左右边界回归处理,去除车牌两边多余的部分,然后进行精定位,即将车牌送入 CRNN 网络进行字符识别,利用左右边界回归模型,预测出车牌的左右边框,进一步裁剪,进行精定位。车

[HyperGraph专题]HGNN+:General Hypergraph Neural Networks

最近在做和超图相关的工作,自己主要偏编码的工作,但在敲代码和参考其他现有超图库的过程中发现了一个叫DeepHypergrah的库,里面涉及了很多和深度学习相关的内容,用到了pytorch、scipy、numpy之类啥啥啥,看的我一头雾水,想起之前给自己定了一个学习pytorch这一工具的目标,现在终

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈