CLIP论文详解
CLIP算是在跨模态训练无监督中的开创性工作,作者在开头梳理了现在vision上的训练方式,从有监督的训练,到弱监督训练,再到最终的无监督训练。这样训练的好处在于可以避免的有监督的 categorical label的限制,具有zero-shot性质,极大的提升了模型的实用性能。这篇文章中作者提到早
【电子、电气、人工智能、图像处理、红外】EI会议(2023)
2023年EI会议,领域包括图像处理、电子信息、机械、光学、深度学习、计算机视觉等等
经典神经网络论文超详细解读(一)——AlexNet学习笔记(翻译+精读)
AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)论文超详细解读。翻译+总结
Yolov5--从模块解析到网络结构修改(添加注意力机制)
文章目录1.模块解析(common.py)01. Focus模块02. CONV模块03.Bottleneck模块:04.C3模块05.SPP模块2.为yolov5添加CBAM注意力机制最近在进行yolov5的二次开发,软件开发完毕后才想着对框架进行一些整理和进一步学习,以下将记录一些我的学习记录。
AUTOSAR基础篇之CanTsyn
你知道为什么需要进行时间同步吗?时间同步的应用场景有哪些呢?当前主流的时间同步方案有哪些吗?对于CAN 时间同步的协议又是怎样设计的呢?今天,我们来一起探索并回答这些问题。
MATLAB绘图合集:填充二维等高线图contourf
本文主要介绍等高线图绘制函数contourf的简单实用和一些基本操作例子
超像素(superpixel)——SLIC和深度学习法
用简单的语言描述超像素的形成原理,提供传统法SLIC和深度学习法学习超像素的具体数学过程和核心代码
机器学习--使用朴素贝叶斯进行垃圾邮件分类
朴素贝叶斯
OpenART mini使用教程
OpenART mini 是我们在 NXP 的 OpenART 套件的基础上,去除非视觉部分而制作出来的迷你版。虽说只是迷你版,但“麻雀虽小,五脏俱全”。OpenART mini 不仅可以很轻松的完成机器视觉(machine vision)应用,还可以完成 OpenMV 不能完成的神经网络模型的部署
Apollo学习笔记(1):Ubantu20.04安装Apollo7.0
Ubantu20.04安装Apollo7.0完整版记录
AIGC最近很火,给大家推荐一个已经有1000位开发者使用的中文aigc开源模型,包括ai画图、ai聊天
这套模型是昆仑万维集团旗下的奇点智源公司开发的,它们在12月中旬开源,半个月的时间已经吸引了将近1000名使用者。
pytorch从零开始搭建神经网络
pytorch教程之nn.Sequential类详解——使用Sequential类来自定义顺序连接模型_LoveMIss-Y的博客-CSDN博客_sequential类pytorch教程之nn.Module类详解——使用Module类来自定义模型_LoveMIss-Y的博客-CSDN博客_torch
信息熵是什么
信息熵是什么通过前两节的学习,我们对于决策树算法有了大体的认识,本节我们将从数学角度解析如何选择合适的“特征做为判别条件”,这里需要重点掌握“信息熵”的相关知识。信息熵这一概念由克劳德·香农于1948 年提出。香农是美国著名的数学家、信息论创始人,他提出的“信息熵”的概念,为信息论和数字通信奠定了基
语义分割之SegFormer分享
今年可以说是分割算法爆发的一年,首先Vit通过引入transform将ADE20K mIOU精度第一次刷到50%,超过了之前HRnet+OCR效果,然后再是Swin屠榜各大视觉任务,在分类,语义分割和实例分割都做到了SOTA,斩获ICCV2021的bset paper,然后Segformer有凭借对
目标检测: 一文读懂 YOLOX
论文:YOLOX: Exceeding YOLO Series in 2021论文链接:https://arxiv.org/pdf/2107.08430.pdf代码链接:https://github.com/Megvii-BaseDetection/YOLOX.文章目录1 为什么提出YOLOX2 Y
【图像处理】图像离散小波变换(Discrete Wavelet Transform)及python代码实现
Motivation看到有论文用到了图像的Haar Discrete Wavelet Transform(HDWT),前面也听老师提到过用小波变换做去噪、超分的文章,于是借着这个机会好好学习一下。直观理解参考知乎上的这篇文章:https://zhuanlan.zhihu.com/p/22450818
机器学习算法——混淆矩阵(Confusion Matrix)之鸢尾花实例
什么是混淆矩阵?其实就是把所有类别的预测结果与真实结果按类别放置到了同一个表里,在这个表里我们可以清楚地看到每个类别正确识别的数量和错误识别的数量。混淆矩阵在什么情况下最好呢?答案是类别不平衡时。混淆矩阵是除了ROC曲线和AUC之外的另一个判别分类好坏程度的方法。TP=True Positive=真
深度学习网络各种激活函数 Sigmoid、Tanh、ReLU、Leaky_ReLU、SiLU、Mish
激活函数的目的就是:梯度为0, 无法反向传播,导致参数得不到更新:随着数据的变化,梯度没有明显变化:梯度越来越大,无法收敛梯度消失问题:1、反向传播链路过长,累积后逐渐减小2、数据进入梯度饱和区如何解决:1、选正确激活函数,relu, silu2、BN 归一化数据3、 resnet 较短反向传播路径
全面解析PaDiM
使用PaDiM网络跑自己的数据集,除去测试时读入dataloader的时间,每张图片测试时间在20-30ms,精度比较高,图像分类准确率99-100,像素分割准确率97以上,但是最大的问题是需要通过分割好的label来确定阈值选取(这一点必定要改过来)。for循环内的二次for循环:在tqdm的fo
YOLOv7中的数据集处理【代码分析】
本文章主要是针对yolov7中数据集处理部分代码进行解析(和yolov5是一样的),也是可以更好的理解训练中送入的数据集到底是什么样子的。数据集的处理离不开两个类,(from torch.utils.data.dataloader import DataLoader),不论什么样的算法,在处理数据集