传统卷积与Transformers 优缺点对比

近两年Transformer如日中天,刷爆各大CV榜单,但在计算机视觉中,传统卷积就已经彻底输给Transformer了吗?

对比学习(contrastive learning)

什么是自监督学习?举个通俗的例子:即使不记得物体究竟是什么样子,我们也可以在野外识别物体。我们通过记住高阶特征并忽略微观层面的细节来做到这一点。那么,现在的问题是,我们能否构建不关注像素级细节,只编码足以区分不同对象的高阶特征的表示学习算法?通过对比学习,研究人员正试图解决这个问题。什么是对比学习?

CFPNet:用于实时语义分割的通道特征金字塔

由于对移动设备和自动驾驶的需求不断增长,实时语义分割在计算机视觉中发挥着越来越重要的作用。 因此,在性能、模型大小和推理速度之间取得良好的折衷是非常重要的。 在这篇论文中提出了一个 Channel-wise Feature Pyramid (CFP) 模块来平衡这些因素。 基于 CFP 模块,构建了

深度强化学习-DQN算法原理与代码

DQN算法是DeepMind团队提出的一种深度强化学习算法,在许多电动游戏中达到人类玩家甚至超越人类玩家的水准,本文就带领大家了解一下这个算法,论文的链接见下方。论文:https://www.nature.com/articles/nature14236.pdf代码:后续会将代码上传到Github上

Yolov5训练指南—CoCo格式数据集

Yolov5训练指南—CoCo格式数据集1 准备工作2 将coco数据集转换为yolo数据集3 训练参数定义4 训练模型5 预测1 准备工作训练Yolo模型要准备的文件及文件格式如下:/trianing # 根目录 /datasets # 数据集目录(可以任意取名) /images /trai

【深度学习】CNN应用于图像分类的建模全流程

图像分类,也可以称作图像识别,顾名思义,就是辨别图像中的物体属于什么类别。核心是从给定的分类集合中给图像分配一个标签的任务。

Coordinate Attention和BiFPN

目录文章目录目录坐标注意力机制(Coordinate Attention)原理:结构:代码:优缺点:加权双向特征金字塔(BiFPN)网络结构原理结构代码优缺点自适应非极大抑制(Adaptive Non maximum suppression, A-NMS)的多尺度检测方法原理结构优缺点设计内嵌空间注

YOLOX backbone——CSPDarknet的实现

YOLOX的主干网络分析

YOLO v5 代码精读(1) detect模块以及非极大值抑制

YOLO 是目前最先进的目标检测模型之一,现在博客上常有的是如何使用YOLO模型训练自己的数据集,而鲜有对YOLO代码的精读。我认为只有对算法和代码实现有全面的了解,才能将YOLO使用的更加得心应手。这里的代码精读为YOLO v5,github版本为6.0。版本不同代码也会有所不同,请结合源码阅读本

Boundary Loss 原理与代码解析

在医学图像分割中任务中通常存在严重的类别不平衡问题,目标前景区域的大小常常比背景区域小几个数量级,比如下图中前景区域比背景区域小500倍以上。分割通常采用的交叉熵损失函数,在高度不平衡的问题上存在着众所周知的缺点即它假设所有样本和类别的重要性相同,这通常会导致训练的不稳定,并导致决策边界偏向于数量多

使用Resnet网络对人脸图像分类识别出男女性别(包含数据集制作+训练+测试)

这两天有点忙,本打算昨天准备写这篇博客内容的,推迟到今天晚上。实际上,上午我已经把模型训练完了,准确率可以达到95%,考虑到用的台式机没有装显卡,所以使用的数据集一共只有340张。分布情况如下。【训练集】女性:150张;男性:150张【验证集】女性:20张;男性:20张数据集预览女性数据男性数据提示

深度学习:使用UNet做图像语义分割,训练自己制作的数据集,详细教程

语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同,语义分割需要判断图像每个像素点的类别,进行精确分割。语义分割目前在自动驾驶、自动抠图、医疗影像等领域有着比较广泛的应用。我总结了使用UNet网络做图像语义分割的方法,教程很详细,学者耐心学习。

【图神经网络实战】深入浅出地学习图神经网络GNN(下)

最简单的思路是:我们可以将每个时刻的序列先送入GCN进行特征提取,然后再将提取后的特征送入GRU单元往后传递,依此类推。图中的注意力机制相当于在某个点进行特征重构时,其邻接点都加上一个权重,使得其在重构特征时受权重较大的邻接点影响更大,起到注意力的效果。对于动态图,传统的GNN就不太好用了,想想在时

无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv

No More Strided Convolutions or Pooling:A New CNN Building Block for Low-ResolutionImages and Small Objects 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv提出了一

【深度强化学习】多智能体算法汇总

本文收纳了常见的多智能体强化学习方法,并简单介绍各个算法。

YOLO_v4讲解

YOLO_v4最全讲解

2022图像去雨综述研读——单幅图像去雨数据集和深度学习算法的联合评估与展望

数据集的质量依据数据集构建方式分类:基于背景雨层简单加和背景雨层复杂融合GAN数据驱动合成的数据集半自动化采集的真实数据集图像去雨方法依据任务场景单任务——雨滴、雨纹、雨雾和暴雨的去除联合任务——雨滴和雨纹、所有噪声去除依据采取的学习机制和网络设计CNN结构多分支组合GAN的生成结构循环和多阶段结构

基于yolov5s+bifpn实践隧道裂缝裂痕检测

基于yolov5s+bifpn实践隧道裂缝裂痕检测

李沐论文精读系列二:Vision Transformer、MAE、Swin-Transformer

本文是参考李沐bilibil论文精度视频和太阳花的视频/博文后所写

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈