【计算机视觉】ViT:代码逐行解读
【计算机视觉】ViT:代码逐行解读
Swin-transformer详解
这篇论文提出了一个新的 Vision Transformer 叫做 Swin Transformer,它可以被用来作为一个计算机视觉领域一个通用的骨干网络.但是直接把Transformer从 NLP 用到 Vision 是有一些挑战的,这个挑战主要来自于两个方面一个就是尺度上的问题。因为比如说现在有
多模态情感识别-MISA: baseline解读
不同模态数据分布的异质性使得模态融合的难度较高
nnUNet原创团队全新力作!MedNeXt:医学图像分割新SOTA
MedNeXt是nnUNet原创团队于2023年3月17日上传至arxiv上的新作品,该模型受ConNeXt启发,根据Transformer改进了现有的卷积网络,实现了医学图像分割领域的SOTA。除了用Transformer改造UNet之外,MedNeXt还改进了上采样和下采样块、提出了一个用小卷积
【论文笔记】用于图像拼接的基于深度学习的图像矩形化算法
图像拼接矩形化的目的是解决图像拼接后产生不规则边界的问题。现有的图像拼接矩形化方法通常分为两个阶段:第一个阶段是搜索一个初始网格,也就是在拼接图像上放置一个规则的网格,用来描述图像上每个点的位置;第二个阶段是优化一个目标网格,也就是在初始网格的基础上进行一些变形,使得网格边缘尽可能地与矩形边界对齐。
用TrackEval评测自己的数据集
跑通代码最重要的就是路径问题, 为此我写了两个config模板, 让配置路径更简单.
图像配准:基于 OpenCV 的高效实现
在这篇文章中,我将对图像配准进行一个简单概述,展示一个最小的 OpenCV 实现,并展示一个可以使配准过程更加高效的简单技巧。什么是图像配准图像配准被定义为将不同成像设备或传感器在不同时间和角度拍摄的两幅或多幅图像,或来自同一场景的两幅或多幅图像叠加起来,以几何方式对齐图像以进行分析的过程(Zito
opencv Mat详解
OpenCV Mat操作详解
如何计算掩膜图中多个封闭图形的面积
使用cv2.findContours获取二值图像的轮廓,再使用cv2.contourArea计算每个轮廓的面积。idx表示掩膜的值,即图形的像素值,在RGB图像中是三维元组。e.g. (0,255,0)直接对二值图像使用cv2.countNonZero无法分辨不同的封闭图形。缺陷:这样计算的精度还不
Ubuntu22.04安装PCL(小白适用)
Ubuntu22.04安装PCL教程
图像数据增强算法汇总(Python)
数据增强是一种通过使用已有的训练样本数据来生成更多训练数据的方法,可以应用于解决数据不足的问题。数据增强技术可以用来提高模型的泛化能力,减少过拟合现象。比如在狗猫识别项目中,通过随机旋转、翻转和裁剪等数据增强方法,可以使模型具有对不同角度和尺寸的狗猫图像的识别能力。增加训练样本数量:通过生成新样本,
cycleGAN算法解读
CycleGAN:循环生成对抗神经网络,是一种非监督学习模型。
图像描述生成(image caption)
图像字幕、图像处理、文本生成
ubuntu下yolox tensorrt模型部署
ubuntu下yolox tensorrt模型部署
OpenCV入门(十九)快速学会OpenCV 18 圆环检测
霍夫变换除了用来检测直线外,也能用来检测其他几何对象。实际上,只要是能够用一个参数方程表示的对象,都适合用霍夫变换来检测。用霍夫圆变换来检测图像中的圆,与使用霍夫直线变换检测直线的原理类似。在霍夫圆变换中,需要考虑圆半径和圆心(x坐标、y坐标)共3个参数。在OpenCV中,采用的策略是两轮筛选。第1
我在Vscode学OpenCV 基本的加法运算
先学会基本的加法运算:OpenCV加法和Numpy加法之间存在差异。OpenCV的加法是饱和操作,而Numpy添加是模运算。选择使用哪种方法取决于具体的需求和预期效果。如果希望保留图像的动态范围,可以使用加号运算符;如果想要增强图像的亮度,可以使用`cv2.add()`函数。
感受野是什么?
在卷积神经网络中,感受野(Receptive Field)是指特征图上的某个点能看到的输入图像的区域,即特征图上的点是由输入图像中感受野大小区域的计算得到的。因此感受野的值可以用来大致判断每一层的抽象层次。公式求取的感受野通常很大,而实际的有效感受野(Effective Receptive Fiel
多源数据融合 Sar & Optical(一)像素级融合
图像金字塔是多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐渐降低并且来源于同一张原始图像的集合。通过梯次向下采样获得,直到某个终止条件才停止采样。图像金字塔说白了就是披着金字塔外衣的图像缩放。一般有高斯图像金字塔、拉普拉斯图像金
【CV】在windows上安装和使用Yolo_mark
下载、安装、使用Yolo_mark面板中选择,把其中的默认路径更改为自己的opencv的相同文件夹的路径面板中选择,把其中的默认路径更改为自己的opencv的相同文件夹的路径,(右侧有小箭头下拉点击编辑可以更方便地更改),完成后点击确定保存。在VS中切换为,右键项目,点击,开始编译。编译完成后在文件
数字图像处理(第四版)-冈萨雷斯-学习过程的笔记
数字图像处理(第四版)的学习笔记,对数字图像成像过程、灰度变换和高斯等空间滤波,彩色图像模型,数学形态学处理、基本的边缘检测算法都进行了描述。