递归门控卷积HorNet(gn_conv)阅读笔记

HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions ECCV2022程序视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种

经典图像去噪算法概述

基于梯度先验去噪方法的重点是局部特征,而忽略图像的全局结构。上面问题可以由Y的奇异值分解解决,由于奇异值分解的能量压缩性质,信息的主要能量都集中在少数几个较大的奇异值上,而较小的奇异值对应于噪声子空间,将它们设置为零可以得到去噪后的低秩矩阵,问题的关键是如何确定阈值来区分信号与噪声,太大的阈值会使图

【目标检测】YOLO v5 吸烟行为识别检测

基于YOLO v5 的吸烟目标检测,制作吸烟数据集,训练模型,Windows界面,输出结果,效果较好!mAP值0.8,解决横向项目,毕设,工厂实际需求。

yolov5训练自己的数据集,OpenCV DNN推理

学更好的别人,做更好的自己。——《微卡智享》本文长度为4238字,预计阅读9分钟前言上一篇《OpenCV--自学笔记》搭建好了yolov5的环境,作为目标检测在应用中,最重要的还是训练自己的数字集并推理,所以这一篇就专门来介绍使用yolov5训练自己的数据集,并且用OpenCV的DNN进行推理。实现

相机标定-张正友棋盘格标定法

(X,Y,Z)为在世界坐标系下一点的物理坐标 ( u , v ) 为该点对应的在像素坐标系下的像素坐标 引入齐次坐标的原因:引入齐次坐标的目的是为了升维,将坐标从二维坐标变为三维坐标。2.相机成像过程 相机成像系统中,共包含四个坐标系:世界坐标系、相机坐标系、图像坐标系、像素坐标系。(1)世

将时间序列转成图像——马尔可夫转移场方法 Matlab实现

马尔可夫转移场(Markov Transition Field, MTF)是基于马尔可夫转移矩阵的一种时间序列图像编码方法。该方法将时间序列的时间推移看成是一个马尔可夫过程,即:在已知目前状态的条件下,它未来的演变不依赖于它以往的演变,由此构造马尔可夫转移矩阵,进而拓展为马尔可夫转移场,实现图像编码

快速制作自己的VOC语义分割数据集

PASCAL VOC2012是语义分割任务极为重要的官方数据集,大量优秀的语义分割模型都会刷一下这个数据集,因此我们在使用别人的开源代码时,如果能将自己的数据集整理成官方数据集的格式,则可快速验证模型性能,减少自身工作量。

OpenCV学习笔记14-计算机视觉中的背景减除介绍及代码实现

参考文章:https://blog.csdn.net/tengfei461807914/article/details/81588808https://zhuanlan.zhihu.com/p/31103280文章目录背景减除方法选择:MOGMOG2GMGCNTKNN总结背景减除计算机视觉的前景和背

像素坐标到世界坐标的转换

注意:直接变换是直接根据变换公式获得,实际上包含pixel到camera和camera到world,实际上和顺序变换一样,通过顺序变换可以更清晰了解变换过程。下式为像素坐标pixel与世界坐标world的变换公式,右侧第一个矩阵为相机内参数矩阵,第二个矩阵为相机外参数矩阵。M为相机内参数矩阵,R为旋

扩散模型训练太难?来看看Meta AI最新提出的KNN-Diffusion

我们总会发现,我们迸发出的每一个想法都是从脑海中相似的印象中复制的

基于opencv的边缘检测方法

介绍6种基于opencv的边缘检测的方法

face_recognition库的使用

​face_recognition库基于dlib的使用,包含dlib的安装,及face_recognition库各个方法的使用

人工智能前沿——深度学习热门领域(确定选题及研究方向)

人工智能前沿——深度学习热门领域(确定选题及研究方向)

YOLOv5网络详解

前言YOLOv5项目的作者是Glenn Jocher并不是原Darknet项目的作者Joseph Redmon,并且这个项目至今都没有发表过正式的论文。官方源码仓库:https://github.com/ultralytics/yolov5

grad-cam实现可视化|mmselfsup自监督|保姆级教学

Grad-CAM是使用任何目标概念的梯度(比如分类类别中的某一类的logits,甚至是caption任务中的输出),流入最后的卷积层,生成一个粗略的定位图来突出显示图像中用于预测的重要区域。

OpenMV的单颜色识别讲解

OpenMV的单颜色识别示例详解

GAN的训练技巧:炼丹师养成计划 ——生成式对抗网络训练、调参和改进

GAN最重要的就是找到D与G之间的纳什均衡,但是在实际中会发现GAN的训练不稳定,训练方法不佳很容易出现模式崩溃等问题,本篇将记录一些训练技巧,不一定适合你的模型,也可能有疏漏和错误,供学习参考,欢迎指正和补充。

理解ConvNeXt网络(结合代码)

ConvNeXt网络本身没有什么亮点,全是应用的现有的方法来进行网络的调整,特别是大量细节的设计都是参考了swin transformer的网络结构的。并且ConvNeXt是以ResNet50网络为backbone来进行调整的,所以ConvNeXt的网络结构非常简单,一目了然,理解起来也是非常容易的

sensor_msgs::Image消息及其参数

很多的博客直接将原网址复制粘贴过来,这里做一个整理,另外原网址是:https://docs.ros.org/en/melodic/api/sensor_msgs/html/msg/Image.html该消息意味包含未压缩的图像,且(0,0)在图像的左上角。参数大体含义如下:header:首先拿VIN

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈