深入剖析Focal loss损失函数

目标检测方法常常使用先验框提高预测性能,一张图像可能生成成千上万的先验框,但是其中只有很少一部分能匹配到目标(正样本),而没有匹配到目标的先验框占大多数。这种情况造成了One-Stage目标检测方法的正负样本不平衡。如下图所示,红色的先验框都没有匹配到目标,所以它们都属于负样本,只是图中间的黄色先验

基于深度学习的三维重建(一):三维重建简介、patchmatchNet环境部署、用colmap如何测试自己的数据集

三维重建简介、patchmatchNet环境部署、用colmap如何测试自己的数据集

基于halcon与c#联合的视觉处理软件

1、视觉软件当我们所拿到一个视觉项目,如果有一个拖拽式视觉软件

分享15个全球顶尖的AIGC图片生成平台

人工智能正在改变许多行业的格局,而其中改变最直观和影响最大的就是AIGC领域的图像创作。发展至今已经有很多AI图像生成平台,他们的共同特点就是使用人工智能将文本转换为图像,这是一次革命性的突破,也就是说通过这些AI工具可以在几秒钟内将文字转换成更具可视化表示的图片。那么,就目前而已有那些AI生成图片

Opencv之图像滤波:1.图像卷积(cv2.filter2D)

1.图像卷积在OpenCV中,允许用户自定义卷积核实现卷积操作,使用自定义卷积核实现卷积操作的函数是cv2.filter2D(),其语法格式为:dst=cv2.filter2D(src,ddepth,kernel,anchor,delta,borderType) 式中: ● dst是返回值,表示进行

目标检测算法——YOLOv5/v7/v8改进结合即插即用的动态卷积ODConv(小目标涨点神器)

ICLR2022 助力YOLO | 动态卷积ODConv:大幅提升小目标检测能力!!!

使用c++onnxruntime部署yolov5模型并使用CUDA加速(超详细)

接到一个项目,需要用c++和单片机通信,还要使用yolo模型来做到目标检测的任务,但目前网上的各种博客并没有完整的流程教程,让我在部署过程费了不少劲,也踩了不少坑(甚至一度把ubuntu干黑屏)。于是想把训练及部署过程记录下来,并留给后来者方便使用。(博主使用的系统是ubuntu20.04)

YOLOv5源码逐行超详细注释与解读(4)——验证部分val(test).py

全网最详细的YOLO源码解读之验证部分val.py。全文近5万字,代码逐行注释,逐段精讲!小白0基础必看!

LabVIEW+OpenCV快速搭建人脸识别系统(附源码)

本篇博客将介绍如何使用LabVIEW 和 SFace 快读实现人脸识别系统

b站B导的yoloV7版本添加注意力机制

yolov7增加注意力机制(b导版本)

OpenCV实战——多尺度FAST特征检测

FAST 是用于快速检测图像中关键点的方法,而 SURF 和 SIFT 算法的设计重点是尺度不变性。为了同时实现快速检测和尺度不变性,OpenCV 中引入了新的兴趣点检测器,包括 BRISK (Binary Robust Invariant Scalable Keypoints) 检测器(基于 FA

指纹识别综述(4): 指纹匹配

介绍刑侦、手机解锁、身份证管理等各种身份识别应用中的各类指纹匹配技术,包括细节点匹配、深度学习匹配技术、指纹绝对对齐、指纹刚性和弹性配准等。

【周末闲谈】畅想AR,AR领域迎来新风口

经过了一周的忙碌,周末如期而至,经过了忙碌的一周,何不沏上一小壶茶,享受一下当下呢?😊😊本期的周末闲谈就让我们来聊聊渐渐改变我们生活AR技术吧。增强现实在中国仍处于起步阶段,它的应用十分广泛,出现在我们生活的方方面面,5G时代为AR带了启航的风,相信在不断地技术突破下,AR领域将迎来它的新面貌。

《一种改进的YOLOv5用于无人机捕获场景中的目标检测》论文笔记

本文分析了当前无人机捕捉场景中目标检测算法存在的问题,针对无人机图像中高分辨率、小目标占比大的特点,对YOLOv5s模型进行了三点改进。最终的实验结果表明,我们改进的模型比原来的模型更适用于Visdrone-2020数据集,并且每个模块都能很好地提高该数据集的目标检测精度。与其他方法相比,我们的方法

目标检测算法——YOLOv7改进|增加小目标检测层

目标检测算法——YOLOv7改进|增加小目标检测层。官方版的YOLOv7相同体量下比YOLOv5精度更高,速度快120%(FPS),比 YOLOX 快180%(FPS),比 Dual-Swin-T 快1200%(FPS),比 ConvNext 快550%(FPS),比 SWIN-L快500%(FPS

Text to image论文精读GigaGAN: 生成对抗网络仍然是文本生成图像的可行选择

GigaGAN是Adobe和卡内基梅隆大学学者们提出的一种新的GAN架构,作者设计了一种新的GAN架构,推理速度、合成高分辨率、扩展性都极其有优势,其证明GAN仍然是文本生成图像的可行选择之一。

图像处理-特征融合:相加、拼接、Attention

图像处理-特征融合:相加、拼接、Attention特征融合是指来自不同层或分支的特征的组合,是现代网络体系结构中很常见的一种操作。图像处理的特征融合中,对于普遍的多尺度融合,广泛操作是直接将他们相加或者拼接起来!即通常通过简单的操作(例如求和或串联)来实现,但是,这不一定是最佳选择。随着Transf