【语义分割】类别不平衡损失函数合集

在语义分割领域,我们会常常遇到类别不平衡的问题。比如要分割的目标(前景)可能只占图像的一小部分,因此负样本的比重很大,导致网络倾向于将所有样本判断为负样本。本文介绍了在数据不平衡时常用的一些损失函数。类别不平衡会出现什么问题呢?假设我们需要训练一个分类器来对黄豆和绿豆分类,用100颗豆子训练分类器,

保姆级深度学习环境搭建(亲测避坑)

踩坑结束,大家可以躺平了

Realsense D455/435内参标定以及手眼标定

机械臂和RGBD相机,手眼标定

畸变校正与极线校正(具体原理+Matlab代码)

畸变校正与极线校正(matlab源码)

YoloV8简单使用

目标检测不能没有Yolo,就像西方不能没有耶路撒冷。这个万能的目标检测框架圈粉无数,经典的三段式改进也是改造出很多论文,可惜我念书时的研究方向不是纯粹的目标检测,所以在做研究的时候没有用到过,但是同学用到的多啊,彼此交流也大概能知道Yolo的架构,这次决定好好学一学这个绝版Yolo。

理解DALL·E 2, Stable Diffusion和 Midjourney工作原理

作者 | Arham Islam编译 | 岳扬在过去的几年里,人工智能(AI)取得了极大的进展,而AI的新产品中有AI图像生成器。这是一种能够将输入的语句转换为图像的工具。文本转图像的AI工具有许多,但最突出的就属DALLE 2、Stable Diffusion和Midjourney了。DALL-E

【多目标跟踪与计数】(三)DeepSORT实战车辆和行人跟踪计数

一、DeepSort介绍论文地址:https://arxiv.org/pdf/1703.07402.pdf参考文章:DeepSort讲解代码地址:https://github.com/mikel-brostrom/Yolov5_DeepSort_OSNet(可参考这个源代码,如果需要我这边的源代码可

图像分割(语义分割)的局限以及解决方法

CNN作为最基础的框架,存在很多的问题:比如语义分割除了语义信息还需要细节信息,因此UNet等论文给出了解决方案。比如语义分割需要上下文信息,因此PSPNet、Deeplab系列、基于自注意力机制的一系列方法(Non-Local、DANet、CCNet等)等被提出来获取局部、多尺度乃至全局上下文。比

深度理解相机中的各个参数(对比度、饱和度、亮度、曝光度、锐度)

相机中和很多参数,包括对比度、饱和度、亮度、曝光度、锐度等等。不论我们是在拍照还是后期的剪辑,都缺少不了对这些参数的调整。那么接下来来详细的叙述一下这些参数以及它们的作用。...

图像处理复习———像素间的基本关系(邻域,邻接性,通路,连通性,距离)

图像处理复习———像素间的基本关系(邻域,邻接性,通路,连通性,距离)

国家实用新型发明专利:一种机器视觉的流水线智能检测报警系统

本实用新型公开了一种基于机器视觉的流水线智能检测报警系统,包括:视觉处理模块、电源模块、无线通讯模块、核心控制模块和客户端;该核心控制模块分别与视觉处理模块、电源模块、无线通讯模块相连,用于将视觉处理模块处理后的报警信息通过无线通讯模块发送给客户端,并接收客户端发送给服务器的前端配置信息。本实用新型

Paper Reading - 综述系列 - 计算机视觉领域中目标检测任务常见问题与解决方案

目录小目标检测数据方面Label Smoothing模型方面样本不均衡目标遮挡More更多可见计算机视觉-Paper&Code - 知乎小目标检测数据方面将图像resize成不同的大小 对小目标进行数据增强,过采样策略oversampling,重复正样本数 在图片内用实例分割的Mask抠出小

机器人避障系统基础

用来采集运动时环境中障碍物信息的环境信息采集系统是自动避障系统的重要组成部分。全面、精确信息的获取,能够增强智能小车的自动避障性能,同时必须考虑信息处理的及时性和难易程度。视觉传感器、激光雷达测距传感器、红外测距传感器和超声波测距传感器等是主要的几种应用于智能小车自动避障的探测器。超声波测距传感器的

三维重建(单目、双目、多目、点云、SFM、SLAM)

三维重建(单目、双目、多目、点云、SFM、SLAM)

碰撞检测技术介绍

本文将对常用的碰撞检测算法进行介绍,并简要的进行benchmark。在planning中一般将主车以及障碍物处理为凸多边形(Polygon/Box),因此碰撞检测多是检测两个Polygon是否重叠,但是为了不失一般性,本文也将介绍Polygon和Point的位置关系计算方法,因为在两个Polygon

工业相机飞拍模式介绍及相机曝光值计算

例如:相机现在的曝光时间是2000us,传送带运动的速度是100mm/s,使用的相机分辨率为2448*2048,视野范围是300mm*250mm,物体运动的方向是水平方向,精度要求拖影不超过1/2像素。1.视觉停拍:传统的视觉定位采取停拍的方式,即工件按照既定的轨迹运动,当运行到拍照点时,运动轴速度

Nuscenes 数据集浅析

Nuscenes 数据集浅析

Vision Transformer 论文 + 详解( ViT )

Vision Transformer 论文 + 详解

视觉SLAM数据集(一):TUM DataSet

如果你是第一次做实验,建议下载xyz的数据集,因为它的动作相对很小,只包含桌面上的一小部分。一旦成功测试,就可以试试desk数据集,它包含四张桌子和几个闭环。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈