【论文笔记】CycleGAN(基于PyTorch框架)

CycleGAN(基于PyTorch框架)

YOLOv5实战之输电线路绝缘子缺陷检测识别

本教程主要是利用YOLOv5算法实现对输电线路绝缘子缺陷进行检测识别。通过无人机搭载相机头云台对输电线路上的绝缘子进行数据采集,挑选出绝缘子上有故障的图片数据,共2000张左右图片,输电线路绝缘子缺陷数据集中的部分图片如下图所示。​​对收集到的2000张左右绝缘子缺陷数据集进行数据标注, 标注了3种

Openpcdet训练自己的数据集

本人移植其他的数据集,由于我有自己的image数据,已经按照kitti数据集的格式转换为velodyne, calib, label, image四个文件,并且实现了评估,以及最终的检测结果,所以可能和其他博主不一样。这个函数主要用来生成你的数据字典,一般以.pkl后缀,如果你不需要评估,可以将其中

深度学习之快速实现数据集增强的方法

我们在深度学习训练之前准备数据集的时候,特别是打标注的数据集,需要耗费大量的人力物力打标签,在打完的基础我们还可以直接对数据集进行二次增强,即**数据集增强**。

wFlow(CVPR2022)-虚拟试衣论文解读

CVPR2022,字节&中山大学,提出wFlow,引入3D信息,达到SOTA效果,尤其在自然场景

OpenCV中确定像素位置及获取、修改像素BGR值讲解及演示(Python实现 附源码)

OpenCV中确定像素位置及获取、修改像素BGR值讲解及演示(Python实现 附源码)

opencv 一 基本运行环境配置(下载安装、编写代码、配置环境)

从0开始下载opencv并配置环境变量,然后在vs2019中新建c++项目,并配置opencv。最后新建代码,测试opencv的完整教程。

旋转目标检测训练自己数据集+问题汇总

复现junjieliang大佬的旋转目标检测代码,将自己遇到的问题全部记录下来,包括数据集制作,训练与部署检测。

孪生网络---学习笔记

孪生网络---学习笔记

目标跟踪实战deepsort+yolov5(上)

今天的主要目的还是快速上手目标跟踪,先前的话我是简单说了一下卡尔曼滤波,然后由于博客的问题,没有说完。本来是想做一个系列的,但是很难整理,而且说实话有些东西我也没搞清楚。当然这并不影响我们使用,抽象一下继续happy,就像你不懂SpringBoot 或者Django底层一样,还是阔以做出一个网站的。

【相机标定】相机内参

本文详细分析了相机拍照的数学模型并推导了相机内参

计算机视觉-图像的傅里叶变换

法国数学家吉恩·巴普提斯特·约瑟夫·傅里叶被世人铭记的最大的贡献是:他指出任何周期函数都可以表示为不同频率的正弦和/或余弦之和的形式,每个正弦项和/或余弦项乘以不同的系数(现在称该和为傅里叶级数)。无论函数多么复杂,只要它是周期的,并且满足某些适度的数学条件,都可以用这样的和来表示。即一个复杂的函数

【Android App】人脸识别中OpenCV根据人脸估算性别和年龄实战(附源码和演示 超详细)

【Android App】人脸识别中OpenCV根据人脸估算性别和年龄实战(附源码和演示 超详细)

多个相机内外参标定详解[halcon]

通过一个halcon实例,详细讲述如何对多个相机参数进行标定。相机的标定流程一般由以下几个部分:相机参数的初始化->读取标定文件->读取标定板图像->进行标定->标定结果。

YOLO V6论文精读

YOLO系列采用了广泛的激活功能,如ReLU [27]、LReLU [25]、Swish [31]、SiLU [4]、Mish [26]等。

常用的医学图像分割评价指标

记录用于医学图像分割的一系列评价指标!

yolov3源码逐行详解(3.0版本)

次看主文件,在进入主函数中逐行调试,进而对代码全局有个了解。接下来就是主文件,train.py训练文件、test.py测试文件(用于训练中每个epoch的测试)、models.py模型文件、detect.py预测文件、requirements.txt其中是项目需要的环境配置。版本,主要是因为其中使用

OpenAI最重要的模型【CLIP】

CLIP 代表 Contrastive Language-Image Pretraining:CLIP 是一个开源、多模态、零样本模型。给定图像和文本描述,该模型可以预测与该图像最相关的文本描述,而无需针对特定任务进行优化。开源:该模型由 OpenAI 创建并开源。稍后我们将看到有关如何使用它的编程

BEV(Bird’s-eye-view)三部曲之二:方法详解

BEV调研之近期主流论文的核心内容、测速

【python-Unet】计算机视觉~舌象舌头图片分割~机器学习(三)

舌象数据集包含舌象原图以及分割完成的二元图,共979*2张,示例图片如下:U-Net是一个优秀的语义分割模型,在中e诊中U-Net共三部分,分别是主干特征提取部分、加强特征提取部分、预测部分。利用主干特征提取部分获得5个初步有效的特征层,之后通过加强特征提取部分对上述获取到的5个有效特征层进行上采样