YOLOX backbone——CSPDarknet的实现
YOLOX的主干网络分析
记录-安装cuda与cudnn 及对应版本的tensorflow|pytorch
安装 cuda 与 cudnn
YOLO v5 代码精读(1) detect模块以及非极大值抑制
YOLO 是目前最先进的目标检测模型之一,现在博客上常有的是如何使用YOLO模型训练自己的数据集,而鲜有对YOLO代码的精读。我认为只有对算法和代码实现有全面的了解,才能将YOLO使用的更加得心应手。这里的代码精读为YOLO v5,github版本为6.0。版本不同代码也会有所不同,请结合源码阅读本
Boundary Loss 原理与代码解析
在医学图像分割中任务中通常存在严重的类别不平衡问题,目标前景区域的大小常常比背景区域小几个数量级,比如下图中前景区域比背景区域小500倍以上。分割通常采用的交叉熵损失函数,在高度不平衡的问题上存在着众所周知的缺点即它假设所有样本和类别的重要性相同,这通常会导致训练的不稳定,并导致决策边界偏向于数量多
深度学习:使用UNet做图像语义分割,训练自己制作的数据集,详细教程
语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同,语义分割需要判断图像每个像素点的类别,进行精确分割。语义分割目前在自动驾驶、自动抠图、医疗影像等领域有着比较广泛的应用。我总结了使用UNet网络做图像语义分割的方法,教程很详细,学者耐心学习。
【图神经网络实战】深入浅出地学习图神经网络GNN(下)
最简单的思路是:我们可以将每个时刻的序列先送入GCN进行特征提取,然后再将提取后的特征送入GRU单元往后传递,依此类推。图中的注意力机制相当于在某个点进行特征重构时,其邻接点都加上一个权重,使得其在重构特征时受权重较大的邻接点影响更大,起到注意力的效果。对于动态图,传统的GNN就不太好用了,想想在时
无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
No More Strided Convolutions or Pooling:A New CNN Building Block for Low-ResolutionImages and Small Objects 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv提出了一
【深度强化学习】多智能体算法汇总
本文收纳了常见的多智能体强化学习方法,并简单介绍各个算法。
YOLO_v4讲解
YOLO_v4最全讲解
2022图像去雨综述研读——单幅图像去雨数据集和深度学习算法的联合评估与展望
数据集的质量依据数据集构建方式分类:基于背景雨层简单加和背景雨层复杂融合GAN数据驱动合成的数据集半自动化采集的真实数据集图像去雨方法依据任务场景单任务——雨滴、雨纹、雨雾和暴雨的去除联合任务——雨滴和雨纹、所有噪声去除依据采取的学习机制和网络设计CNN结构多分支组合GAN的生成结构循环和多阶段结构
基于yolov5s+bifpn实践隧道裂缝裂痕检测
基于yolov5s+bifpn实践隧道裂缝裂痕检测
李沐论文精读系列二:Vision Transformer、MAE、Swin-Transformer
本文是参考李沐bilibil论文精度视频和太阳花的视频/博文后所写
yolov5中的best.pt
yolov5中的best.pt,best是啥意思?
【代码解读】Transformer(一)——Encoder
encoder-decoder
rknn_yolov5执行流程
RV1109上测试rknn_yolov5_demo以及分析
torch.cat()中dim说明
初次接触众多博客对dim的讲解为,对于两个二维张量作为输入,dim取0结果为两个张量按行拼接,取1结果为按列拼接,但是对于高维来说就有点难以直观想象结果了,我们尝试三维情况进而总结规律。其中初学者最费解的就是dim的选取,dim的取值范围由输入张量的维度决定,输入为n维张量,dim取值在[0,n-1
使用OpenAI的Whisper 模型进行语音识别
Whisper模型是在68万小时标记音频数据的数据集上训练的,其中包括11.7万小时96种不同语言的演讲和12.5万小时从”任意语言“到英语的翻译数据。该模型利用了互联网生成的文本,这些文本是由其他自动语音识别系统(ASR)生成而不是人类创建的。该数据集还包括一个在VoxLingua107上训练的语
BP神经网络
1.概念: BP(back propagation)即为反向传播,意为反向传播神经网络。
YOLOv5内置--hyp超参配置文件对比
YOLOv5内置--hyp超参配置文件对比YOLOv5有大约30个超参数用于各种训练设置。这些是在目录中*.yaml的文件中定义的/data。更好的初始猜测会产生更好的最终结果,因此在演化之前正确初始化这些值很重要。lr00.01#初始学习率(SGD=1E-2,Adam=1E-3)lrf0.01#最
【YOLOV5-6.x讲解】YOLO5.0VS6.0版本对比+模型设计
减少操作:使用SPPF()代替原本的SPP() 更好的导出性:将Focus()替换为一个等效的Conv(k=6,s=2,p=2) 提高速度:将backbone中的 P3 中的 C3() 从重复次数从9减少为6更新超参数:增加了 mixup 和 copy-paste 的数据增强在最后一个C3() 主干