YOLO Air一款面向科研小白的YOLO项目 | 包含大量改进方式教程

YOLO Air一款面向科研的YOLO项目

毕业设计-基于机器视觉人脸识别技术课堂签到系统的设计与实现-OpenCV

毕业设计-基于机器视觉人脸识别技术课堂签到系统的设计与实现-OpenCV:人工智能理论的深入研究和优秀的深度学习算法的相继出现,我国开始着重于对大数据、深度学习的研究,这极大推动了计算机视觉技术的发展。人脸识别是机器视觉领域的主要研究对象之一,人脸识别验证速度快、识别准确率高、用户体验良好的特点,而

Windows下Pytorch3d的安装方法

Pytorch3d在WIN下的安装

ACmix:卷积与self-Attention的融合

ACmix是一种高效的卷积自注意力融合方法,集中了两种结构的优势,同时又能在计算开销上保持在能接受的范围。

图像超分——Real-ESRGAN快速上手

首先声明,图像超分不是我的主要研究方向,下面我就以一个“外行人”的视角简单理解一下Real-ESRGAN这个算法的原理。如果读者对理论不感兴趣,可以跳到下一节的实践部分。

【综述】分子表示与性质预测中的深度学习方法

Drug Discovery Today、分子性质预测综述

Pyqt搭建YOLOv5目标检测系统(可视化界面+功能介绍+源代码)

系统支持输入图片、视频、摄像头和RTSP视频流的目标检测,其中,可以对图片进行处理,包括灰度化、平滑处理、均衡化、形态学、图像梯度、阈值处理、边缘检测、轮廓检测、直线检测、亮度调节和伽玛校正。

DarkNet网络结构

如下图所示,残差块结构由两条支路组成,一条支路将上一层输出的feature map进行卷积等操作,另一条支路将上一层输出的feature map。而更基本的结构就是残差块了,因此我们先构建出残差块,然后重复堆叠上述结构darknet53就完成了。残差)(下采+4*残差),所以待会儿会出现一个储存残差

深度学习论文精读[6]:UNet++

UNet的编解码结构一经提出以来,大有统一深度学习图像分割之势,后续基于UNet的改进方案也经久不衰,一些研究者也在从网络结构本身来思考UNet的有效性。比如说编解码网络应该取几层,跳跃连接是否能够有更多的变化以及什么样的结构训练起来更加有效等问题。UNet本身是针对医学图像分割任务而提出来的网络结

EIoU和Focal-EIoU Loss

CIoU Loss虽然考虑了边界框回归的重叠面积、中心点距离、高宽比。但是其公式中的v反映的是高宽的差异,而不是高宽分别与其置信度的真实差异。因此,有时会阻碍模型有效的优化相似性。针对这一问题,本文在CIoU的基础上将高宽比拆开,提出了EIoU Loss,并且引入了Focal Loss聚焦优质的锚框

10.7. Transformer

transformer的编码器和解码器是基于自注意力的模块叠加而成的,源(输入)序列和目标(输出)序列的嵌入(embedding)表示将加上位置编码(positional encoding),再分别输入到编码器和解码器中。值得注意的是,解码器的自注意力权重和“编码器-解码器”的注意力权重都有相同的查

如何使用GPT2中文闲聊对话系统,机器人对话,自动对话!

每一次运行完一个epoch都会保存到model下面,在预测的时候直接调用model下面最后一个epoch就行,有问题可以发评论,我看见且我看得懂的话就会,哈哈哈httpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttps

【注意力机制集锦】Channel Attention通道注意力网络结构、源码解读系列一

本文从原文、网络结构、代码实现三个方面系统总结了SENet、SKNET、CBAM三种注意力机制

关于YOLOv7的分析

此篇文章是在7月初编写,可能会与现有的源码有所出入,如在月末增加了关于head部分阴性参数的融合,但总体上的出入并不会太大

VoxCeleb1 数据集下载

VoxCeleb1 是广泛使用的 说话人识别、验证 数据集。由于是从 YouTube 视频中提取,有比较丰富的噪声。(有空补介绍)如果可以使用谷歌表单和翻译软件应该就可以顺利下载,私下分发数据集有侵权风险。官网如下:VoxCelebhttps://www.robots.ox.ac.uk/~vgg/d

YOLOv5-Shufflenetv2

YOLOV5-Shufflenetv2

风格迁移CycleGAN开源项目代码运行步骤详细教程

最近在学习Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks这篇论文,想要复现一下文中的代码,过程中遇到了很多问题,因此记录下来。遇到其他问题欢迎在评论区留言,相互解答。

YOLOV5更换轻量级的backbone:mobilenetV2

如何更换YOLOV5的backbone

ST-GCN论文分析

Introduction传统的骨架建模方法通常依赖手工制作的零件或遍历规则,因此表达能力有限,难以推广。新的动态骨架模型。通过自动从数据中学习时空模式,超越了以往方法的局限性。该公式不仅有更强的表达能力,而且有更强的泛化能力。早期使用骨架进行动作识别的方法简单地利用各个时间步的关节坐标形成特征向量,

halcon脚本-深度学习【语义分割】

本文讲解使用halcon的语义分割是使用步骤,标注工具不使用halcon提供的标注工具,而是使用各个深度学习框架都使用的labelMe工具,然后使用hde脚本以及python脚本转化为标准的halcon训练及文件本文涉及数据标注、数据转化、训练、评估、预测几个模块。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈