VoxCeleb1 数据集下载
VoxCeleb1 是广泛使用的 说话人识别、验证 数据集。由于是从 YouTube 视频中提取,有比较丰富的噪声。(有空补介绍)如果可以使用谷歌表单和翻译软件应该就可以顺利下载,私下分发数据集有侵权风险。官网如下:VoxCelebhttps://www.robots.ox.ac.uk/~vgg/d
YOLOv5-Shufflenetv2
YOLOV5-Shufflenetv2
风格迁移CycleGAN开源项目代码运行步骤详细教程
最近在学习Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks这篇论文,想要复现一下文中的代码,过程中遇到了很多问题,因此记录下来。遇到其他问题欢迎在评论区留言,相互解答。
YOLOV5更换轻量级的backbone:mobilenetV2
如何更换YOLOV5的backbone
ST-GCN论文分析
Introduction传统的骨架建模方法通常依赖手工制作的零件或遍历规则,因此表达能力有限,难以推广。新的动态骨架模型。通过自动从数据中学习时空模式,超越了以往方法的局限性。该公式不仅有更强的表达能力,而且有更强的泛化能力。早期使用骨架进行动作识别的方法简单地利用各个时间步的关节坐标形成特征向量,
halcon脚本-深度学习【语义分割】
本文讲解使用halcon的语义分割是使用步骤,标注工具不使用halcon提供的标注工具,而是使用各个深度学习框架都使用的labelMe工具,然后使用hde脚本以及python脚本转化为标准的halcon训练及文件本文涉及数据标注、数据转化、训练、评估、预测几个模块。
Pytorch中的grid_sample算子功能解析
近期在一个模型从pytorch迁移到mindspore框架中遇到一个算子适配问题,pytorch中的grid_sample在mindspore中没有对应的算子,需要考虑自定义实现。查找pytorch官网发现grid_sample是一种特殊的采样算法。调用接口为:torch.nn.functional
深度学习之bottleneck layer
一、bottleneck layery中文名称:瓶颈层。我初次接触也就是在残差网络中。一般在较深的网络中,如resnet101中使用。一般的结构如下:其中两个1X1fliter分别用于降低和升高特征维度,主要目的是为了减少参数的数量,从而减少计算量,且在降维之后可以更加有效、直观地进行数据的训练和特
【nn.LSTM详解】
nn.LSTM详解
MSRN(多尺度超分辨率重建)
MSRN网络结构
ChatGPT底层原理及教程
GPT(Generative Pre-training Transformer,生成预训练变压器)是由OpenAI在2018年开发的一种语言模型【和Bert是类似的】,在广泛的自然语言处理任务中取得了最先进的结果。它最初由Alec Radford, Karthik Narasimhan, Tim S
解决pytorch中Dataloader读取数据太慢的问题
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、造成的原因二、查找不匹配的原因三、解决方法四、使用方法后言前言最近在使用pytorch框架进行模型训练时遇到一个性能问题,即数据读取的速度远远大于GPU训练的速度,导致整个训练流程中有大部分时间都在等待数据发送到GPU,
Pytorch教程入门系列11----模型评估
本文介绍了常用评估模型的方法,及使用方法,帮助初学者快速上手
YoloV5 的ros功能包
YoloV5的ros功能包
MobileViT、MobileViTv2、MobileViTv3学习笔记(自用)
MobileViT、MobileViTv2、MobileViTv3学习笔记(自用)
Unet++语义分割网络(网络结构分析+代码分析)
Unet++是一个非常经典又易于学习的语义分割网络,非常值得前期研究一下。本文从网络结构还有代码解析两个方面,分享Unet++网络思想。
[ 数据集 ] MINIST 数据集介绍
[ 数据集 ] MINIST 数据集介绍MINIST``Size:`` 28×28 灰度手写数字图像;``Num:`` 训练集 60000 和 测试集 10000,一共70000张图片;``Classes:`` 0,1,2,3,4,5,6,7,8,9;具体介绍了数据集的读取与可视化操作等...
注意力机制(SE,ECA,CBAM,SKNet, scSE,Non-Local,GCNet) Pytorch代码
介绍在CNN中的常见的三种注意力机制,并且提供了Pytorch代码2023.3.2新增SKNet代码,同是修改SkNet在测试时不报错,但是在反向传播中报错的情况。2023.3.10 新增scSE注意力代码2023.3.11 新增Non-Local Net代码2023.3.13 新增GCNet代码
BatchNorm详解
引言:前几天被同事问到了一个问题:当batch_size=1时,Batch Normalization还有没有意义,没有说出个所以然,才意识到自己从来不好好读过BN的论文(Batch Normalization: Accelerating Deep Network Training by Reduc
Pytorch复习笔记--导出Onnx模型为动态输入和静态输入
当使用 Pytorch 将网络导出为 Onnx 模型格式时,可以导出为动态输入和静态输入两种方式。动态输入即模型输入数据的部分维度是动态的,可以由用户在使用模型时自主设定;静态输入即模型输入数据的维度是静态的,不能够改变,当用户使用模型时只能输入指定维度的数据进行推理。在以下代码中,定义了一个网络,