GCNet: Global Context Network(ICCV 2019)原理与代码解析

本文通过观察发现non-local block针对每个query position计算的attention map最终结果是独立于查询位置的,那么就没有必要针对每个查询位置计算了,因此提出计算一个通用的attention map并应用于输入feature map上的所有位置,大大减少了计算量的同时又

高阶数据增强:Cutmix 原理讲解&零基础程序实现

CutMix是一种数据增强技术,用于在训练图像分类模型时减轻过拟合问题,可以帮助提高模型的泛化性能和鲁棒性,是竞赛的一个重要涨分点。CutMix的核心思想是将两张图像的一部分混合在一起,生成一个新的训练样本。本篇博客详细讲解了CutMix的原理,并从零开始教大家实现将CutMix移植到自己的网络模型

Ubuntu系统复现NeRFStudio(详细)

nerfstudio详细安装过程,包括常见错误的分析以及解决方法。

多尺度可形变注意力机制MultiScaleDeformableAttn

这个模块是将 Transformer 的全局注意力变为局部注意力的一个非常关键的组件,用于减少训练时间,提高 Transformer 的收敛速度;该机制来源于BEVFormer中的技术;目前已集成到MMCV MMDET3d中。

【深度学习进阶之路】----解决新建Anconda虚拟环境总是安装在C盘的问题

即使我们在安装Anacoda时明明选择了其他安装路径,但是新建虚拟环境时总是默认安装在C盘,以至于导致C盘文件不断增加,本篇博客通过修改配置在C盘路径下的**.condarc**文件,实现虚拟环境的位置变化。......

最近火出圈的GPT-4 技术Report出来了,快进来看看逐文对照翻译!

近期OpenAI发布的GPT-4的效果好得让人惊艳!碾压了之前火到出圈的ChatGPT,通过同步发布的GPT-4 Technical Report一同看看到底发生了什么!No.0摘要We report the development of GPT-4, a large-scale, multimod

机器学习——池化层

池化层是深度学习中常用的一种层级结构,它可以对输入数据进行降采样,减少数据量,同时保留重要的特征信息。池化层通常紧跟在卷积层之后,可以有效地减少数据量和计算复杂度,提高模型的训练速度和泛化能力。

AI视觉算法训练平台介绍

模型训练:通过可视化工具调用模型训练器进行模型训练,核心参数包括优化器、学习速率、epochs等,还可以灵活设置训练时批量大小和训练集、验证集分割方式等。数据准备:先将需要训练的图像数据集上传至数据管理库。数据集应当包含尽可能多的安装在设备上的场景、目标,且在构建数据集时注意保证数据类型或格式的规范

ResNeXt代码复现+超详细注释(PyTorch)

ResNeXt代码复现(PyTorch),每一行都有超详细注释,新手小白都能看懂,亲测可运行

【Yolov5】涨点亲测有效,Yolov5添加PSA极化自注意力机制

Yolov5添加PSA极化注意力机制,助力实验涨点!主要用于目标检测、图像语义分割、人体姿态识别等

使用pytorch的错误整理

程序卡在Using /home/liao/.cache/torch_extensions/py38_cu102 as PyTorch extensions root…在/home/liao/.cache下删除torch_extensions文件夹,原因:之前运行pytorch时,不正常退出,导致的进

深度学习超参数调整介绍

深度学习模型的性能很大程度上取决于超参数的选择。超参数是指在训练过程中需要手动设置的参数,例如学习率、批大小、迭代次数、网络结构等等。选择合适的超参数可以提高模型的准确率和泛化能力。本教程将介绍一些常用的超参数和调参技巧,帮助您在深度学习项目中取得更好的效果。深度学习模型的超参数对模型的性能有很大影

详解VQVAE:Neural Discrete Representation Learning

详解VQVAE:Neural Discrete Representation Learning一些具有挑战性的任务,如few-shot learning,严重依赖从原始数据学习的表示,但在无监督的方式下训练的通用表示的有用性仍然远远不是主流方法。极大似然和重构误差是训练像素域无监督模型的两个常用目标

如何安装Anaconda(Windows版)

如何安装Anaconda(Windows版)

AI数字人:换脸模型Faceswap

Faceswap利用深度学习算法和人脸识别技术,可以将一个人的面部表情、眼睛、嘴巴等特征从一张照片或视频中提取出来,并将其与另一个人的面部特征进行匹配。

多模态分析数据集(Multimodal Dataset)整理

本文整理了多模态数据集

在消费级GPU调试LLM的三种方法:梯度检查点,LoRA和量化

LLM的问题就是权重参数太大,无法在我们本地消费级GPU上进行调试,所以我们将介绍3种在训练过程中减少内存消耗,节省大量时间的方法:梯度检查点,LoRA和量化。

解决YOLOv5训练自己的数据集出现No labels in path\train.cache问题

解决YOLOv5训练自己的数据集出现No labels in path\train.cache问题

Openmv第四天之模板匹配

openmv初学

音频数据处理基本知识学习——降噪滤波基础知识

在图像处理中,滤波和降噪也是常见的技术,可以用来去除图像中的噪声、平滑图像、增强图像的边缘等。基于谱减法的降噪方法:使用短时傅里叶变换将信号转换到频域,通过对各个频率分量的能量进行估计和处理来实现降噪,适用于语音信号的处理。基于小波变换的降噪方法:使用小波变换将信号分解成不同频率的小波系数,并利用小

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈