使用动图深入解释微软的Swin Transformer

本文旨在使用插图和动画为Swin Transformers提供全面的指南,以帮助您更好地理解这些概念。

python 关于CNN的一些思考-2022

今年(2022)CVPR有两篇关于CNN的论文让我印象深刻,因为它们不约而同的使用了更大的卷积核:疑问1:为什么之前很少有论文用大卷积核?疑问2:大卷积核为什么这么work?

PPOCRv3模型转pytorch

paddleocr模型转pytorch

【深度学习】常见的神经网络层(上)

在深度学习中常见的神经网络层的讲解

【论文阅读】Attention is all you need(Transformer)

文章目录前言1.Abstract2.Introduction3.Background4.Model Architecture4.1. Encoder and Decoder Stacks4.2. Attention4.2.1. Scaled Dot-Product Attention4.2.2.Mu

基于Python实现的口罩佩戴检测

口罩佩戴检测一 题目背景1.1 实验介绍今年一场席卷全球的新型冠状病毒给人们带来了沉重的生命财产的损失。有效防御这种传染病毒的方法就是积极佩戴口罩。我国对此也采取了严肃的措施,在公共场合要求人们必须佩戴口罩。在本次实验中,我们要建立一个目标检测的模型,可以识别图中的人是否佩戴了口罩。1.2 实验要求

在时间序列中使用Word2Vec学习有意义的时间序列嵌入表示

在这篇文章中,介绍了众所周知的 Word2Vec 算法的推广,用于学习有价值的向量表示。我们在时间序列上下文中应用 Word2Vec,并展示了这种技术在非标准 NLP 应用程序中的有效性。整个过程可以很容易地集成到任何地方,并且很容易用于迁移学习任务。

Pytorch目标检测算法(2)(基于李沐老师的课程)

二.锚框2.1 定义目标检测算法,顾名思义我们需要在输入图像上检测是否存在我们关注的目标。因此我们需要在输入图像上进行大量的采样,然后进行判断是否存在目标,并调整区域边界从而更准确的预测目标的真实边框。故在图像上的大量采样所得到的不同缩放比和宽高比的边界框就称为锚框。图示:2.2 实现过程1.锚框数

GAN 初学者指南

GAN是一个非常巧妙并且非常有用的模型。当有大量关于 GAN 的论文时,但是你会发现这些论文通常很难理解,你可能会想要一些对初学者更友好的东西。所以本文的对非传统机器学习人员来说,是我能想到的最好的例子。

基于LSTM的时空序列预测任务文章总结

时空序列预测任务,LSTM单元结构

李宏毅老师《机器学习》课程笔记-3卷积神经网络

介绍了深度学习在图像识别领域的应用—卷积神经网络。

正则化——参数范数惩罚

L1和L2正则化

物体检测快速入门系列(3)-Windows部署Docker GPU深度学习开发环境

在《物体检测快速入门系列(2)-Windows部署GPU深度学习开发环境》一文中已经描述了如何在Windows环境下部署GPU深度学习开发环境,但是要我推荐的话,我还是倾向于docker环境,无需安装cuda、cuDNN,docker镜像安装完毕后,就都好了,一键部署好之后,可以随意迁移,再也不用环

《Yolov5实验数据全部开源》

公开了个人实验数据及配置文件代码

Python-安装Pytorch

文章目录一.安装Anaconda二.创建虚拟环境三.安装pytorch四.配置jupyter notebook注:本文参考了深入浅出PyTorch一.安装Anaconda安装步骤略.二.创建虚拟环境1.打开Anaconda Prompt2.创建虚拟环境conda create -n env_name

多目标追踪小抄:快速了解MOT的基本概念

MOT 获取单个连续视频并以特定帧速率 (fps) 将其拆分为离散帧以输出

PyTorch学习笔记(十一)——ResNet的实现

目录一、Residual Block二、ResNet 架构三、训练/测试 ResNet附录:完整代码一、Residual Block残差块有以下两种:实现如下:import torchfrom torch import nnimport torch.nn.functional as Fclass R

卷积神经网络(原理与代码实现)

卷积神经网络1、卷积的概念2、感受野的概念3、全零填充(padding)4、Tensorflow描述卷积层4.1 卷积(Convolutional)4.2 批标准化(Batch Normalization,BN)4.3 池化4.4 Dropout5、简单CNN实现CIFAR10数据集分类5.1 ci

【注意力机制集锦2】BAM&SGE&DAN原文、结构、源码详解

视觉注意力机制领域BAM及DAN的原文、结构、源码解读