论文推荐:ACMix整合self-Attention和Convolution (ACMix)的优点的混合模型

混合模型ACmix将自注意与卷积的整合,同时具有自注意和卷积的优点。这是清华大学、华为和北京人工智能研究院共同发布在2022年CVPR中的论文

注意力机制-CA注意力-Coordinate attention

CA(Coordinate attention for efficient mobile network design)发表在CVPR2021,帮助轻量级网络涨点、即插即用。CA不仅考虑到空间和通道之间的关系,还考虑到长程依赖问题。简单进行记录,如有问题请大家指正。

人工智能时代八大类算法你了解吗?(包邮送书6本)

本文导读1. 关联规则分析2. 回归分析3. 分类分析4. 聚类分析5. 集成学习6. 自然语言处理7. 图像处理8. 深度学习

2023 年 1 月的5篇深度学习论文推荐

本文整理了 2023 年 1 月5 篇著名的 AI 论文,涵盖了计算机视觉、自然语言处理等方面的新研究。

CUDA安装及环境配置——最新详细版

在安装之前呢,我们需要确定三件事第一:查看显卡支持的最高CUDA的版本,以便下载对应的CUDA安装包第二:查看对应CUDA对应的VS版本,以便下载并安装对应的VS版本(vs需要先安装)第三:确定CUDA版本对应的cuDNN版本,这个其实不用太关注,因为在cudnn的下载页面会列出每个版本对应的cud

在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型

本文将介绍解梯度检查点(Gradient Checkpointing),这是一种可以让你以增加训练时间为代价在 GPU 中训练大模型的技术。 我们将在 PyTorch 中实现它并训练分类器模型。

动手学深度学习(五十)——多头注意力机制

文章目录1. 为什么用多头注意力机制2. 什么是多头注意力机制3. 多头注意力机制模型和理论计算4. 动手实现多头注意力机制层小结练习1. 为什么用多头注意力机制所谓自注意力机制就是通过某种运算来直接计算得到句子在编码过程中每个位置上的注意力权重;然后再以权重和的形式来计算得到整个句子的隐含向量表示

Anaconda创建环境及环境配置

anaconda创建环境

MoCo代码分析 [自监督学习]

关键词:MoCo 源码分析。

用Anaconda安装TensorFlow(Windows10)

本文分为三大部分:一.安装Anaconda二.用Anaconda安装TensorFlow三.Pycharm中安装Anaconda1.Anaconda下载两种下载路径,第一种是从Anaconda官网下载Anaconda官网第二种是从清华镜像官网下载(比较快)清华镜像Anaconda下载我选择的是在清华

如何用DETR(detection transformer)训练自己的数据集

DETR(detection transformer)简介DETR是Facebook AI的研究者提出的Transformer的视觉版本,是CNN和transformer的融合,实现了端到端的预测,主要用于目标检测和全景分割。DETR的Github地址:link

联邦学习((Federated Learning,FL)

联邦学习相关概念、领域热点、挑战与前景。联邦学习的定义、特点、框架、迭代流程、分类;领域亟待解决的问题;主要研究方向、热点和前景展望。

【人工智能原理自学】卷积神经网络:图像识别实战

😊你好,我是小航,一个正在变秃、变强的文艺倾年。🔔本文讲解卷积神经网络:图像识别实战,一起卷起来叭!

DeepTime:时间序列预测中的元学习模型

DeepTime,是一个结合使用元学习的深度时间指数模型。通过使用元学习公式来预测未来

yolov5模型训练结果分析

模型训练结束后怎么看训练结果

2023需要重点关注的四大AI方向

本文是我认为2023年需要重点关注的四大AI方向,这四个方向有望在今年进一步推动AI的发展,并帮助解决行业面临的一些核心挑战。

使用OpenAI的Whisper 模型进行语音识别

本文将解释用于训练的数据集的种类以及模型的训练方法,以及如何使用Whisper

【深度学习】(四)目标检测——上篇

上一章介绍了图像分类,这一章来学习一下目标检测上篇。简单来说,需要得到图像中感兴趣目标的类别信息和位置信息,相比于分类问题,难度有所提升,对图像的描述更加具体。在计算机视觉众多的技术领域中,目标检测(Object Detection)也是一项非常基础的任务,图像分割、物体追踪、关键点检测等通常都要依

使用计算机视觉和深度学习创建现代 OCR 管道

文档扫描仪可以使用手机拍照并[“扫描”]收据和发票等项目。我们的移动文档扫描仪仅输出图像 - 就计算机而言,图像中的任何文本都只是一组像素,无法复制粘贴,搜索或您可以对文本执行的任何其他操作。因此,需要应用光学字符识别或OCR。此过程从我们的文档扫描图像中提取实际文本。运行 OCR 后,我们可以为

YOLOv5中的SPP/SPPF结构详解

深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。目录一、SPP的应用的背景二、SPP结构分析三、YOLOv5中SPP结构源码解析(内含注释分析)一、SPP的应用的背景在卷积神经网络中我们经常看到固定输入的设计,但是如果我们输入的不能是固