Vision Transformer这两年

在NLP领域取得巨大成功后,Transformer架构在计算机视觉方面的作用日渐凸显,成为越来越普遍的CV工具。自2020年10月Vision Transformer模型推出以来,人们开始高度关注Transformer模型在计算机视觉上的应用。

目标检测算法——YOLOv5/YOLOv7改进之结合​RepVGG(速度飙升)

目标检测算法——YOLOv5/YOLOv7改进之结合​RepVGG(速度飙升)。在ImageNet上,据我们所知,RepVGG的top-1准确性达到80%以上,这是老模型首次实现该精度。 在NVIDIA 1080Ti GPU上,RepVGG模型的运行速度比ResNet-50快83%,比ResNet-

达摩院开源低成本大规模分类框架FFC CVPR论文深入解读

图像分类是当前AI最为成功的实际应用技术之一,它已经融入了人们的日常生活。目前已形成一个普遍共识:“当数据集越大ID越多时,只要训练得当,相应分类任务的效果就会越好”。本文介绍在千万ID甚至上亿ID时,如何使用低成本的框架实现大规模的分类训练。

文本生成图像工作简述2--常用数据集分析与汇总

文本生成图像(text-to-image)可以根据给定文本生成符合描述的真实图像,其是多模态机器学习的任务之一,具有巨大的应用潜力,如视觉推理、图像编辑、视频游戏、动画制作和计算机辅助设计。本篇将简述文本生成图像的数据集,汇总介绍数据集的内容、特点、细节和下载方式等。

YoloV7最强操作教程.

yolov7最强保姆级操作教程,并且在B站中配套讲解视频喔,本文主要带领大家使用yolov7对口罩目标检测数据集进行实践,主要就是希望通过本教程可以让各位使用yolov7对自己的数据集进行训练,测试,预测。

基于CNN和LSTM的气象图降水预测示例

我们是否可以通过气象图来预测降水量呢?今天我们来使用CNN和LSTM进行一个有趣的实验。

文本生成图像简述3--杂谈技术难点、研究意义、应用领域和目前的局限性

文本生成图像指的是使用人工智能技术将文本转换为图像的过程,其可以根据给定文本生成符合描述的真实图像,其是多模态机器学习的任务之一,文本生成图像的技术难点主要有两个: - 如何捕捉文本和图像之间的复杂关系; - 如何生成高质量的图像。

HRNet网络简介

这篇文章是由中国科学技术大学和亚洲微软研究院在2019年共同发表的。这篇文章中的HRNet(High-Resolution Net)是针对2D人体姿态估计(Human Pose Estimation或Keypoint Detection)任务提出的,并且该网络主要是针对单一个体的姿态评估(即输入网络

生成对抗网络(Generative Adversial Network,GAN)原理简介

生成对抗网络(GAN)的基本原理

计算机视觉面试中一些热门话题整理

通常在机器学习面试中,问完常见基础知识的技术问题之后会有具体的项目问题的讨论,所以这里准备了一些项目相关的话题,以可以帮助你准备和通过计算机视觉相关的面试。

强化学习的基础知识和6种基本算法解释

本文将涉及强化学习的术语和基本组成部分,以及不同类型的强化学习(无模型、基于模型、在线学习和离线学习)。本文最后用算法来说明不同类型的强化学习。

「模型即服务AI」1分钟调用SOTA人脸检测,同时搭建时光相册小应用

本文介绍如何快速调用AI能力,并快速创建AI应用服务,跟随本文只需1分钟就能完成上述任务。现如今结合模型即服务AI热潮,相应AI应用搭建将会越来越方便,大把的精力可以集中放到AI技术与应用的普及和相应创新上了。

MNIST数据集手写数字识别(CNN)

MNIST 包括6万张28x28的训练样本,1万张测试样本,很多教程都会对它”下手”几乎成为一个 “典范”,可以说它就是计算机视觉里面的Hello World。所以我们这里也会使用MNIST来进行实战。前面在介绍卷积神经网络的时候说到过LeNet-5,LeNet-5之所以强大就是因为在当时的环境下将

使用PyTorch进行知识蒸馏的代码示例

在本文中,我们将探索知识蒸馏的概念,以及如何在PyTorch中实现它。

AI遮天传 DL-深度学习在自然语言中的应用

AI遮天传 DL-深度学习在自然语言中的应用

从另外一个角度解释AUC

AUC到底代表什么呢,我们从另外一个角度解释AUC

人工智能前沿——6款AI绘画生成工具

AI不仅影响商业和医疗保健等行业,还在创意产业中发挥着越来越大的作用,开创了AI绘画生成器新时代。在绘画领域当然也是如此,与传统的绘画工具不同,AI人工智能时代的绘画工具是全自动的、智能的。小海带本期将给大家介绍6款AI绘画生成工具,供大家学习交流。

Grad-CAM简介

对于常用的深度学习网络(例如CNN),可解释性并不强(至少现在是这么认为的),它为什么会这么预测,它关注的点在哪里,我们并不知道。很多科研人员想方设法地去探究其内在的联系,也有很多相关的论文。今天本文简单聊一聊Grad-CAM,这并不是一篇新的文章,但很有参考意义。通过Grad-CAM我们能够绘制出

YOLOv7训练自己的数据集(超详细)

YOLOv7训练自己的数据集(超详细)

学习笔记:深度学习(3)——卷积神经网络(CNN)理论篇

深度学习笔记——CNN卷积神经网络理论篇。主要包括CNN的概念、基本原理、类型综述。算是比较完善的一篇文章了。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈