动手学深度学习(五十)——多头注意力机制
文章目录1. 为什么用多头注意力机制2. 什么是多头注意力机制3. 多头注意力机制模型和理论计算4. 动手实现多头注意力机制层小结练习1. 为什么用多头注意力机制所谓自注意力机制就是通过某种运算来直接计算得到句子在编码过程中每个位置上的注意力权重;然后再以权重和的形式来计算得到整个句子的隐含向量表示
Anaconda创建环境及环境配置
anaconda创建环境
MoCo代码分析 [自监督学习]
关键词:MoCo 源码分析。
用Anaconda安装TensorFlow(Windows10)
本文分为三大部分:一.安装Anaconda二.用Anaconda安装TensorFlow三.Pycharm中安装Anaconda1.Anaconda下载两种下载路径,第一种是从Anaconda官网下载Anaconda官网第二种是从清华镜像官网下载(比较快)清华镜像Anaconda下载我选择的是在清华
如何用DETR(detection transformer)训练自己的数据集
DETR(detection transformer)简介DETR是Facebook AI的研究者提出的Transformer的视觉版本,是CNN和transformer的融合,实现了端到端的预测,主要用于目标检测和全景分割。DETR的Github地址:link
联邦学习((Federated Learning,FL)
联邦学习相关概念、领域热点、挑战与前景。联邦学习的定义、特点、框架、迭代流程、分类;领域亟待解决的问题;主要研究方向、热点和前景展望。
【人工智能原理自学】卷积神经网络:图像识别实战
😊你好,我是小航,一个正在变秃、变强的文艺倾年。🔔本文讲解卷积神经网络:图像识别实战,一起卷起来叭!
DeepTime:时间序列预测中的元学习模型
DeepTime,是一个结合使用元学习的深度时间指数模型。通过使用元学习公式来预测未来
yolov5模型训练结果分析
模型训练结束后怎么看训练结果
2023需要重点关注的四大AI方向
本文是我认为2023年需要重点关注的四大AI方向,这四个方向有望在今年进一步推动AI的发展,并帮助解决行业面临的一些核心挑战。
【实验记录】yolov5的一些改进tricks总结--持续更ing
【实验记录】yolov5的一些改进tricks总结1.在yolov5上增加小目标检测层link2.在yolov5上增加注意力机制link
YOLOv5解析 | 第三篇:如何改进YOLOv5?
大家好,我是K同学啊!在前面的文章YOLOv5解析 | 第二篇:用YOLOv5训练自己的数据集(超级详细完整版)中我们介绍了使用训练自己的数据集。这一篇文章,我将带大家一起解析 YOLOv5 的 6.0 版本结构,先看看我们模型结构图~由于YOLOv5存在多个版本,所以你在网上可能会看到许多不同版本
本科生学深度学习,搭建环境,再不入坑就晚了
目录1、目的2、心理准备3、IDE的选择4、AI框架的选择5、安装环境6、总结最近没怎么写游戏了,一直在写python,是因为我对深度学习感兴趣,想学习一下,同时也觉得AI是未来,所以去学习了一段时间。1、目的AI 和游戏的结合是 强化学习,强化学习是深度学习的一个分支,之前也写过一点深度学习,所以
使用OpenAI的Whisper 模型进行语音识别
本文将解释用于训练的数据集的种类以及模型的训练方法,以及如何使用Whisper
【深度学习】(四)目标检测——上篇
上一章介绍了图像分类,这一章来学习一下目标检测上篇。简单来说,需要得到图像中感兴趣目标的类别信息和位置信息,相比于分类问题,难度有所提升,对图像的描述更加具体。在计算机视觉众多的技术领域中,目标检测(Object Detection)也是一项非常基础的任务,图像分割、物体追踪、关键点检测等通常都要依
使用计算机视觉和深度学习创建现代 OCR 管道
文档扫描仪可以使用手机拍照并[“扫描”]收据和发票等项目。我们的移动文档扫描仪仅输出图像 - 就计算机而言,图像中的任何文本都只是一组像素,无法复制粘贴,搜索或您可以对文本执行的任何其他操作。因此,需要应用光学字符识别或OCR。此过程从我们的文档扫描图像中提取实际文本。运行 OCR 后,我们可以为
YOLOv5中的SPP/SPPF结构详解
深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。目录一、SPP的应用的背景二、SPP结构分析三、YOLOv5中SPP结构源码解析(内含注释分析)一、SPP的应用的背景在卷积神经网络中我们经常看到固定输入的设计,但是如果我们输入的不能是固
【深度学习】AI一键换天
基于视觉的视频天空替换和协调方法,该方法可以在具有可控风格的视频中自动生成逼真的天空背景。与以前的天空编辑方法专注于静态照片或需要集成在智能手机中的惯性测量装置拍摄视频不同,该方法完全基于视觉,对捕获设备没有任何要求,并且可以很好地应用于在线或离线处理场景。......
【深度学习前沿应用】图像风格迁移
【深度学习前沿应用】图像风格迁移,基于百度飞桨开发,参考于《机器学习实践》所作。
使用Stable-Diffusion生成视频的完整教程
本文是关于如何使用cuda和Stable-Diffusion生成视频的完整指南,将使用cuda来加速视频生成,并且可以使用Kaggle的TESLA GPU来免费执行我们的模型。