DRL基础(一)——强化学习发展历史简述

【摘要】这篇博客简要介绍强化学习发展历史:起源、发展、主要流派、以及应用举例。强化学习理论和技术很早就被提出和研究了,属于人工智能三大流派中的行为主义。强化学习一度成为着人工智能研究的主流,最近十年多年随着以深度学习为基础的联结主义的兴起,强化学习在感知和表达能力上得到了巨大提升,在解决某些领域的问

mmselfSup训练自己的数据集

最近在做自监督学习的东西,使用无标签数据做预训练模型,做个分享吧,写的不好,请见谅。

手把手教你运行yolov6 (小白版教程)

自己运行yolov6的完整教程提示:以下是本篇文章正文内容,下面案例可供参考#一、 yolov6的介绍我在此应用美团视觉部官方的说法叙述一下yolov6YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。本框架同时专注于检测的精度和推理效率,在工业界常用的尺寸模型中:YOLOv6-

Attention Mechanisms in Computer Vision: A Survey综述详解

2021年11月16日,清华大学计图团队和南开大学程明明教授团队、卡迪夫大学Ralph R. Martin教授合作,在ArXiv上发布关于计算机视觉中的注意力机制的综述文章[1]。该综述系统地介绍了注意力机制在计算机视觉领域中相关工作,并创建了一个仓库。该综述论文的第一作者是胡事民教授的博士生国孟昊

GAN系列之 pix2pixGAN 网络原理介绍以及论文解读

pix2pix GAN主要用于图像之间的转换,又称图像翻译。图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片,端到端的训练。 如果要根据每个问题设定一个特定的loss function 来让CNN去优化,通常都是训练CNN去缩小输入跟输出的欧氏距离,但这样通常会得到比较模糊的输出。

yolox+ByteTrack 自定义数据集训练

开的第一帖,就记录一下yolox+ByteTrack 自定义数据集训练吧!因为网上可找到的攻略太少!

常见三维表示方法

三维表示是机器视觉的一项关键技术,它能直观的反映物体的形状,与我们熟悉的二维表示相比,三维表示带有深度信息,因此有效的三维表示是实现三维模型重建、三维目标检测、场景语义分割等机器视觉任务的重要关键,在机器人、AR/VR、人机交互、遥感测绘等领域有着广泛的应用前景。

模型压缩(一)通道剪枝-BN层

通道剪枝

Mask RCNN详解

MaskR-CNN是对FasterR-CNN的直观扩展,网络的主干有RPN转换为主干网络为ResNet的添加了一个分支用于预测每个感兴趣区域(RoI)上的分割掩模,与现有的用于分类和边界盒回归的分支并行(图1)。

计算模型的GFLOPs和参数量 & 举例VGG16和DETR

近期忙于写论文,分享一下论文中表格数据的计算方法。FLOPS:注意S是大写,是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒

AI遮天传 DL-多层感知机

本文介绍多层感知机,会先按照历史顺序介绍多层感知机诞生前的一些模型,后面介绍具体实现与其算法。

【Make YOLO Great Again】最终版本YOLOv1-v7全系列大解析(全网最详细汇总篇)

全网最详细YOLOv1-v7全系列大解析汇总篇

MMLab

MMLabMMLab的主要研究方向:机器学习、强化学习、半监督/弱监督/自监督学习等方向的前沿方法和理论长视频理解、3D视觉、生成模型等的计算机视觉新兴方向物体检测、动作识别等核心方向的性能突破深度学习的创新应用探索,以及与医疗、社会科学、艺术创作等领域的交叉创新深度学习时代,算法与计算、系统框架、

python3.7安装、Anaconda安装、更新驱动CUDA11.7、安装GPU版本的pytorch

python3.7安装、Anaconda安装、更新驱动CUDA11.7、安装GPU版本的pythorch

绝了,超越YOLOv7、v8,YOLOv6 v3.0正式发布

​YOLOv6 全新版本v3.0正式发布!引入新的网络架构和训练方案,其中YOLOv6-S以484 FPS的速度达到45.0% AP,超过YOLOv5-S、YOLOv8-S,其代码刚刚开源。​由于前段时间Ultralytics公司透露出V8的发布消息,美团也坐不住了,YOLO社区一直情绪高涨!随着中

深度学习系列25:注意力机制

1. 从embedding到Encoder-Decoder1.1 Embedding首先需要用到embedding,把K维的0-1特征向量用k维的浮点数特征向量表示。直观代码如下:from keras.models import Sequentialfrom keras.layers import

torch.nn.functional.interpolate()函数详解

通常可以使用pytorch中的torch.nn.functional.interpolate()实现插值和上采样。上采样,在深度学习框架中,可以简单理解为任何可以让你的图像变成更高分辨率的技术。input(Tensor):输入张量size(intor Tuple[int] or Tuple[int,

【深度学习】--图像处理中的注意力机制

注意力机制是一个非常有效的trick,注意力机制的实现方式有许多。可以在知网上搜索一下yolov下的目标监测的硕士论文,没有一篇没有提到注意力机制的迭代修改的,所以很有必要学一下,最后给出了一个例子。输入还是等于输出,可是却是已经获取和注意力的特征.正是因为这个特点,所以注意力机制可以任意插拔。 *

超实用的7种 pytorch 网络可视化方法,进来收藏一波

引导前言1. torchsummary2. graphviz + torchviz3. Jupyter Notebook + tensorwatch4. tensorboardX5. netron6. hiddenlayer7. PlotNeuralNet结语前言网络可视化的目的一般是检查网络结构的

毕业设计-基于深度学习火灾烟雾检测识别系统-yolo

毕业设计-基于深度学习火灾烟雾检测识别系统-yolo