YOLOv4网络详解
YOLOv4是2020年Alexey Bochkovskiy等人发表在CVPR上的一篇文章,并不是Darknet的原始作者Joseph Redmon发表的,但这个工作已经被Joseph Redmon大佬认可了。之前我们有聊过YOLOv1~YOLOv3以及Ultralytics版的YOLOv3 SPP
计算机视觉项目-实时目标追踪
目标追踪技术对于民生、社会的发展以及国家军事能力的壮大都具有重要的意义。它不仅仅可以应用到体育赛事当中目标的捕捉,还可以应用到交通上,比如实时监测车辆是否超速等!对于国家的军事也具有一定的意义,比如说导弹识别目标等方向。所以说实时目标追踪技术对于整个社会来说都是非常重要的!目前被应用的比较多的,而且
基于pyskl的poseC3D训练自己的数据集
基于骨骼点的视频目标识别
[YOLOv7/YOLOv5系列算法改进NO.7]损失函数改进
前 言:作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv5的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效
综述:计算机视觉中的通道注意力机制
综述:计算机视觉中的通道注意力机制这是一篇从数据域的角度,给注意力机制分为六类的综述,涵盖论文数量多。论文题目:Attention Mechanisms in Computer Vision: A Survey论文链接:https://arxiv.org/pdf/2111.07624.pdf论文代码
去噪扩散概率模型(DDPM)的简单理解
扩散模型最近在图像生成领域取得了巨大的成功,类似 OpenAI 的DALL-E 2,Google 的Imagen,以及 Stability AI 最近发行的能够达到商业级绘画目的的等,都是基于扩散模型来进行图像生成的。本文对知乎上各位大佬对于扩散模型(特别是 DDPM)的讲解进行了融合,带领大家深入
【深度学习实践】基于深度学习的车牌识别(python,车牌检测+车牌识别)
基于深度学习的车牌识别任务可以拆解为2个步骤:车牌检测-车牌识别。其中车牌检测的目的是确认图片中车牌的位置,根据检测到的车牌位置把图片中的ROI裁剪出来,车牌识别算法用于识别裁剪出的车牌图像中的具体内容。本文使用PaddleOCR工具实现了车牌识别任务,首先使用PaddleOCR的检测算法DBNet
何恺明团队12页论文新作剑指AIGC!“新CLIP”只需一个trick,训练速度快3.7倍!性能不降反升...
杨净 艳艳 发自 凹非寺量子位 | 公众号 QbitAI何恺明团队又上新了。这次,他们的成果围绕当下最火的AIGC背后的CLIP展开。——只在该模型的极简结构上,施加了一个简单的mask,就让新模型的速度快了3.7倍。同时,性能还可以做到不降反升。团队表示,希望他们的工作能帮助未来视觉语言模型实现规
科普:什么是ChatGPT?(文末有彩蛋)
ChatGPT是OpenAI开发的一个大型预训练语言模型。它是GPT-3模型的变体,GPT-3经过训练,可以在对话中生成类似人类的文本响应。ChatGPT 旨在用作聊天机器人,我们可以对其进行微调,以完成各种任务,如回答问题、提供信息或参与对话。与许多使用预定义的响应或规则生成文本的聊天机器人不同,
yolov7-pose:基于COCO-KeyPoint的yolov7-pose训练
在美团刚刚发出yolov6,AB大神就带着yolov7来了。。。。。这速度是真快。。在 5-160 FPS 范围内速度和精度超过所有已知目标检测器。在 后不到两个星期,提出 YOLOv4 的团队就发布了更新一代的版本。YOLOv7 的论文被提交到了预印版论文平台 arXiv 上,其三位作者 Chie
【计算机视觉】图像分割与特征提取——基于Log、Canny的边缘检测
主要介绍最常用的二阶微分算子——Log、Canny算子的基本概念以及使用方法。
【深度学习】datasets.ImageFolder 使用方法
【深度学习】datasets.ImageFolder 使用方法
截至到2022年12月12日,知网最新改进 YOLO 核心论文合集 | 22篇创新点速览
知网最新改进YOLO论文合集
文本生成图像简述3--杂谈技术难点、研究意义、应用领域和目前的局限性
文本生成图像指的是使用人工智能技术将文本转换为图像的过程,其可以根据给定文本生成符合描述的真实图像,其是多模态机器学习的任务之一,文本生成图像的技术难点主要有两个: - 如何捕捉文本和图像之间的复杂关系; - 如何生成高质量的图像。
计算机视觉面试中一些热门话题整理
通常在机器学习面试中,问完常见基础知识的技术问题之后会有具体的项目问题的讨论,所以这里准备了一些项目相关的话题,以可以帮助你准备和通过计算机视觉相关的面试。
2022.09.29更新 c++下面使用opencv部署yolov5和yolov7实例分割模型(六)
opencv部署yolo实例分割模型。
Grad-CAM简介
对于常用的深度学习网络(例如CNN),可解释性并不强(至少现在是这么认为的),它为什么会这么预测,它关注的点在哪里,我们并不知道。很多科研人员想方设法地去探究其内在的联系,也有很多相关的论文。今天本文简单聊一聊Grad-CAM,这并不是一篇新的文章,但很有参考意义。通过Grad-CAM我们能够绘制出
YOLOv7训练自己的数据集(超详细)
YOLOv7训练自己的数据集(超详细)
学习笔记:深度学习(3)——卷积神经网络(CNN)理论篇
深度学习笔记——CNN卷积神经网络理论篇。主要包括CNN的概念、基本原理、类型综述。算是比较完善的一篇文章了。
Python中的切片(详细篇)学起来喔
Python中切片的切法,是什么,怎么切.