YOLO系列模型改进指南

YOLO主流模型改进大杂烩!!!目前包含yolov5,yolov7,yolov8模型的众多改进方案,效果因数据集和参数而定,仅供参考。

【视觉SLAM14讲】【汇总】

第一讲东西少,就没记录【slam十四讲第二版】【课本例题代码向】【第二讲初识SLAM】【SLAM基础知识】【linux下C++编译】【cmake基础使用】【slam十四讲第二版】【课本例题代码向】【第三~四讲刚体运动、李群和李代数】【eigen3.3.4和pangolin安装,Sophus及fim的

GPU版本PyTorch详细安装教程

注意:30系列的的显卡暂时不支持cuda11以下版本!!!一、安装显卡驱动第一步:右击右下角开始,在设备管理器中查看计算机显卡型号,例如我的显卡是GTX1050:第二步:进入英伟达官网,下载对应显卡驱动:官方驱动 | NVIDIAhttps://www.nvidia.cn/Download/inde

CentOs7 + Stable Diffusion + Novel AI实现AI绘画

把改名后的三个文件放到/stable-diffusion-webui/models/Stable-diffusion目录下,重启Stable Diffusion后左上角选择nai模型。整个内容很大,有52G,只需下载stableckpt目录下的animefull-final-pruned文件夹以及a

【交通数据(1)——加州高速路网PeMS交通数据】

交通数据(1)——加州高速路网PeMS交通数据一、PeMS数据介绍1. 数据简介二、相关数据下载1.引入库2.读入数据一、PeMS数据介绍1. 数据简介  使用PeMS,用户可以对高速公路性能进行统一、全面的评估,基于对高速公路网络当前状态的了解做出运营决策,分析拥堵瓶颈以确定潜在的补救措施,并做出

被称为下一代风口的AIGC到底是什么?

AIGC超级干货,快速了解AI新潮

UNet语义分割实战:使用UNet实现对人物的抠图

摘要在上一篇文章,我总结了一些UNet的基础知识,对UNet不了解的可以看看,文章链接:https://wanghao.blog.csdn.net/article/details/123714994我也整理的UNet的pytorch版本,文章链接:https://blog.csdn.net/hhhh

3D深度相机---结构光

去年的仪器仪表的课有汇报,我还专门为3D深度像机做了个调研,一直用inter realsense的,最近老师让看结构光方案的,正好总结一下。由于基于双目立体视觉的深度相机对环境光照强度比较敏感,且比较依赖图像本身的特征,因此在光照不足、缺乏纹理等情况下很难提取到有效鲁棒的特征,从而导致匹配误差增大甚

关于yolov8一些训练的情况

1、使用yolov8s训练(2000轮,真就一直训到了2000轮,不会象是yolov5一样收敛了就不训了)第一次map50=0.915,第一次训练依旧是2000轮,依旧是训练跑完2000轮了,map=0.91,map相差了0.5个点。(训练结果被我删除了,因为上面那个错误,然后我把run文件夹全部删

DDPG 代码调试问题

DDPG的一些问题整理:包括多维动作ddpg,ddpg取边界值,动作加约束的问题,尤其是添加动作约束后网络参数梯度为None这一块,很少有文章结合DDPG网络具体讲,因此把我的解决过程记录下来

OpenCV实战(17)——FAST特征点检测

Harris 算子根据两个垂直方向上的强度变化率给出了角点(或更一般地说,兴趣点)的数学定义。但使用这种定义需要计算图像导数,计算代价较为高昂,特别是兴趣点检测通常只是更复杂算法的先决步骤。在本中,我们将学习另一个特征点检测算子 FAST (Features from Accelerated Seg

SeAFusion:首个结合高级视觉任务的图像融合框架

在SeAFusion发表之前,关于图像融合的研究一直在魔改网络,设计loss function, 调整学习范式中徘徊,SeAFusion给与了我们新的启发,即联系高级视觉任务来研究图像融合。尽管SeAFusion的方法设计还比较简单,但是这也给了我们更多的优化空间。此外之前感觉大家觉得红外和可见光图

深度学习常用的backbone有哪些

深度学习中常用的backbone有resnet系列(resnet的各种变体)、NAS网络系列(RegNet)、Mobilenet系列、Darknet系列、HRNet系列、Transformer系列和ConvNet。

人工智能学习——神经网络(matlab+python实现)

神经网络文章目录神经网络前言一、神经网络理论知识二、matlab实现神经网络1.引入库2.读入数据三、python实现神经网络1.引入库总结前言此文章仅作为个人学习笔记使用,主要介绍理论以及学习过程,仅供参考!一、神经网络理论知识示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据

【ChatGPT】ChatGPT 能否取代程序员?

ChatGPT能否取代程序员

Prompt Learning详解

现阶段NLP最火的两个idea 一个是对比学习(contrastive learning) 另一个就是 promptprompt 说简单也很简单 看了几篇论文之后发现其实就是构建一个语言模板 但是仔细想想又觉得复杂 总感觉里面还有很多细节 因此我想从头到尾梳理一下prompt 很多地方会把它翻译成[

超分之EDSR

这篇文章是SRResnet的升级版——EDSR,其对网络结构进行了优化(去除了BN层),省下来的空间可以用于提升模型的size来增强表现力。此外,作者提出了一种基于EDSR且适用于多缩放尺度的超分结构——MDSR。EDSR在2017年赢得了NTIRE2017超分辨率挑战赛的冠军。参考目录:①深度学习

CVAT——计算机视觉标注工具

CVAT 是用于计算机视觉的强大、有效、免费、在线、交互式视频和图像注释工具

如何使用Docker搭建PhotoPrism - 打造基于AI私有化的个人相册系统

PhotoPrism® 是一款由人工智能驱动的应用程序,用于浏览、组织和分享您的照片集。它利用最新技术自动标记和查找图片。您可以在家里、私人服务器或云端运行它。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kFAsGCtD-1668649131006)(https:/

准确率、精确率、召回率、F1-score

追求召回率高,则通常会影响精确率。F1值为算数平均数除以几何平均数,且越大越好,将Precision和Recall的上述公式带入会发现,当F1值小时,True Positive相对增加,而false相对减少,即Precision和Recall都相对增加,即F1对Precision和Recall都进行