MAE:视觉自监督2021(原理+代码)

MAE论文「Masked Autoencoders Are Scalable Vision Learners」证明了 masked autoencoders(MAE) 是一种可扩展的计算机视觉自监督学习方法。遮住95%的像素后,仍能还原出物体的轮廓,效果如图:本文提出了一种掩膜自编码器 (MAE)架

详解机器人标定

这里是机器人在取料之前,先把自己的角度补正到与 物料当前角度一致,到(X’,Y’)位置处,然后移动 CDx,Cdy,与物料位置也重合,然后去取料。可以使用实物标定,机器人抓住工件摆放9个位置,得到9个机械坐标,相机也得到9个像素坐标,(机器人每次需要回到固定位置拍照),然后标定。(X0,Y0)为旋转

【OpenCV】红绿灯识别 轮廓识别 C++ OpenCV 案例实现

本文以实现行车过程当中的红绿灯识别为目标,核心的内容包括:OpenCV轮廓识别原理以及OpenCV红绿灯识别的实现具体步骤

语义分割系列25-BiSeNetV2(pytorch实现)

本文介绍了BiSeNetV2的论文思路和模型结构,给出了BiSeNetv2的模型代码实现,在Camvid数据集上进行测试,所有代码都基于pytorch框架。

机器学习线性回归——实验报告

机器学习实验报告3:线性回归

用PyTorch构建基于卷积神经网络的手写数字识别模型

MINST数据库是机器学习领域非常经典的一个数据集,其由Yann提供的手写数字数据集构成,包含了0-9共10类手写数字图片,每张图片都做了尺寸归一化,都是28x28大小的灰度图。每张图片中像素值大小在0-255之间,其中0是黑色背景,255是白色前景。

人工智能的发展史

人工智能经过 60 多年的发展已取得了重大进展,但总体上还处于初级阶段;它既具有巨大的理论与技术创新空间,也具有广阔的应用前景;中国目前已经处列全球人工智能开发第一梯队,假以时日定能在这一领域独领风骚!......

【数据挖掘实战】——基于水色图像的水质评价(LM神经网络和决策树)

背景和挖掘目标1、问题背景从事渔业生产有经验的从业者可通过观察水色变化调控水质,用来维持养殖水体生态系统中浮游植物、微生物类、浮游动物等合理的动态平衡。由于这些多是通过经验和肉眼观察进行判断,存在主观性引起的观察性偏倚,使观察结果的可比性、可重复性降低,不易推广应用。当前,数字图像处理技术为计算机监

基于Pytorch的可视化工具

通过文本输出myConvNet网络的网络结构得到上面的输出结果,但这并不容易让读者理解在网络中层与层之间的连接方式,所以需要将PyTorch搭建的深度学习网络进行可视化,通过图像来帮助读者理解网络层与层之间的连接方式。而网络训练过程的可视化,通常用于监督网络的训练过程或呈现网络的训练效果。当使用Py

OpenCV实战(15)——轮廓检测详解

在计算机视觉领域,轮廓通常指图像中对象边界的一系列点。因此,轮廓通常描述了对象边界的关键信息,包含了有关对象形状的主要信息,该信息可用于形状分析与对象检测和识别。本节中,我们首先介绍如何提取图像中轮廓,然后讲解如何计算轮廓的形状描述符。

MobileViT模型简介

自从2010年ViT(Vision Transformer)模型的横空出世,人们发现了Transformer架构在视觉领域的巨大潜力。近些年,越来越多的科研人员投入Transformer的怀抱,视觉领域的各项任务也不断被Transformer架构模型刷新。Transformer虽然强大,但在现在看来

计算机视觉教程0-3:为何拍照会有死亡视角?详解相机矩阵与畸变

拍照死亡角度一般指的是将自己脸盆子拍得特别大,拍出用鼻孔看人的狰狞面目,因此部分美颜软件里人像修正中会有“去畸变”这一项功能。本文就从计算机视觉的角度谈一谈镜头畸变原理。

torch.optim.Adam() 函数用法

Adam是通过梯度的一阶矩和二阶矩自适应的控制每个参数的学习率的大小。

实战YOLO V5推演(TensorRT版本 C++)

python不好用么,为什么还要转C++;yolov5的export.py 已经实现在python端的模型转化了啊?不需要c++的可以看这个《【深度学习】目标检测 yolov5模型量化安装教程以及转ONXX,torchscript,engine和速度比较一栏表》C++的学习曲线那么陡峭,性能在服务器

深度学习之文本分类总结

一、文本分类概况二、文本分类的发展三、文本分类常用的模型结构四、文本分类模型实际中遇到的问题(Q&A)

不写代码、年薪百万,带你玩赚ChatGPT提示工程-介绍

随着ChatGPT的大火,提示工程在大模型中的重要性不言而喻,本文参考国外完成国内中文版本的《提示工程指南》,希望能够和大家一起交流,分享及发现提示工程的美妙之处。文章所有内容可以在中找到。本文主要介绍了提示工程的一些基本示例,下一章会介绍一些基本的提示。

什么是AI预训练模型?

预训练 AI 模型是一种深度学习模型,在大型数据集上进行训练以完成特定任务,它可以按原样使用或定制以满足多个行业的应用需求。想象一下,试图教一个蹒跚学步的孩子什么是独角兽。一个好的起点可能是展示该生物的子图像并描述其独特的特征。现在想象一下,试图教人工智能机器什么是独角兽。从哪里开始呢?预训练的 A

双重差分法(DID):标准化流程和stata代码实现

双重差分法(DID):标准化流程和stata代码实现

YOLOV5+deepsort+rknn(rk3588进行实时目标跟踪)

rk3588的目标检测+目标跟踪

如何提高bp神经网络精度,改进bp神经网络的方案

人工神经网络,是一种旨在模仿人脑结构及其功能的信息处理系统,就是使用人工神经网络方法实现模式识别.可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题,神经网络方法允许样品有较大的缺损和畸变.神经网络的类型很多,建立神经网络模型时,根据研究对象的特点,可以考虑不同的神经网络模型. 前馈型