快速制作自己的VOC语义分割数据集
PASCAL VOC2012是语义分割任务极为重要的官方数据集,大量优秀的语义分割模型都会刷一下这个数据集,因此我们在使用别人的开源代码时,如果能将自己的数据集整理成官方数据集的格式,则可快速验证模型性能,减少自身工作量。
YOLOv5 CPU和GPU环境搭建(道路识别)
YOLOv5 CPU和GPU环境搭建(道路识别)
Pytorch中loss.backward()和torch.autograd.grad的使用和区别(通俗易懂)
Pytorch中loss.backward()和torch.autograd.grad的使用和区别(通俗易懂)
手把手教你百度飞桨PP-YOLOE部署到瑞芯微RK3588
手把手教你百度飞桨PP-YOLOE部署到瑞芯微RK3588
运用VGG16神经网络进行花朵识别
把数据集的照片进行处理得到向量,花种类名称写入文件class_indices.json中,确定batch_size = 8,运用模型进行训练,反向传播计算梯度,不断更新权重,最终计算损失函数,保存损失最小的模型权重,到vgg16Net.pth文件中。根据vgg16模型建立,在model.py文件中实
训练NeRF模型的几个建议
如何快速训练处一个理想效果的NeRF, instant-ngp给了一些提示
【记录】torch.nn.CrossEntropyLoss报错及解决
不然softmax无法计算,及model的output channel = class number。假设传入torch.nn.CrossEntropyLoss的参数为。根据官网文档,如果直接使用class进行分类,pred的维度应该是。注意在网络输出的channel中加入。,label的维度应该是
【实战篇】是时候彻底弄懂BERT模型了(收藏)
如何弄懂BERT模型,当然是理论+实战了。本文就告诉大家如何实战BERT模型。
深度学习之concatenate和elementwise操作(二)
一、深度学习里面的element-wise特征相乘和相加到底有什么区别?很多深度学习模型在设计时,中间特征在分支处理后,然后可能会采用element-wise相乘或相加,不知道这个乘和加的细微区别?答:相加的两个tensor通常都是具有特征意义的tensor,相乘的话,一般来说,其中一个tensor
手把手教你进行安全帽的佩戴检测(附数据集+代码演示+实验结果)
一起来进行安全帽的佩戴检测
GELU激活函数
GELU激活函数简介
AI画图 Disco-diffusion 本地搭建测试
Disco Diffusion图像生成网络,输入文字输出美图。
Torchtext快速入门(一)——Vocab
深入解读torchtext.vocab.Vocab
(Note)优化器Adam的学习率设置
从统计的角度看,Adam的自适应原理也是根据统计对梯度进行修正,但依然离不开前面设置的学习率。如果学习率设置的过大,则会导致模型发散,造成收敛较慢或陷入局部最小值点,因为过大的学习率会在优化过程中跳过最优解或次优解。同时神经网络的损失函数基本不是凸函数,而梯度下降法这些优化方法主要针对的是凸函数,所
face_recognition库的使用
face_recognition库基于dlib的使用,包含dlib的安装,及face_recognition库各个方法的使用
人工智能前沿——深度学习热门领域(确定选题及研究方向)
人工智能前沿——深度学习热门领域(确定选题及研究方向)
[YOLOv7/YOLOv5系列算法改进NO.15]网络轻量化方法深度可分离卷积
前 言:作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv5的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效
【Timm】create_model所提供的ViT模型概览
【Timm】create_model所提供的ViT模型概览,⚪结合vision transformer理解
Kaggle,上传,GPU,下载
Kaggle的基本使用
传统目标跟踪——光流法
简单来说,光流就是瞬时速度,在时间间隔很小时,也等同于目标的位移,光流场是灰度图像的二维矢量场,它反映了图像上像素的变化趋势,可看成是带有灰度的像素点在图像平面上运动而产生的瞬时速度场,它包含的信息即是各像素点的瞬时运动速度矢量信息,既可以表现为物体运动的运动方向也可表现为物体运动的速率。为了避免大