手把手教你进行安全帽的佩戴检测(附数据集+代码演示+实验结果)
一起来进行安全帽的佩戴检测
GELU激活函数
GELU激活函数简介
AI画图 Disco-diffusion 本地搭建测试
Disco Diffusion图像生成网络,输入文字输出美图。
Torchtext快速入门(一)——Vocab
深入解读torchtext.vocab.Vocab
(Note)优化器Adam的学习率设置
从统计的角度看,Adam的自适应原理也是根据统计对梯度进行修正,但依然离不开前面设置的学习率。如果学习率设置的过大,则会导致模型发散,造成收敛较慢或陷入局部最小值点,因为过大的学习率会在优化过程中跳过最优解或次优解。同时神经网络的损失函数基本不是凸函数,而梯度下降法这些优化方法主要针对的是凸函数,所
face_recognition库的使用
face_recognition库基于dlib的使用,包含dlib的安装,及face_recognition库各个方法的使用
人工智能前沿——深度学习热门领域(确定选题及研究方向)
人工智能前沿——深度学习热门领域(确定选题及研究方向)
[YOLOv7/YOLOv5系列算法改进NO.15]网络轻量化方法深度可分离卷积
前 言:作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv5的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效
【Timm】create_model所提供的ViT模型概览
【Timm】create_model所提供的ViT模型概览,⚪结合vision transformer理解
Kaggle,上传,GPU,下载
Kaggle的基本使用
传统目标跟踪——光流法
简单来说,光流就是瞬时速度,在时间间隔很小时,也等同于目标的位移,光流场是灰度图像的二维矢量场,它反映了图像上像素的变化趋势,可看成是带有灰度的像素点在图像平面上运动而产生的瞬时速度场,它包含的信息即是各像素点的瞬时运动速度矢量信息,既可以表现为物体运动的运动方向也可表现为物体运动的速率。为了避免大
MobileNet系列论文
传统CNN,内存需求量大、运算量大,导致无法在移动设备以及嵌入式设备上运行。MobileNet是Google团队在2017年提出,专注于移动端或者嵌入式设备中的轻量级CNN网络。相比于传统的CNN,在准确率下幅度下降的前提下大大减少了模型参数与运算量。(相比于VGG16准确率下降了0.9%,但模型参
池化(Pooling)
在图像处理中,由于图像中存在较多冗余信息,可用某一区域子块的统计信息(如最大值或均值等)来刻画该区域中所有像素点呈现的空间分布模式,以替代区域子块中所有像素点取值,这就是卷积神经网络中池化(pooling)操作。池化操作对卷积结果特征图进行约减,实现了下采样,同时保留了特征图中主要信息。比如:当识别
【深度学习】损失函数详解
损失函数
grad-cam实现可视化|mmselfsup自监督|保姆级教学
Grad-CAM是使用任何目标概念的梯度(比如分类类别中的某一类的logits,甚至是caption任务中的输出),流入最后的卷积层,生成一个粗略的定位图来突出显示图像中用于预测的重要区域。
Deep SDF 、NeuS学习
Deep SDF NeuS学习
语义分割中图片和mask的可视化
其实取标题一直以来都是一件麻烦的事,但是如果你要看下去,我想你得有一点语义分割的见解。用平常的语言描述该问题就是:语义分割出我们感兴趣的目标物,然后输出该目标物的轮廓点。做语义分割其实有很多种方法,你可以用不同的模型去train你的dataset,但是刚接触语义分割的朋友们可能会说,我该怎么分割出我
最优模型选择的准则:AIC、BIC准则
最优模型选择的标准
【深度学习模型】ChatGPT原理简述
OpenAI推出人工智能聊天模型ChatGPT,很快引起百万用户注册使用,公众号和热搜不断,迅速火出圈,甚至引起各大公司在聊天对话机器人上的军备竞赛。
机器学习论文源代码浅读:Autoformer
原本想要和之前一样写作“代码复现”,然而由于本人一开始对于Autoformer能力理解有限,参考了一定的论文中的源代码,写着写着就发现自己的代码是“加了注释版本”的源代码,故而只能是源代码的浅读,而非复现。