深度学习网络各种激活函数 Sigmoid、Tanh、ReLU、Leaky_ReLU、SiLU、Mish

激活函数的目的就是:梯度为0, 无法反向传播,导致参数得不到更新:随着数据的变化,梯度没有明显变化:梯度越来越大,无法收敛梯度消失问题:1、反向传播链路过长,累积后逐渐减小2、数据进入梯度饱和区如何解决:1、选正确激活函数,relu, silu2、BN 归一化数据3、 resnet 较短反向传播路径

全面解析PaDiM

使用PaDiM网络跑自己的数据集,除去测试时读入dataloader的时间,每张图片测试时间在20-30ms,精度比较高,图像分类准确率99-100,像素分割准确率97以上,但是最大的问题是需要通过分割好的label来确定阈值选取(这一点必定要改过来)。for循环内的二次for循环:在tqdm的fo

YOLOv7中的数据集处理【代码分析】

本文章主要是针对yolov7中数据集处理部分代码进行解析(和yolov5是一样的),也是可以更好的理解训练中送入的数据集到底是什么样子的。数据集的处理离不开两个类,(from torch.utils.data.dataloader import DataLoader),不论什么样的算法,在处理数据集

Stable Diffusion 个人推荐的各种模型及设置参数、扩展应用等合集(不断更新中)

stable diffusion 所用的各种模型及参数设置,扩展安装等,陆续更新

Transformer前沿——语义分割

Transformer在语义分割领域的发展

openAI API简易使用教程

openAI提供了几种不同场景的模型,主要有text completion、code completion、chat completion、image completion,例如chat completion,则调用方式为。而且请求的token和回复的token数会被加一起计费,例如说输入了10个t

AI时代来临,如何把握住文档处理及数据分析的机遇

在3月18日,由中国图象图形协会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG图像图形企业行”活动将正式举办,特邀来自上海交大、厦门大学、复旦、中科大的顶尖学府的学者与合合信息技术团队一道,以直播的形式分享文档处理实践经验及NLP发展趋势,探讨ChatGPT与文

【ROS2&AI】电脑摄像头、intel-D435,利用ros2发布订阅图像(Python)

配置:Python、ROS2、opencv、Ubuntu。利用电脑相机或D435相机联合ROS2进行图像的发布与订阅。与传统的传输列表、字符串msg不同(定义消息类型直接发送即可),利用ros2传输图像需要把图像frame转为image类型的msg。流程如下:opencv或者realsense获取得

【数据挖掘实战】——家用电器用户行为分析及事件识别(BP神经网络)

构建用水事件行为识别模型1、洗浴识别模型根据建模样本数据和用户记录的包含用水的用途、用水开始时间、用水结束时间等属性的用水日志,建立BP神经网络模型识别洗浴事件。

CiteSpace的介绍、重要调整参数及其重要术语

被引次数在我们进行文献分析的时候,被引次数不仅仅指的是每个文献的被引次数,它还指研究作者的被引次数,CiteSpace的一个原理性的解释,是把每个文献或者说每个作者当做是一个节点来看待,它每个节点之间的关联和它每个节点特征,主要的一个参数就是citation,它的被引次数。它这个数值的作用是什么?我

如何使用labelImg标注数据集,最详细的深度学习标签教程

深度学习中,做监督学习时需要标注好的数据集。一种利用现成的数据集:比如mnist手写体、ImageNet、COCO、PASCAL VOC、OpenImage等数据集;还有就是我们可以手动标注的数据集。下面教大家如何使用labelImg库来手动标注Dataset。1、打开anaconda命令行界面,如

一文讲解thop库计算FLOPs问题

计算模型的FLOPs及参数大小FLOPS是处理器性能的衡量指标,是“每秒所执行的浮点运算次数”的缩写。FLOPs是算法复杂度的衡量指标,是“浮点运算次数”的缩写,s代表的是复数。一般使用thop库来计算,GitHub:但官网的Readme中详细写出了是用来计算MACs,而不是FLOPs的MACs(M

损失函数InfoNCE loss和cross entropy loss以及温度系数

唯一的区别是, 在cross entropy loss里, 指代的是数据集里类别的数量, 而在对比学习InfoNCE loss里, 这个k指的是负样本的数量。一般来说,负样本选取的越多,就越接近整个数据集,效果自然会更好。Info NCE loss是NCE的一个简单变体,它认为如果你只把问题看作是

UNet - unet网络

Unet网络是医学图像分割领域常用的分割网络,因为网络的结构很像个U,所以称为UnetUnet 网络是针对像素点的分类,之前介绍的LeNet、ResNet等等都是图像分类,最后分的是整幅图像的类别,而Unet是对像素点输出的是前景还是背景的分类注:因为Unet 具体的网络框架均有所不同,例如有的连续

西恩科技更新招股书:IPO前大手笔分红“套现”, 赵志安为实控人

就产品类型来看,西恩科技的收入主要由硫酸镍、三元前驱体、碳酸锂等贡献,其中硫酸镍的占比最高。报告期内,西恩科技来自硫酸镍的收入分别为3.83亿元、4.33亿元、7.47亿元和4.98亿元,占主营业务收入的比例分别为80.19%、57.10%、49.22%和46.60%。报告期内,西恩科技的前五大客户

Cartographer算法2D激光雷达与IMU融合建图

上一篇文章讲了cartographer算法手持雷达建图的参数调试,这篇进一步讲如何融合2D雷达与IMU采用cartographer算法进行slam建图。cartographer算法手持二维激光雷达建图(不使用里程计及IMU)

【深度学习】生成模型:VAE(自编码器)模型解析

本文为自己自学内容的记录,其中多有借鉴别人博客的地方,一并在在参考文献中给出链接,其中大部分截图来自李宏毅深度学习PPT课件。本文前置知识高斯混合模型和EM算法,如果不了解这两种算法直接看VAE模型会有理解上的障碍。其实那么多数学公式推导,我自己都有点晕,但是本质上就是用自编码器去产生很多高斯分布,

yolo车牌识别、车辆识别、行人识别、车距识别源码(包含单目双目)

车牌内容识别时,通过计算候选车牌区域蓝色数值(均值)的最大值,确定最终的车牌区域。对于选定的车牌轮廓,首先进行粗定位,即对车牌进行左右边界回归处理,去除车牌两边多余的部分,然后进行精定位,即将车牌送入 CRNN 网络进行字符识别,利用左右边界回归模型,预测出车牌的左右边框,进一步裁剪,进行精定位。车

[HyperGraph专题]HGNN+:General Hypergraph Neural Networks

最近在做和超图相关的工作,自己主要偏编码的工作,但在敲代码和参考其他现有超图库的过程中发现了一个叫DeepHypergrah的库,里面涉及了很多和深度学习相关的内容,用到了pytorch、scipy、numpy之类啥啥啥,看的我一头雾水,想起之前给自己定了一个学习pytorch这一工具的目标,现在终

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈