AI上推荐 之 多任务loss优化(自适应权重篇)
1. 写在前面在多任务学习中,往往会将多个相关的任务放在一起来学习。例如在推荐系统中,排序模型同时预估候选的点击率和浏览时间。相对于单任务学习,多任务学习有以下优势:多个任务共享一个模型,占用内存量减少;多个任务一次前向计算得出结果,推理速度增加;关联任务通过共享信息,相互补充,可以提升彼此的表现。
曙光云使用说明
国产GPU平台探索使用
CiteSpace的介绍、重要调整参数及其重要术语
被引次数在我们进行文献分析的时候,被引次数不仅仅指的是每个文献的被引次数,它还指研究作者的被引次数,CiteSpace的一个原理性的解释,是把每个文献或者说每个作者当做是一个节点来看待,它每个节点之间的关联和它每个节点特征,主要的一个参数就是citation,它的被引次数。它这个数值的作用是什么?我
如何使用labelImg标注数据集,最详细的深度学习标签教程
深度学习中,做监督学习时需要标注好的数据集。一种利用现成的数据集:比如mnist手写体、ImageNet、COCO、PASCAL VOC、OpenImage等数据集;还有就是我们可以手动标注的数据集。下面教大家如何使用labelImg库来手动标注Dataset。1、打开anaconda命令行界面,如
一文讲解thop库计算FLOPs问题
计算模型的FLOPs及参数大小FLOPS是处理器性能的衡量指标,是“每秒所执行的浮点运算次数”的缩写。FLOPs是算法复杂度的衡量指标,是“浮点运算次数”的缩写,s代表的是复数。一般使用thop库来计算,GitHub:但官网的Readme中详细写出了是用来计算MACs,而不是FLOPs的MACs(M
损失函数InfoNCE loss和cross entropy loss以及温度系数
唯一的区别是, 在cross entropy loss里, 指代的是数据集里类别的数量, 而在对比学习InfoNCE loss里, 这个k指的是负样本的数量。一般来说,负样本选取的越多,就越接近整个数据集,效果自然会更好。Info NCE loss是NCE的一个简单变体,它认为如果你只把问题看作是
基于Python实现五大常用分类算法(原理+代码)
编程算法常用
Cartographer算法2D激光雷达与IMU融合建图
上一篇文章讲了cartographer算法手持雷达建图的参数调试,这篇进一步讲如何融合2D雷达与IMU采用cartographer算法进行slam建图。cartographer算法手持二维激光雷达建图(不使用里程计及IMU)
【深度学习】生成模型:VAE(自编码器)模型解析
本文为自己自学内容的记录,其中多有借鉴别人博客的地方,一并在在参考文献中给出链接,其中大部分截图来自李宏毅深度学习PPT课件。本文前置知识高斯混合模型和EM算法,如果不了解这两种算法直接看VAE模型会有理解上的障碍。其实那么多数学公式推导,我自己都有点晕,但是本质上就是用自编码器去产生很多高斯分布,
yolo车牌识别、车辆识别、行人识别、车距识别源码(包含单目双目)
车牌内容识别时,通过计算候选车牌区域蓝色数值(均值)的最大值,确定最终的车牌区域。对于选定的车牌轮廓,首先进行粗定位,即对车牌进行左右边界回归处理,去除车牌两边多余的部分,然后进行精定位,即将车牌送入 CRNN 网络进行字符识别,利用左右边界回归模型,预测出车牌的左右边框,进一步裁剪,进行精定位。车
[HyperGraph专题]HGNN+:General Hypergraph Neural Networks
最近在做和超图相关的工作,自己主要偏编码的工作,但在敲代码和参考其他现有超图库的过程中发现了一个叫DeepHypergrah的库,里面涉及了很多和深度学习相关的内容,用到了pytorch、scipy、numpy之类啥啥啥,看的我一头雾水,想起之前给自己定了一个学习pytorch这一工具的目标,现在终
图像风格迁移
风格迁移指的是两个不同域中图像的转换,具体来说就是提供一张风格图像,将任意一张图像转化为这个风格,并尽可能保留原图像的内容
标签平滑(Label Smoothing)详解
标签平滑(Label smoothing),像L1、L2和dropout一样,是机器学习领域的一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地预测标签,改善泛化能力差的问题。
Stata:中介效应理论及sgmediation命令做sobel检验
中介作用的检验模型可以用以下路径图来描述:方程(1)的系数c 为自变量X对因变量Y的总效应;方程(2)的系数a为自变量X对中介变量M的效应;方程(3)的系数b是在控制了自变量X的影响后,中介变量M对因变量Y的效应;方程(3)的系数c′是在控制了中介变量M 的影响后,自变量X对因变量Y的直接效应;系数
傅里叶级数、狄利克雷收敛定理、周期延拓
傅里叶级数狄利克雷收敛定理
openpose的一些个人理解
一直都是在做一些目标检测的研究工作,近期开始看一些有关姿态检测的内容,其中最经典的就是openpose这个框架,后面很多动作识别、姿态检测也大多是在该网络上进行改进,比如Real-time 2D Multi-Person Pose Estimation on CPU 这篇论文,在原OpenPose基
深度学习模型部署全流程-模型部署
基于NCNN的模型部署
基于卷积神经网络CNN的图片分类实现——附代码
使用Matlab自带的深度学习工具箱构建卷积神经网络(CNN)进行图片分类,以识别并分类手写数字为例。首先将大量的图片数据导入;然后给不同种类的图片打上对应的分类的标签,划分为训练集和测试集;构建CNN网络其中包括3层2维卷积和3个池化层,全连接层及分类层;调整好输入输出格式对CNN进行训练及测试;
Lasso回归系列四:Group Lasso,Sparse Group Lasso
Lasso变体:Group Lasso,Sparse Group Lasso
Attention UNet
Attention UNet论文解析 - 知乎Attention UNet论文地址: https://arxiv.org/pdf/1804.03999.pdf 代码地址: https://github.com/ozan-oktay/Attention-Gated-NetworksAttention