zero-shot, one-shot和few-shot

zero-shot, one-shot和few-shot

BartModel 源码解析

BartModel的代码真的有太多的坑了

基于PyTorch实现图像去模糊任务详细教程代码+数据

基于PyTorch实现图像去模糊任务详细教程代码+数据

改进YOLOv5系列:9.BoTNet Transformer结构的修改

目标检测小白科研Trick改进推荐 | 包括Backbone、Neck、Head、注意力机制、IoU损失函数、NMS、Loss计算方式、自注意力机制、数据增强部分、激活函数

翻译: 详细图解Transformer多头自注意力机制 Attention Is All You Need

它们是用于计算和思考注意力的抽象概念。一旦你继续阅读下面的注意力是如何计算的,你就会知道几乎所有你需要知道的关于每个向量所扮演的角色。计算self-attention的第二步是计算一个分数。假设我们正在计算本例中第一个单词“Thinking”的自注意力。我们需要根据这个词对输入句子的每个词进行评分。

【代码解读】超详细,YOLOV5之build_targets函数解读。

超详细,yolov5之build_targets函数解读

yolov7损失函数源码解析(一句一句解析,)

自己做的笔记而已,仅供参考。

通过公式和源码解析 DETR 中的损失函数 & 匈牙利算法(二分图匹配)

DETR在单次通过解码器时推断一个固定大小的有N个预测的集合,其中N被设置为显著大于图像中典型的物体数量。所有真实框中的每一个框和所有预测框进行匹配,损失值最小的预测框为该真实框的最佳匹配框,当所有真实框遍历完毕后,得到所有唯一匹配的框。完成最优分配,假设有六位老师和六种课程,通过匈牙利算法进行匹配

知识蒸馏算法和代码(Pytorch)笔记分享,一个必须要了解的算法

知识蒸馏算法和代码(Pytorch)笔记分享,一个必须要了解的算法

【论文笔记】—低照度图像增强—Supervised—RetinexNet—2018-BMVC

​【题目】:Deep retinex decomposition for low-light enhancement 本文提出用自己制作的弱光/正常光图像对的弱光数据集LOL数据集,利用Retinex理论中的不同光照下的图片反射率是相同的这一特点让其共享反射率,通过一个分解网络和一个增强网络对低照度

bert-bilstm-crf提升NER模型效果的方法

在使用bert或者其它预训练模型进行微调,下接其它具体任务相关的模块时,会面临这样一个问题,bert由于已经进行了预训练,参数已经达到了一个较好的水平,如果要保持其不会降低,学习率就不能太大,而下接结构是从零开始训练,用小的学习率训练不仅学习慢,而且也很难与BERT本体训练同步。如果学习率过小,梯度

MMdetection之train.py源码详解

目录一、tools/train.py二、源码详解三、核心函数详解(一)build_detector(mmdet/models/builder.py)(二)build_dataset(mmdet/datasets/builder)(三)train_detector(mmdet/apis/train.p

深度学习之GPU显存与利用率 浅析小结

首先就一笔带过说一下GPU的重要性吧,以Pytorch为例,就是使用CUDA,cuDNN对深度学习的模型推理时执行的各种计算转换为矩阵乘法进行加速,来达到从猴年马月的运行,到现在几十成百倍的提速。至于我们爱之深恨之切的显存呢,以数据读取时GPU运行内存的变化作为参考,具体实现机制一般是通过worke

优化器(Optimizer)(SGD、Momentum、AdaGrad、RMSProp、Adam)

文章目录3.1、传统梯度优化的不足(BGD,SGD,MBGD)3.1.1 一维梯度下降3.1.2 多维梯度下降3.2、动量(Momentum)3.3、AdaGrad算法3.4、RMSProp算法3.5、Adam算法优化器在机器学习、深度学习中往往起着举足轻重的作用,同一个模型,因选择不同的优化器,性

深度学习知识点简单概述【更新中】

人工神经网络(英语:Artificial Neural Network,ANN),简称神经网络(Neural Network,NN)或类神经网络,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型,用于对函数进行估计或近似。ps:和其他机器学习方法一样,神经网络已经被用于

深度学习面试基础--BN层

深度学习中BN层的相关介绍

【GPT4】GPT4 官方报告解读

【GPT-4 】官方[研究进展]、[技术报告]全面解读。综合性能,图像输入,私人定制,事实判断的局限性,风险与应对,模型训练过程,用户政策和价格,API 使用。GPT-4 是 OpenAI 在深度学习领域的最新里程碑。GPT-4 是一个大型多模态模型,可以接受图像和文本输入,发出文本输出。虽然 GP

简单粗暴提升yolov5小目标检测能力

和yolov5最开始做的focus是类似的,对于输入的特征图(长宽为S),从左到右以及从上到下每scale个像素采样一次,假设scale=2,采样方式就和上图一样,经过这样采样的输出长宽就是S/2,最后将采样后的输出进行concatenate,通道数就是scale的平方,即4。左侧是yolov5原始

【跟着ChatGPT学深度学习】ChatGPT带我入门深度学习

跟着ChatGPT学深度学习第一弹,入门深度学习。本次ChatGPT老师共教我三个知识点,分别是深度学习基础、深度学习的学习资源和深度学习需要掌握的技能和知识。最后,ChatGPT老师还贴心地给深度学习新手和老手总结了一些学习建议。