SKnet论文解读

本文讲述sknet的核心部分:自适应性的注意力编码机制SKNet对不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应的对输出进行处理注:本人才疏学浅,文章难免有疏漏之处,仅给初学者阅读交流,大牛轻喷.开始之前的题外话 说来也算有趣,最近读了几个关于CV领域的paper,有的号称其id

【自然语言处理】从词袋模型到Transformer家族的变迁之路

本文简要介绍了 BOW、TF-IDF、Word2Vec、Transformer、BERT、GPT、RoBERTa、 XLM、Reformer、ELECTRA、T5 等模型。

LLaMA:7B参数量的Baby版ChatGPT窥探

本文通过造一些prompt初步窥探了7B版本的LLaMA,所生成的结果比较依赖于prompt的质量,有资源可以尝试65B参数量的版本。

yolo-pose环境搭建及训练和测试

扔掉学术偏见,拥抱工程化的Yolo。由于一直没有使用过yolo,因此本文旨在从0基础配置yolo环境并训练和测试。论文地址代码地址有问题欢迎+vx: wulele2541612007,后续有空会出yolo-pose的源码解读,敬请期待。......

ChatGPT开源平替——OpenChatKit(前OpenAI团队打造)

OpenChatKit是一个由前OpenAI研究员共同打造的开源聊天机器人平台。它包含了训练好的大型语言模型、定制配方和可扩展的检索系统,可以帮助用户快速构建高精度、多功能的聊天机器人应用。其中,最核心的组件是一个经过微调的、具有200亿参数的语言模型——GPT-NeoXT-Chat-Base-20

GPT-4:关于下一代人工智能模型的事实、谣言和期望

在深入细节之前,有必要描述一下 GPT 是什么。GPT(生成式预训练转换器)是一种文本生成 AI 模型,根据互联网上可用的数据进行训练。GPT 旨在生成类似人类的文本。将 GPT 视为按需智能。您可以在需要解决通常需要人工参与的问题时使用它。GPT模型的应用是无穷无尽的。它可以用于问答、文本摘要、翻

【半监督医学图像分割 2023 CVPR】UCMT 论文翻译

高质量的伪标签对于半监督语义分割是必不可少的。一致性正则化和基于伪标记的半监督方法利用来自多视图输入的伪标记进行协同训练。然而,这种协同训练模型往往在训练过程中早期收敛到一致,从而导致模型退化到自我训练模型。另外,多视点输入是通过对原始图像的扰动或增强而产生的,这不可避免地会在输入中引入噪声,导致低

Intel Realsense D435i各类标定教程

  在之前的实验中用到了realsense-D435i,为了提高精度使用之前必须要进行标定。本篇文章就介绍下各类标定方法。因为我最终的目的是完成IMU和双目的联合标定,整个流程都是围绕整个目的展开的。过程中包括:RGB标定、单目标定、IMU标定、双目标定、IMU-双目标定  标定使用了kalibr标

vision transformer的位置编码总结

视觉transformer位置编码

爱因斯坦求和约定 含代码einsum

爱因斯坦求和约定(Einstein summation convention)是一种标记的约定, 又称为爱因斯坦标记法(Einstein notation), 可以基于一些约定简写格式表示多维线性代数数组操作,让表达式更加简洁明了。

一文弄懂什么是对比学习(Contrastive Learning)

有的paper将对比学习称为自监督学习(Self-supervised learning),有的将其称为无监督学习(Unsupervised Learning , UL)。自监督学习是无监督学习的一种形式。自监督学习(Self-supervised learning)可以避免对数据集进行大量的标签标

三维重建(知识点详细解读、主要流程)

基于本人大创项目所学习三维建模过程的笔记。1.概念:三维重建是指对三维物体建立适合计算机表示和处理的数学模型,是在计算机环境下对其进行处理、操作和分析其性质的基础,也是在计算机中建立表达客观世界的虚拟现实的关键技术。2.三维重建的分类:根据采集设备是否主动发射测量信号,分为两类:基于主动视觉理论和基

机器学习、深度学习、神经网络还傻傻分不清吗?

目录一.人工智能、机器学习、深度学习、神经网络是什么二.机器学习的分类一.人工智能、机器学习、深度学习、神经网络是什么 简单来说,人工智能的概念是最大最空的;机器学习其次,它是实现人工智能的一个重要途径;深度学习是机器学习中的一类方法,而深度学习是从神经网络基础上发展得到的,核心还是人工神经网

【语义分割】类别不平衡损失函数合集

在语义分割领域,我们会常常遇到类别不平衡的问题。比如要分割的目标(前景)可能只占图像的一小部分,因此负样本的比重很大,导致网络倾向于将所有样本判断为负样本。本文介绍了在数据不平衡时常用的一些损失函数。类别不平衡会出现什么问题呢?假设我们需要训练一个分类器来对黄豆和绿豆分类,用100颗豆子训练分类器,

硬刚ChatGPT!文心一言能否为百度止颓?中国版ChatGPT“狂飙”的机会在哪儿?

百度在搜索、人工智能领域深耕20多年。基于搜索引擎,演化出语音、图像、知识图谱、自然语言处理等人工智能技术。百度在人工智能的四层架构中,有全栈布局,包括底层芯片、飞桨深度学习框架、文心大模型以及最上层的搜索等应用。文心一言技术,位于模型层。[1],您的支持是我坚持写作最大的动力。

YOLOv5全面解析教程⑥:模型训练流程详解

欢迎Star、试用One-YOLOv5:https://github.com/Oneflow-Inc/one-yolov51结构项目预览2安装gitclonehttps://github.com/Oneflow-Inc/one-yolov5#clonecdone-yolov5pipinstall-r

小目标检测方法总结

小目标检测,切图拼图,SNIPER

Anconda虚拟环境创建及pytorch的安装步骤

Anconda虚拟环境创建及pytorch的安装步骤,包括conda install pytorch,torchvision,torchaudio,cudatoolkit。

本手、妙手、俗手?我用AI写2022高考全国作文题,会被看出来?

自然语言处理是人工智能领域的前沿学科和热点方向,本文试着用NLP文章生成模型写了2022年高考作文题,有点意思

保姆级深度学习环境搭建(亲测避坑)

踩坑结束,大家可以躺平了