transformer - overfit.cn

ViT: Vision transformer的cls token作用？

一文普及ViT: Vision transformer的cls token作用？够全面

overfit同步小助手 2023-03-30 12:01:48 0 收藏

Vision Transformer模型与预训练权重简析

ViT (Vision Transformer) 是首次成功将 Transformer引入到视觉领域的尝试，开辟了视觉Transformer的先河。这里先对ViT的原理进行阐述，并对预训练文件ViT-B_16.npz的内容做一个简要介绍。

overfit同步小助手 2023-03-30 07:02:10 0 收藏

【自然语言处理】从词袋模型到Transformer家族的变迁之路

本文简要介绍了 BOW、TF-IDF、Word2Vec、Transformer、BERT、GPT、RoBERTa、 XLM、Reformer、ELECTRA、T5 等模型。

overfit同步小助手 2023-03-30 07:01:55 0 收藏

vision transformer的位置编码总结

视觉transformer位置编码

overfit同步小助手 2023-03-30 06:02:06 0 收藏

Transformer 优秀开源工作：timm 库 vision transformer 代码解读

timm库（PyTorchImageModels，简称timm）是一个巨大的PyTorch代码集合，已经被官方使用了。

overfit同步小助手 2023-03-30 04:06:14 0 收藏

Transformer结构解析

Transformer模型的结构和计算过程

overfit同步小助手 2023-03-29 18:02:30 0 收藏

长时间预测模型DLinear、NLinear模型（论文解读）

2022年8月时间序列任务SOTA模型DLinear、NLinear模型论文解读

overfit同步小助手 2023-03-29 14:02:00 0 收藏

使用Python Seaborn绘制热力图（heatmap）的时候怎么改变配色

【代码】使用Python Seaborn绘制热力图（heatmap）的时候怎么改变配色。

overfit同步小助手 2023-03-29 11:02:25 0 收藏

Chain of Thought 开山之作论文详解

现在语言模型的规模越来越大，但是即便是现在最大的语言模型，它们也往往很难在涉及到推理方面的任务取得很好的表现，也就是说，他们通常很难在数学，符号，以及常识的推理上取得尚佳的表现这篇文章主要是针对大语言模型在遇到语言推理任务时的局限性，提出了 chain of thought，也就是思维链

overfit同步小助手 2023-03-29 00:02:00 0 收藏

占有统治地位的Transformer究竟是什么

一篇文章弄懂Transformer+项目训练。

overfit同步小助手 2023-03-28 16:01:58 0 收藏

AAAI2023 | DeMT: CNN+Transformer实现多任务学习（分割/深度等）

本文结合了可变形CNN和query-based 的Transformer优点，提出了一种新的MTL模型，用于密集预测的多任务学习，基于简单有效的编码器-解码器架构（即，可变形混合器编码器和任务感知transformer解码器），称之为DeMT。

overfit同步小助手 2023-03-23 21:02:02 0 收藏

学习Transformer：自注意力与多头自注意力的原理及实现

自从Transformer[3]模型在NLP领域问世后，基于Transformer的深度学习模型性能逐渐在NLP和CV领域(Vision Transformer)取得了令人惊叹的提升。本文的主要目的是介绍经典Transformer模型和Vision Transformer的技术细节及基本原理，以方便

overfit同步小助手 2023-03-19 16:01:43 0 收藏

对Transformer中Add&Norm层的理解

首先我们还是先来回顾一下Transformer的结构：Transformer结构主要分为两大部分，一是Encoder层结构，另一个则是Decoder层结构，Encoder 的输入由 Input Embedding 和 Positional Embedding 求和输入Multi-Head-Atten

overfit同步小助手 2023-03-19 13:01:33 0 收藏

Github复现-测试基于transformer的变化检测模型BIT_CD

基于Transformer 的变化检测模型测试

overfit同步小助手 2023-03-13 08:04:11 0 收藏

Transformer与看图说话

Transformer与看图说话

overfit同步小助手 2023-02-18 20:01:59 0 收藏

使用JAX实现完整的Vision Transformer

本文将展示如何使用JAX/Flax实现Vision Transformer (ViT)，以及如何使用JAX/Flax训练ViT。

Deephub 2023-02-06 12:29:15 0 收藏

如何用DETR（detection transformer）训练自己的数据集

DETR(detection transformer)简介DETR是Facebook AI的研究者提出的Transformer的视觉版本，是CNN和transformer的融合，实现了端到端的预测，主要用于目标检测和全景分割。DETR的Github地址：link

overfit同步小助手 2023-01-29 11:01:57 0 收藏

可视化VIT中的注意力

ViT中最主要的就是注意力机制，所以可视化注意力就成为了解ViT的重要步骤，所以我们这里介绍如何可视化ViT中的注意力

Deephub 2023-01-19 08:43:43 0 收藏

Transformer时间序列预测

Transformer时间序列预测

overfit同步小助手 2023-01-13 11:02:16 0 收藏

改进YOLO：YOLOv5结合swin transformer

yolov5改进，添加swing transformer

overfit同步小助手 2023-01-13 11:01:40 0 收藏

7
8
9
10
11
12
13
14
15

登录可以使用的更多功能哦！登录

作者榜

资讯小助手

资讯同步

内容小助手

文章同步

Deephub

公众号：deephub-imba

奕凯

公众号：奕凯的技术栈