10.7. Transformer

transformer的编码器和解码器是基于自注意力的模块叠加而成的,源(输入)序列和目标(输出)序列的嵌入(embedding)表示将加上位置编码(positional encoding),再分别输入到编码器和解码器中。值得注意的是,解码器的自注意力权重和“编码器-解码器”的注意力权重都有相同的查

如何使用GPT2中文闲聊对话系统,机器人对话,自动对话!

每一次运行完一个epoch都会保存到model下面,在预测的时候直接调用model下面最后一个epoch就行,有问题可以发评论,我看见且我看得懂的话就会,哈哈哈httpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttps

【关系抽取】深入浅出讲解实体关系抽取(介绍、常用算法)

关系抽取(Relation Extraction,简称RE)的概念是1988年在MUC大会上提出,是信息抽取的基本任务之一,目的是为了识别出文本实体中的目标关系,是构建知识图谱的重要技术环节。知识图谱是语义关联的实体,它将人们对物理世界的认知转化为计算机能够以结构化的方式理解的语义信息。关系抽取通过

seaborn库学习----分布图displot、histplot、kdeplot、ecdfplot

提供的api说明displotFigure-level interface for drawing distribution plots onto a FacetGrid. 图形级界面,用于在FacetGrid上绘制分布图。histplotPlot univariate or bivariate h

【注意力机制集锦】Channel Attention通道注意力网络结构、源码解读系列一

本文从原文、网络结构、代码实现三个方面系统总结了SENet、SKNET、CBAM三种注意力机制

关于YOLOv7的分析

此篇文章是在7月初编写,可能会与现有的源码有所出入,如在月末增加了关于head部分阴性参数的融合,但总体上的出入并不会太大

VoxCeleb1 数据集下载

VoxCeleb1 是广泛使用的 说话人识别、验证 数据集。由于是从 YouTube 视频中提取,有比较丰富的噪声。(有空补介绍)如果可以使用谷歌表单和翻译软件应该就可以顺利下载,私下分发数据集有侵权风险。官网如下:VoxCelebhttps://www.robots.ox.ac.uk/~vgg/d

YOLOv5-Shufflenetv2

YOLOV5-Shufflenetv2

基于OpenCV构建停车场车位识别项目

OpenCV是一个基于(开源)发行的跨平台计算机视觉库,能实现图像处理和计算机视觉方面的很多通用算法。车位识别的图像处理过程如图所示。在python中设置完所有内容后, 最重要的依赖关系将是OpenCV库。通过pip将其添加到虚拟环境中,可以运行。要检查所有设置是否正确,我们可以使用以下命令打印环境

通过函数seaborn.cubehelix_palette生成顺序调色板

本文主要对seaborn库中的调色板函数cubehelix_palette进行简单说明、函数cubehelix_palette通过cubehelix系统来生成顺序调色板(sequential palette)、且共有九个参数可以调整......

ChatGPT助力校招----面试问题分享(四)

ChatGPT助力校招,面试问题分享

YOLOV5更换轻量级的backbone:mobilenetV2

如何更换YOLOV5的backbone

LIO-SAM学习与运行测试数据集

LIO-SAM学习与运行作者提供的数据集

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

Kaggle机器学习竞赛、托管数据库、编写和分享代码

ST-GCN论文分析

Introduction传统的骨架建模方法通常依赖手工制作的零件或遍历规则,因此表达能力有限,难以推广。新的动态骨架模型。通过自动从数据中学习时空模式,超越了以往方法的局限性。该公式不仅有更强的表达能力,而且有更强的泛化能力。早期使用骨架进行动作识别的方法简单地利用各个时间步的关节坐标形成特征向量,

halcon脚本-深度学习【语义分割】

本文讲解使用halcon的语义分割是使用步骤,标注工具不使用halcon提供的标注工具,而是使用各个深度学习框架都使用的labelMe工具,然后使用hde脚本以及python脚本转化为标准的halcon训练及文件本文涉及数据标注、数据转化、训练、评估、预测几个模块。

科技大势怎么看 2023怎么干?

展望 2023,多元技术的协同并进驱动计算与通信的融合、硬件和软件的融合,应用需求的爆发驱动 AI 技术与行业的融合,数字技术与产业生态的融合,企业、个人与政府在安全技术与管理上的融合。科技进步与产业应用双轮驱动的融合创新已成为不可逆转的宏大趋势。

Pytorch中的grid_sample算子功能解析

近期在一个模型从pytorch迁移到mindspore框架中遇到一个算子适配问题,pytorch中的grid_sample在mindspore中没有对应的算子,需要考虑自定义实现。查找pytorch官网发现grid_sample是一种特殊的采样算法。调用接口为:torch.nn.functional

深度学习之bottleneck layer

一、bottleneck layery中文名称:瓶颈层。我初次接触也就是在残差网络中。一般在较深的网络中,如resnet101中使用。一般的结构如下:其中两个1X1fliter分别用于降低和升高特征维度,主要目的是为了减少参数的数量,从而减少计算量,且在降维之后可以更加有效、直观地进行数据的训练和特

学习笔记:深度学习(2)——BP神经网络

梳理BP神经网络、MLP的理论基础和算法推导。