yolo v7 转rknn

yolo v7 转rknn

文本检测之DBNet,DBNet++

一个负责预测概率图(probability map,(w/4)*(h/4)*1),代销为,另一个负责预测阈值图(threshold map,(w/4)*(h/4)*1)。概率图经过阈值图处理,进行二值化后得到二值图(approximate binary map,(w/4)*(h/4)*1)。然后计算

【NLP学习计划】万字吃透NER

NLP系列学习计划,今天研究的是顶会ACL2018的一篇文章,并尝试在相同数据集上自己实现模型,领会STOA的魅力!

Pytorch模型量化

在深度学习中,量化指的是使用更少的bit来存储原本以浮点数存储的tensor,以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点:更少的模型体积,接近4倍的减少;可以更快的计算,由于更少的内存访问和更快的int8计算,可以快2~4倍。一个量化后的模型,其部分或者全部的ten

从DDPM到DDIM:深入解读《Denoising Diffusion Implicit Models》

DDIM发表在ICRL2021上,是DDPM重要的改进之一,能显著提高DDPM的样本质量、减少采样时间,并且能显式控制插值,已经被广泛应用到现在的Diffusion Models上。这篇博客和大家一起详细解读一下DDIM,认识这一伟大的模型。.........

深度学习实战 1 YOLOv5结合BiFPN

BiFPN简单介绍,YOLOv5结合BiFPN (concat操作)

深入理解TDNN(Time Delay Neural Network)——兼谈x-vector网络结构

TDNN(Time Delay Neural Network,时延神经网络)是用于处理序列数据的,比如:一段语音、一段文本将TDNN和统计池化(Statistics Pooling)结合起来,正如x-vector的网络结构,可以处理任意长度的序列TDNN出自x-vector出自。

LabelImg标注的YOLO格式txt标签中心坐标和物体边界框长宽的转换

LabelImg标注的YOLO格式txt标签中心坐标和物体边界框长宽的转换

intel的集成显卡(intel(r) uhd graphics) 配置stable diffusion

intel的集成显卡(intel(r) uhd graphics) 配置stable diffusion

paddleocr模型训练

paddleocr的det和rec模型训练

关于跳跃连接 卷积网络

关于跳跃连接 卷积网络

temporal shift module(TSM)

而online模式用于对视频类型的实时预测,在这种情况下,无法预知下一秒的图像,因此只能将channel维度由过去向现在移动,而不能从未来向现在移动。视频中核心是视频动作识别,本质就是视频分类,可以用作特征提取,视频时序提取是输入一段长视频获取其中的时序片段,时空定位是同时获取视频中的人物物体的空间

神经辐射场 3D 重建——NeRF

本文是阅读 ECCV2020 论文 NeRF 后所做的笔记。文章首先对论文中 5D 坐标的理解做出相关图示,然后对“世界-相机-图像”三种坐标系的转换以及常见图像质量评估指标进行简单阐述,接着对 NeRF 的网络结构进行详细解释(包括网络主体流程、体渲染、位置编码、多层级采样、损失函数),最后通过训

五、CNN-LSTM数据驱动模型

CNN-LSTM数据驱动模型6.1 基本原理深度学习是机器学习前沿且热门的理论,而其中的两大框架卷积神经网络(CNN)以及长短期记忆网络(LSTM)是深度学习的代表,CNN能过够通过使用卷积核从样本数据中提取出其潜在的特征,而长短期记忆网络LSTM能够捕捉到长期的成分。近年来两者的结合成为研究的热点

YOLOv8 目标检测 | 自定义数据集

本文介绍了使用用于目标检测的自定义数据训练 YOLOv8 模型。我正在使用来自 kaggle 的 yolo 格式的“Face Mask Dataset”,数据集链接如下:https://www.kaggle.com/datasets/maalialharbi/face-mask-dataset?re

读pytroch使用resnet18网络的代码

读读pytorch中调用resnet18的代码

bert 的输出格式详解

输出是一个元组类型的数据 ,包含四部分,last hidden stateshape是(batch_size, sequence_length, hidden_size),hidden_size=768,它是模型最后一层输出的隐藏状态pooler_output:shape是(batch_size,

Centernet 生成高斯热图

最近学校阳了,宿舍给封了,宿舍网络不好远程跑不了实验,随缘写一下对CenterNet源码的一个解读,之前写论文的那段时间留下来的工作,respect!这个文章主要是对CenterNet中生成高斯核的部分代码进行解析,具体原理不会细讲,但是本文增加了一个很方便理解的可视化的代码,可以自己拿来跑就行,自

Ubuntu22.04 下安装驱动、CUDA、cudnn以及TensorRT

Ubuntu22.04 下安装 Anaconda3 + python3.10 + cuda11.7 + cudnn8.4.1.5+ opencv4.5.3

Paper Reading - 综述系列 - Hyper-Parameter Optimization(上)

自开发深度神经网络以来,几乎在日常生活的每个方面都给人类提供了比较理性的建议。但是,尽管取得了这一成就,神经网络的设计和训练仍然是具有很大挑战性和不可解释性,同时众多的超参数也着实让人头痛,因此被认为是在炼丹。因此为了降低普通用户的技术门槛,自动超参数优化(HPO)已成为学术界和工业领域的热门话题。