BIT 变化检测模型复现 深度学习学习笔记 基于transformer结构的图像处理模型
transformer结构在遥感图像处理和计算机视觉当中展现出优势,BIT网络利用了transformer结构,这里是变化检测模型BIT复现过程,手把手教GitHub源码复现。包括数据结构解析、修改及环境配置,训练、预测过程报错及debug修改。利用pycharm进行代码debug。
AI时代,程序员需要焦虑吗?
ChatGPT 横空出世后,“AI 即将取代程序员” 的观点一度引发热议,至今尚未完全冷却。ChatGPT 是一种基于人工智能技术的对话生成系统,其受欢迎的程度在一定程度上说明了人们对于人工智能技术的兴趣和追求。但是,从目前的实际情况来看,人工智能技术还没有达到完全替代程序员的程度。首先,AI 技术
Fooocus:一个简单且功能强大的Stable Diffusion webUI
在这篇文章中,我们将介绍如何在本地和Colab上使用Fooocus
医学图像分割综述:U-Net系列
论文地址代码地址医学图像自动分割是医学领域的一个重要课题,也是计算机辅助诊断范式的一个重要对应。U-Net是最广泛的图像分割架构,由于其灵活性,优化的模块化设计,并在所有医学图像模式的成功。多年来,U-Net模型得到了学术界和工业界研究人员的极大关注。该网络的几个扩展已经被提出,以解决医疗任务所产生
利用Google Colab免费使用GPU服务器详细攻略
前言Google Colab是一个基于云端的免费Jupyter笔记本环境,可供用户创建、分享、运行Python代码和机器学习模型。
Dynamic ReLU:根据输入动态确定的ReLU
这是我最近才看到的一篇论文,它提出了动态ReLU (Dynamic ReLU, DY-ReLU),可以将全局上下文编码为超函数,并相应地调整分段线性激活函数
使用DiffusionDet训练自己的数据集(pascal-voc)
此贴建立在DiffusionDet和detectron2环境已经配置好(能跑通DiffusionDet的demo.py就行),之后再出这个手顺我没有跟着官方手顺建立软链接什么的,比较麻烦,我直接按照自己的习惯建的目录。
2023年的深度学习入门指南(6) - 在你的电脑上运行大模型
上一篇我们介绍了大模型的基础,自注意力机制以及其实现Transformer模块。因为Transformer被PyTorch和TensorFlow等框架所支持,所以我们只要能够配置好框架的GPU或者其他加速硬件的支持,就可以运行起来了。而想运行大模型,恐怕就没有这么容易了,很有可能你需要一台Linux
模型量化(6):Yolov5 QAT量化训练
从模型量化(5): 敏感层分析可以看出来,对于yolov5-nano模型,对最后一层detect层进行敏感层分析的时候,发现对检测精度的影响比较大。所以在PTQ/QAT在进行量化时,会跳过这些敏感层。QAT微调的模型,就是PTQ在校准后的模型。从上一小节可以看出如果PTQ中模型训练和量化是分开的,而
深度学习总结——用自己的数据集微调CLIP
在自己的数据集上微调CLIP模型
安装mmcv-full适配torch版本
比如我的cuda版本是10.1,torch版本是1.8.0,mmcv-full安装命令如下。
ByteTracker行人跟踪核心代码解读
byteTracker中因为目标检测和行人跟踪是解耦的,因此这里主要分析的是byteTracker中的代码。也即是分析当给定一帧图片frame_id,给定这帧中的box列表,行人跟踪类是怎么跟踪每条轨迹的。也就是https://github.com/ifzhang/ByteTrack中位于目录tut
查看cudnn&cuda的版本以及对应的tensorflow版本
查看cudnn&cuda的版本以及对应的tensorflow版本
torch安装找不到版本报错
torch安装找不到版本报错的4种解决办法,可按顺序来
理解图傅里叶变换和图卷积
图神经网络(GNN)代表了一类强大的深度神经网络架构。本文将介绍图卷积的理论基础。深入研究图傅立叶变换的复杂性及其与图卷积的联系
扩散模型原理+DDPM案例代码解析
扩散模型 DDPM 代码实现 从数学公式到代码一步步理解
pytorch分布式训练报错RuntimeError: Socket Timeout
pytorch分布式训练中出现socket timeout情况
微调llama2模型教程:创建自己的Python代码生成器
本文将演示如何使用PEFT、QLoRa和Huggingface对新的lama-2进行微调,生成自己的代码生成器。所以本文将重点展示如何定制自己的llama2,进行快速训练,以完成特定任务。
【域泛化综述-2022 TPAMI】Domain Generalization: A Survey
2022TPAMI 域泛化综述阅读
ClearML入门:简化机器学习解决方案的开发和管理
ClearML 是一个开源平台(之前叫TRAINS),可为全球数千个数据科学团队自动化并简化机器学习解决方案的开发和管理。它被设计为端到端的MLOps套件,允许您专注于开发ML代码和自动化,而ClearML确保您的工作可重复和可扩展。仅用 2 行代码跟踪和上传指标和模型创建一个机器人,每当模型的准确