2023年的深度学习入门指南(6) - 在你的电脑上运行大模型
上一篇我们介绍了大模型的基础,自注意力机制以及其实现Transformer模块。因为Transformer被PyTorch和TensorFlow等框架所支持,所以我们只要能够配置好框架的GPU或者其他加速硬件的支持,就可以运行起来了。而想运行大模型,恐怕就没有这么容易了,很有可能你需要一台Linux
Stable Diffusion web UI 部署详细教程
本文使用 AutoDL 平台进行 Stable Diffusion web UI 云端部署AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL。
模型量化(6):Yolov5 QAT量化训练
从模型量化(5): 敏感层分析可以看出来,对于yolov5-nano模型,对最后一层detect层进行敏感层分析的时候,发现对检测精度的影响比较大。所以在PTQ/QAT在进行量化时,会跳过这些敏感层。QAT微调的模型,就是PTQ在校准后的模型。从上一小节可以看出如果PTQ中模型训练和量化是分开的,而
windows cuda更新教程
windows cuda更新、安装教程
深度学习总结——用自己的数据集微调CLIP
在自己的数据集上微调CLIP模型
安装mmcv-full适配torch版本
比如我的cuda版本是10.1,torch版本是1.8.0,mmcv-full安装命令如下。
ByteTracker行人跟踪核心代码解读
byteTracker中因为目标检测和行人跟踪是解耦的,因此这里主要分析的是byteTracker中的代码。也即是分析当给定一帧图片frame_id,给定这帧中的box列表,行人跟踪类是怎么跟踪每条轨迹的。也就是https://github.com/ifzhang/ByteTrack中位于目录tut
查看cudnn&cuda的版本以及对应的tensorflow版本
查看cudnn&cuda的版本以及对应的tensorflow版本
torch安装找不到版本报错
torch安装找不到版本报错的4种解决办法,可按顺序来
PyTorch 模型性能分析和优化 - 第 2 部分
请注意,这些结论基于我们在本文中分享的示例,可能不适用于您自己的用例。事实上,我们在 CPU 上执行的断言调用需要访问驻留在 GPU 上的目标张量,从而调用效率极低的数据复制。如果没有对应用程序的行为进行深入分析,我们可能永远不会知道有什么问题,并且会继续我们的生活,同时支付比我们需要的多 41 倍
【动手学深度学习】--18.图像增广
动手学深度学习笔记
理解图傅里叶变换和图卷积
图神经网络(GNN)代表了一类强大的深度神经网络架构。本文将介绍图卷积的理论基础。深入研究图傅立叶变换的复杂性及其与图卷积的联系
扩散模型原理+DDPM案例代码解析
扩散模型 DDPM 代码实现 从数学公式到代码一步步理解
pytorch分布式训练报错RuntimeError: Socket Timeout
pytorch分布式训练中出现socket timeout情况
通过git clone批量下载huggingface模型和数据集
想要下载huggingface的模型,却发现只能一个个文件下载非常不方便,又或者官方提供的api不好用或者下载不下来,这里提供一个通过git clone一次性下载整个数据集/模型下来的高效方法。
微调llama2模型教程:创建自己的Python代码生成器
本文将演示如何使用PEFT、QLoRa和Huggingface对新的lama-2进行微调,生成自己的代码生成器。所以本文将重点展示如何定制自己的llama2,进行快速训练,以完成特定任务。
[系统安全] 五十一.恶意家族分类 (2)基于API序列和深度学习的恶意家族分类实例详解
系统安全将更好地帮助初学者了解病毒逆向分析和系统安全。前文详细介绍如何学习提取的API序列特征,并构建机器学习算法实现恶意家族分类,这也是安全领域典型的任务或工作。这篇文章将讲解如何构建深度学习模型实现恶意软件家族分类,常见模型包括CNN、BiLSTM、BiGRU,结合注意力机制的CNN+BiLST
【域泛化综述-2022 TPAMI】Domain Generalization: A Survey
2022TPAMI 域泛化综述阅读
ClearML入门:简化机器学习解决方案的开发和管理
ClearML 是一个开源平台(之前叫TRAINS),可为全球数千个数据科学团队自动化并简化机器学习解决方案的开发和管理。它被设计为端到端的MLOps套件,允许您专注于开发ML代码和自动化,而ClearML确保您的工作可重复和可扩展。仅用 2 行代码跟踪和上传指标和模型创建一个机器人,每当模型的准确
yolov8之导出onnx(二)
yolov8之导出onnx