PyTorch深度学习实战(1)——神经网络与模型训练过程详解

在本节中,我们将了解传统机器学习与人工神经网络间的差异,并了解如何在实现前向传播之前连接网络的各个层,以计算与网络当前权重对应的损失值;实现反向传播以优化权重达到最小化损失值的目标。并将实现网络的所有关键组成——前向传播、激活函数、损失函数、链式法则和梯度下降,从零开始构建并训练了一个简单的神经网络

Segment anything(SAM)论文及demo使用保姆级教程

解读segment anything(SAM)论文并提供SAM模型demo的保姆级使用教程

【AI】AI 工具合集

ai 工具集合, 包括 AI文本、AI 视频、AI 音频、AI 绘画

基于深度强化学习的目标驱动型视觉导航泛化模型

  目标是仅使用视觉输入就能导航并到达用户指定目标的机器人,对于此类问题的解决办法一般有两种。基于地图的导航算法或者SLAM系统与最先进的物体检测或图像识别模型的局限性深度卷积神经网络(cnn)与强化学习(RL)相结合的方法优势  深度强化学习(DRL)确实允许以自然的方式管理视觉和运动之间的关系,

YOLOv8:车辆检测技术及优化

随着自动驾驶汽车和智能交通系统的发展,车辆检测技术在近年来变得越来越重要。为了解决这一问题,YOLO (You Only Look Once) 是一种实时目标检测算法,自从2016年推出以来,它已经经历了多个版本的更新。本文将详细介绍YOLOv8,这是一个最新的、高效的车辆检测方法,并附有Pytho

过拟合解决

常见过拟合问题解决

深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。

Pytorch:手把手教你搭建简单的全连接网络

利用pytorch搭建简单全连接网络的步骤,适合初学者快速上手

使用pytorch实现LSTM自动AI作诗(藏头诗和首句续写)

数据来源于chinese-poetry,最全中文诗歌古典文集数据库最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗 人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。实验使用预处理过的二进制文件tang.npz作为数据集,含有575

深入浅出Pytorch函数——torch.tensor

torch.tensor(data, *, dtype=None, device=None, requires_grad=False, pin_memory=False)

低成本攒机跑深度学习AI

概述如何机子攒一台配置不错价格不高的深度学习丐版服务器

Transformer详解(李沐大神文字版,干货满满!)

使用图和文字记录下了李沐大神的Transformer论文逐段精度视频,方便大家后续快速复习。

[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

部署大模型LLaMA的过程中安装量化工具包bitsandbytes问题解决

(小伞每日论文速读)2023视觉领域的SOTA!InternImage究竟何方神圣?

计算机视觉领域的SOTA又又又被赣爆了!!!InternImage——基于可变形(抽样)卷积的领域内SOTA!(重振卷积荣光,消灭ViTs暴政!)

Segment Anything模型结构解读

论文地址代码下载官网关于Segment Anything的理解1.人工标注过程使用公开数据集训练,并且让人工标注团队进行标注预测的mask,该过程总共进行6次,并产生430万个mask2.半自动标注过程模型产生的置信度相对较高的mask,不需要人工标注,而置信度相对不高的mask,由人工完成标注。举

七款非常好用的 ChatGPT 开源插件

这是一个基于chatGPT实现的Github机器人,可以让chatGPT帮你审核代码、重构代码,还可以在Github页面上和它进行聊天,咨询问题。

LLaMA模型文件 (搬运工)

如果要使用huggingface transformer训练LLaMA,需要使用额外的转换脚本(具体详见huggingface官网。建议提前确认自己的huggingface版本。或者使用上述已经被转换好的。但是申请的审批时间一般都很长。才能获得官方模型权重。

PyTorch-Forecasting一个新的时间序列预测库

PyTorch- forecasting是一个建立在PyTorch之上的开源Python包

YOLOv8 Bug及解决方案汇总

m = getattr(torch.nn, m[3:]) if 'nn.' in m else globals()[m] # get module

常见AI模型参数量-以及算力需求评估

不同的算法模型对计算能力的要求不同,对于视频分析场景,通过业界主流ISV在该AI推理卡的测试结果来看,在每路视频的分辨率为不低于1080P,帧率不低于25帧,同屏检测目标数不低于5个的情况下,每路视频需要5.5T(INT8)的算力进行解析。参考业界流行的视频训练算法(表一、第四章),训练一个模型需要