过拟合解决

常见过拟合问题解决

深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。

Pytorch:手把手教你搭建简单的全连接网络

利用pytorch搭建简单全连接网络的步骤,适合初学者快速上手

使用pytorch实现LSTM自动AI作诗(藏头诗和首句续写)

数据来源于chinese-poetry,最全中文诗歌古典文集数据库最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗 人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。实验使用预处理过的二进制文件tang.npz作为数据集,含有575

深入浅出Pytorch函数——torch.tensor

torch.tensor(data, *, dtype=None, device=None, requires_grad=False, pin_memory=False)

低成本攒机跑深度学习AI

概述如何机子攒一台配置不错价格不高的深度学习丐版服务器

Transformer详解(李沐大神文字版,干货满满!)

使用图和文字记录下了李沐大神的Transformer论文逐段精度视频,方便大家后续快速复习。

[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

部署大模型LLaMA的过程中安装量化工具包bitsandbytes问题解决

(小伞每日论文速读)2023视觉领域的SOTA!InternImage究竟何方神圣?

计算机视觉领域的SOTA又又又被赣爆了!!!InternImage——基于可变形(抽样)卷积的领域内SOTA!(重振卷积荣光,消灭ViTs暴政!)

Segment Anything模型结构解读

论文地址代码下载官网关于Segment Anything的理解1.人工标注过程使用公开数据集训练,并且让人工标注团队进行标注预测的mask,该过程总共进行6次,并产生430万个mask2.半自动标注过程模型产生的置信度相对较高的mask,不需要人工标注,而置信度相对不高的mask,由人工完成标注。举

七款非常好用的 ChatGPT 开源插件

这是一个基于chatGPT实现的Github机器人,可以让chatGPT帮你审核代码、重构代码,还可以在Github页面上和它进行聊天,咨询问题。

LLaMA模型文件 (搬运工)

如果要使用huggingface transformer训练LLaMA,需要使用额外的转换脚本(具体详见huggingface官网。建议提前确认自己的huggingface版本。或者使用上述已经被转换好的。但是申请的审批时间一般都很长。才能获得官方模型权重。

PyTorch-Forecasting一个新的时间序列预测库

PyTorch- forecasting是一个建立在PyTorch之上的开源Python包

YOLOv8 Bug及解决方案汇总

m = getattr(torch.nn, m[3:]) if 'nn.' in m else globals()[m] # get module

常见AI模型参数量-以及算力需求评估

不同的算法模型对计算能力的要求不同,对于视频分析场景,通过业界主流ISV在该AI推理卡的测试结果来看,在每路视频的分辨率为不低于1080P,帧率不低于25帧,同屏检测目标数不低于5个的情况下,每路视频需要5.5T(INT8)的算力进行解析。参考业界流行的视频训练算法(表一、第四章),训练一个模型需要

深度学习中的训练和验证损失

深度学习是机器学习的一个分支,包括使用人工神经网络。特别是,深度学习算法允许计算机程序学习和发现大量数据中的模式。人工神经网络是受生物体中生物神经网络工作原理启发的算法。人工神经网络通常由相互连接的节点和权重组成。因此,输入信号首先通过称为神经元的节点传递。然后,这些神经元被一个函数激活并乘以权重以

2023年华中杯C题计算结果

经过一晚上代码的编写,论文的写作,C题完整版论文已经发布,注:蓝色字体为说明备注解释字体,不能出现在大家的论文里。黑色字体为论文部分,大家可以根据红色字体的注记进行摘抄。对应的详细的写作视频教程,争取1号晚上发布,空气质量预测与预。

Meta 开源语音 AI 模型支持 1,100 多种语言

本周一Meta 又开源了新的语音模型MMS,并且发布了支持1100种语言的预训练模型权重

ptuning v2 的 chatglm垂直领域训练记录

第二我要减小十倍的学习率,观察一下减小十倍的学习率能不能提升ptuning的效果。基于终端的交互,基于简单界面的交互,基于fastapi框架提供的接口进行交互。从中国大百科爬下来的数据,有一些标题的输入是比较短的。喜欢大模型的小伙伴可以加我的 15246115202 一起交流训练大模型所需要的细节都

DDPM代码详细解读(1):数据集准备、超参数设置、loss设计、关键参数计算

DDPM代码详细解读(1):数据集准备、超参数设置、loss设计、关键参数计算