overfit同步小助手

2023-07-15 19:02:12

七、训练模型，CPU经常100%，但是GPU使用率才5%左右

现象：
在这里插入图片描述
大概原因：GPU运算完毕后，花费了大量时间在写日志和存储pth文件，所以GPU使用率一直过低，CPU使用率一直很高。

具体原因分析参见【深度学习】踩坑日记：模型训练速度过慢，GPU利用率低

这里直接上解决办法：

减少日志IO操作频率
使用pin_memory和num_workers（num_workers调整不合适，会显示内存不够之类的问题，根据实际情况调整）
使用半精度训练
更好的显卡，更轻的模型
增大batch size提高epoch速度，但是收敛速度也会变慢，需要再适当升高学习率

本文解决办法：这里我采用的是调整batch_size，由8调成10（本来想调成16，结果显示GPU内存不够，只能调到10）：
在这里插入图片描述

标签：深度学习人工智能机器学习

本文转载自: https://blog.csdn.net/panchang199266/article/details/129681692
版权归原作者 咸鱼最牛逼 所有，如有侵权，请联系我们删除。

发表评论

登录后发布评论

“七、训练模型，CPU经常100%，但是GPU使用率才5%左右”的评论:

还没有评论

关于作者

overfit同步小助手

文章同步

相关阅读

网络安全法-网络运行安全

使用selenium/drissionpage时如何阻止chrome自动跳转http到https

docker desktop 里部署的Open WebUI 管理员密码忘记了的处理方法

在ubuntu20.04中搭建onsite比赛运行环境

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

Kafka学习笔记

【前端】浏览器输入url到页面呈现发生了什么？

文章导航