pytorch加载模型和模型推理常见操作

1.pth保存模型的说明

.pth文件可以保存模型的拓扑结构和参数，也可以只保存模型的参数，取决于model.save()中的参数。

torch.save(model.state_dict(),'mymodel.pth')# 只保存模型权重参数，不保存模型结构
torch.save(model,'mymodel.pth')# 保存整个model的状态#model为已经训练好的模型

使用方式1得到的.pth重构模型代码如下：

model = My_model(*args,**kwargs)
model.load_state_dict(torch.load('mymodel.pth'))
model.eval()

使用方式2得到的.pth重构模型代码如下：

model=torch.load('mymodel.pth')
model.eval()

2.pth文件load细节

以只保存模型参数的pth为例

epth_encoder = depth.ResnetEncoder(18,False)# 加载encoder模型
loaded_dict_enc = torch.load('depth/models/weights_19/encoder.pth')#数据类型：有序字典

loaded_dict_enc 的类型是：<class ‘odict_items’>（有序字典），本质还是python的字典类型，有键值对，其中键指的是每层网络结构的名字，数据类型是字符串型，值指的是每层网络结构的参数，数据类型是numpy张量。
运行下面这一行代码，可以更加细致的发现pth中含有的信息。

for k, v in loaded_dict_enc.items():print(k)print(v)

运行结果反映了，第一个键(key)为encoder.conv1.weight即表示encoder模型第一个卷积层的权重。对应的值(values)是下图的张量。这些参数张量都是pth文件中保存的，不会发生变化。
在这里插入图片描述

3.state_dict

state_dict是Python的字典对象，可用于保存模型参数、超参数以及优化器的状态信息。需要注意的是，只有具有可学习参数的层（如卷积层、线性层等）才有state_dict。
可以用state_dict非常细致的查看网络结构是否正确，能够清晰反映各层滤波器的大小。

for param_tensor in depth_encoder.state_dict():print(param_tensor,'\t', depth_encoder.state_dict()[param_tensor].size())

在这里插入图片描述

4.模型参数读入

filtered_dict_enc ={k: v for k, v in loaded_dict_enc.items()if k in depth_encoder.state_dict()}
depth_encoder.load_state_dict(filtered_dict_enc)

5.eval()

eval()是PyTorch中用来将神经网络设置为评估模式的方法。在评估模式下，网络的参数不会被更新，Dropout和Batch Normalization层的行为也会有所不同。通常在测试阶段使用评估模式。
eval() 可以作为模型推理的性能提升方法，在评估模式下，计算图是不被跟踪的，这样可以节省内存使用，提升性能。还可以使用torch.no_grad()配合使用，在评估阶段关闭梯度跟踪，进一步提升性能。

depth_encoder.eval()# 切换到评估模式,使得模型BN层等失效

6.模型推理

关闭梯度流跟踪和eval()共同提升模型推理性能。

encoder_input = torch.randn(1,3,256,256)with torch.no_grad():
     encoder_output = depth_encoder(encoder_input))

标签： pytorch python 深度学习

本文转载自: https://blog.csdn.net/qq_53383206/article/details/129392762
版权归原作者 一只程序猿林 所有，如有侵权，请联系我们删除。

pytorch加载模型和模型推理常见操作

1.pth保存模型的说明

2.pth文件load细节

3.state_dict

4.模型参数读入

5.eval()

6.模型推理

发表评论

“pytorch加载模型和模型推理常见操作”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航