0


强化学习模型评估:Reward与Regret

强化学习模型评估:Reward与Regret

作者:禅与计算机程序设计艺术

1. 背景介绍

1.1 强化学习的兴起

1.2 模型评估的重要性

1.3 Reward与Regret的提出

2. 核心概念与联系

2.1 强化学习中的Reward

2.1.1 Reward的定义
2.1.2 Reward的作用
2.1.3 Reward的设计原则

2.2 强化学习中的Regret

2.2.1 Regret的定义
2.2.2 Regret的计算方法
2.2.3 Regret与Reward的关系

2.3 Reward与Regret在模型评估中的意义

2.3.1 评估模型的收敛性

本文转载自: https://blog.csdn.net/universsky2015/article/details/140940122
版权归原作者 光剑书架上的书 所有, 如有侵权,请联系我们删除。

“强化学习模型评估:Reward与Regret”的评论:

还没有评论