本文重点讨论逆强化学习(Inverse Reinforcement Learning, IRL),这是模仿学习的重要分支,其核心目标是基于演示数据学习能够最大化期望奖励的最优策略。
资讯同步
文章同步
公众号:deephub-imba
公众号:奕凯的技术栈